Nomic AI发布开源嵌入模型 Nomic Embed,击败 OpenAI 的 Ada-002

机器之心
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
Lightricks发布开源视频生成模型LTX-Video13B,采用130亿参数和多尺度渲染技术,实现30倍于同类模型的生成速度。该模型在消费级GPU上流畅运行,支持1216×704分辨率实时生成,提供文本/图像/视频到视频的多种创作模式。其创新技术显著提升视频连贯性和细节表现,支持关键帧控制、风格替换等精细操作。作为开源项目,模型配套提供训练工具和优化版本,对中小企业免费开放,推动AI视频创作民主化。
Lightricks开源AI视频模型LTX-Video迎来重大升级,支持60秒长视频生成,打破行业8秒限制。该模型采用自回归流式架构,实现从图像到高清视频(最高1216x704分辨率)的实时生成,首秒内容瞬时呈现。新增动态场景控制功能,允许实时调整姿势、深度等元素,支持多种生成模式。130亿参数模型在消费级GPU(最低8GB显存)上高效运行,60秒视频仅需数秒生成。作为开源项目,其代码和权重已免费发布,但商业用途受限。此次升级为创作者提供了长篇叙事能力,未来将在LTX Studio推出商业版本。
字节跳动视觉大模型团队负责人杨建朝因家庭因素宣布暂时休息,由前阿里通义千问技术负责人周畅接任。此次人事变动正值字节AI部门调整期,引发外界对技术路线稳定性的关注。杨建朝的工作资料仍保留在内部系统,周畅将带领分布全球的Seed团队继续视觉多模态生成等研究。公司强调将持续投入基础研究,期待新负责人带来创新活力。这一变动凸显了科技行业在快速发展中平衡工作与健康的重要性。
NVIDIA发布突破性混合模型Canary-Qwen-2.5B,以5.63%词错率创Hugging Face OpenASR纪录。该模型采用CC-BY许可,支持商业应用,统一语音识别与语言处理功能。核心创新在于FastConformer编码器与Qwen3-1.7B LLM解码器的混合架构,仅25亿参数却实现高效处理。支持多种NVIDIA GPU硬件,适用于云推理和边缘计算。开源特性促进语音AI发展,为企业提供转录服务、知识提取等商业应用场景,推动下一代语音AI发展。
朗新科技在链博会发布"朗新九功AI能源大模型",该模型具备两大核心技术:时序预测引擎基于千亿级预训练数据,电力价格预测准确率超90%,可应对冷启动环境;AI智能体引擎支持动态数据融合和秒级响应,能7×24小时自动监控电力市场并生成对冲策略。目前已在广东、山东、浙江等电力现货市场应用,推动电力交易智能化发展,为能源管理提供科学决策支持。
全球首款AI实时视频转换模型MirageLSD发布,实现40毫秒超低延迟处理。该模型由Decart AI团队研发,支持24帧/秒实时转换任意视频流,突破传统视频生成技术瓶颈。通过手势控制等简单交互,用户可实时改变视频场景、服装等元素,大幅降低创作门槛。应用场景涵盖游戏开发(30分钟快速构建游戏)、直播、动画制作等领域,其核心技术LSD模型采用Diffusion Forcing技术,解决长时间生成的误差累积问题。目前该模型已开放试用,将推动AI与内容创作的深度融合。
AI编码工具Windsurf宣布重新上线Anthropic的Claude Sonnet4模型,为Pro用户提供每月250次调用权限(2倍信用消耗)。该模型以72.7%的SWE-bench测试表现著称,支持200K token上下文窗口,能实现代码生成、复杂重构等功能。此前因Anthropic限制直接访问,Windsurf曾推出BYOK方案应对。此次恢复合作被视为市场竞争下的重要突破,但2倍计费模式可能增加用户成本。未来平台或将进一步优化模型集成与定价策略。
谷歌DeepMind推出创新架构Mixture-of-Recursions(MoR),通过动态token级路由和递归深度分配,在保持参数高效的同时提升模型性能。该架构采用选择性缓存机制降低内存压力,实验显示其以更少参数超越传统Transformer,在360M规模以上表现尤为突出。MoR通过计算资源优化,为大规模语言模型部署提供高效解决方案,成为AI领域的重要突破。
OpenMed项目在Hugging Face平台发布380+个免费医疗NER模型(Apache2.0许可),打破医疗AI技术壁垒。这些109M-568M参数的模型性能媲美付费产品,已集成至主流AI生态系统。项目响应全球医疗资源短缺挑战,支持开发者自由使用和修改,此前其API曾5天内完成新冠筛查。团队计划持续扩展模型库,推动开源医疗AI发展,应对老龄化社会医疗需求。
【140字概括】开发者drfccv推出开源火车票查询系统12306MCP Server,基于MCP标准构建,支持余票、列车、车站及中转等实时查询。采用FastAPI架构实现秒级响应,通过Streamable HTTP协议高效传输数据,内置智能时间工具提升查询准确率。系统提供完整API文档,支持Docker部署,但强调仅供学习研究,禁止商用且不存储官方12306数据。项目已开源发布。