维基百科+大模型打败幻觉!斯坦福WikiChat性能领先GPT-4

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
Lightricks开源AI视频模型LTX-Video迎来重大升级,支持60秒长视频生成,打破行业8秒限制。该模型采用自回归流式架构,实现从图像到高清视频(最高1216x704分辨率)的实时生成,首秒内容瞬时呈现。新增动态场景控制功能,允许实时调整姿势、深度等元素,支持多种生成模式。130亿参数模型在消费级GPU(最低8GB显存)上高效运行,60秒视频仅需数秒生成。作为开源项目,其代码和权重已免费发布,但商业用途受限。此次升级为创作者提供了长篇叙事能力,未来将在LTX Studio推出商业版本。
7月18日,小度全面上线首个支持与物理世界交互的MCP Server,率先完成终端设备与核心IoT能力的MCP化升级,为AI应用开发带来全新变革,引领行业迈向“万物智能互联”新时代。 此次小度开放平台创新推出两大核心服务。一是小度音箱MCP Server,开发者可通过文本指令实现设备控制、语音播报及远程看护;二是小度IoT MCP Server,开放了全屋设备控制、状态查询和场景联动能力,开发者仅需简单配置,就能用自然语言操控1800余家生态厂商的智能设备,大幅降低了开发门槛。
字节跳动视觉大模型团队负责人杨建朝因家庭因素宣布暂时休息,由前阿里通义千问技术负责人周畅接任。此次人事变动正值字节AI部门调整期,引发外界对技术路线稳定性的关注。杨建朝的工作资料仍保留在内部系统,周畅将带领分布全球的Seed团队继续视觉多模态生成等研究。公司强调将持续投入基础研究,期待新负责人带来创新活力。这一变动凸显了科技行业在快速发展中平衡工作与健康的重要性。
NVIDIA发布突破性混合模型Canary-Qwen-2.5B,以5.63%词错率创Hugging Face OpenASR纪录。该模型采用CC-BY许可,支持商业应用,统一语音识别与语言处理功能。核心创新在于FastConformer编码器与Qwen3-1.7B LLM解码器的混合架构,仅25亿参数却实现高效处理。支持多种NVIDIA GPU硬件,适用于云推理和边缘计算。开源特性促进语音AI发展,为企业提供转录服务、知识提取等商业应用场景,推动下一代语音AI发展。
朗新科技在链博会发布"朗新九功AI能源大模型",该模型具备两大核心技术:时序预测引擎基于千亿级预训练数据,电力价格预测准确率超90%,可应对冷启动环境;AI智能体引擎支持动态数据融合和秒级响应,能7×24小时自动监控电力市场并生成对冲策略。目前已在广东、山东、浙江等电力现货市场应用,推动电力交易智能化发展,为能源管理提供科学决策支持。
全球首款AI实时视频转换模型MirageLSD发布,实现40毫秒超低延迟处理。该模型由Decart AI团队研发,支持24帧/秒实时转换任意视频流,突破传统视频生成技术瓶颈。通过手势控制等简单交互,用户可实时改变视频场景、服装等元素,大幅降低创作门槛。应用场景涵盖游戏开发(30分钟快速构建游戏)、直播、动画制作等领域,其核心技术LSD模型采用Diffusion Forcing技术,解决长时间生成的误差累积问题。目前该模型已开放试用,将推动AI与内容创作的深度融合。
【AI日报】今日热点速览:1.百度推出无广告智能搜索助手Tizzy.ai,提供影视资源聚合和深度思考功能;2.12306开源火车票查询引擎上线,支持实时余票和智能时间输入;3.ChatGPT录音模式向Plus用户开放,支持语音交互和内容总结;4.开源SaaS模板FireGEO助力开发者5分钟快速搭建Web应用;5.ReadMeX免费生成GitHub文档工具发布;6.百度AI助手新增视频通话功能;7.Jackywine推出可成长AI数字伴侣"贝拉";8.OpenAI将推出Agent Mode实现智能报告生成;9.MidJourney计划开放企业级API;10.MiniMax推出自然语言生成电商网站功能;11.Windsurf重新上线Claude Sonnet4模型。
AI编码工具Windsurf宣布重新上线Anthropic的Claude Sonnet4模型,为Pro用户提供每月250次调用权限(2倍信用消耗)。该模型以72.7%的SWE-bench测试表现著称,支持200K token上下文窗口,能实现代码生成、复杂重构等功能。此前因Anthropic限制直接访问,Windsurf曾推出BYOK方案应对。此次恢复合作被视为市场竞争下的重要突破,但2倍计费模式可能增加用户成本。未来平台或将进一步优化模型集成与定价策略。
谷歌DeepMind推出创新架构Mixture-of-Recursions(MoR),通过动态token级路由和递归深度分配,在保持参数高效的同时提升模型性能。该架构采用选择性缓存机制降低内存压力,实验显示其以更少参数超越传统Transformer,在360M规模以上表现尤为突出。MoR通过计算资源优化,为大规模语言模型部署提供高效解决方案,成为AI领域的重要突破。
OpenMed项目在Hugging Face平台发布380+个免费医疗NER模型(Apache2.0许可),打破医疗AI技术壁垒。这些109M-568M参数的模型性能媲美付费产品,已集成至主流AI生态系统。项目响应全球医疗资源短缺挑战,支持开发者自由使用和修改,此前其API曾5天内完成新冠筛查。团队计划持续扩展模型库,推动开源医疗AI发展,应对老龄化社会医疗需求。