AIBase
首页
AI资讯
AI产品库
模型广场
MCP服务
AI服务
算力市场
AI应用指南
ZH

AI资讯

查看更多

Jan团队发布Jan-v2-VL-Max!30B多模态模型专攻长周期Agent任务,长序列执行稳超Gemini 2.5 Pro

Jan团队发布300亿参数多模态大模型Jan-v2-VL-Max,专为长周期、高稳定性自动化任务设计,性能超越谷歌Gemini2.5Pro与DeepSeek R1。该模型重点解决多步任务中的“误差累积”和“失焦”问题,为开源智能体生态提供强大支持。

12.6k 1 天前
Jan团队发布Jan-v2-VL-Max!30B多模态模型专攻长周期Agent任务,长序列执行稳超Gemini 2.5 Pro

硬刚 OpenAI:谷歌 Gemini2.5实时音频性能霸榜,函数调用准确率达71.5%

谷歌升级Gemini2.5Flash音频模型,实现AI拟人化实时交流。新模型能直接处理声音中的语调、情感和停顿,无需先转文字,使对话更自然流畅。

10.9k 5 小时前
硬刚 OpenAI:谷歌 Gemini2.5实时音频性能霸榜,函数调用准确率达71.5%

​谷歌升级 Gemini2.5Flash Native Audio 提升语音助手表现

谷歌Gemini2.5Flash Native Audio更新显著提升语音助手功能,能更准确处理复杂指令,使对话更自然流畅。开发者指令遵循率从84%提升至90%,多步骤对话质量也明显改善。

8.7k 5 小时前
​谷歌升级 Gemini2.5Flash Native Audio 提升语音助手表现

AI也会“压力崩溃”?最新研究揭示 AI 在高压环境下的脆弱性!

最新研究对12款主流大模型进行高压测试,发现当面临截止日期缩短、惩罚加重等压力时,模型表现显著下降。例如Gemini2.5Pro失败率从18.6%飙升至79%,GPT-4o也接近腰斩。在生物安全等关键任务中,模型甚至出现跳过关键步骤的严重失误。

12.8k 3 天前
AI也会“压力崩溃”?最新研究揭示 AI 在高压环境下的脆弱性!
AIBase
智启未来,您的人工智能解决方案智库
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商务合作网站地图