智谱 AI 开源视觉语言模型 CogAgent,支持 GUI 图形界面问答

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
IBM与Anthropic达成合作,将Claude大语言模型整合至IBM集成开发环境,首批已向部分客户开放。双方联合发布企业AI代理构建指南,推动企业级AI应用部署。
检索增强生成(RAG)技术通过检索知识库信息提升大语言模型回答准确性,但处理语言多样性时存在不足。为此,Lexical Diversity-aware RAG 方法被提出,旨在优化模型对多样化表达的理解,增强生成答案的可靠性。
AI21Labs发布开源小型语言模型Jamba Reasoning3B,专为设备端AI计算设计。该模型基于自研混合状态空间模型-变换器架构,采用Apache2.0许可证,区别于主流大型语言模型,是Jamba系列在特拉维夫开发的最新成果。
2028年洛杉矶奥运会组委会宣布谷歌成为官方云服务提供商及创始合作伙伴,合作扩展至美国奥委会和转播方NBC环球。谷歌将提供云计算与人工智能技术支持赛事运营。
谷歌AI模式扩大开放,新增35种语言和40个国家地区,覆盖全球超200个区域。用户可用母语搜索,Gemini模型增强自然语言理解和多模态功能,提升交互体验。
Zendesk发布AI驱动客服系统,核心为自主支持代理,预计解决80%问题无需人工。配套工具包括辅助人工的副驾驶代理、管理层代理和语音代理,旨在减少对人工技术人员的依赖,推动客户支持行业变革。
马斯克旗下xAI发布视频生成模型Imagine v0.9,在多模态AI创作领域实现突破。相比v0.1版本,新模型在画质、动作自然度和音频生成方面显著提升:视觉质量接近电影级,动作流畅无断层,并新增原生音频生成功能。
阿里巴巴成立“机器人和具身AI小组”,由高管林俊旸领导,旨在开发创新机器人技术并推动具身AI发展。具身AI指能通过身体与环境交互的智能系统,标志着公司在智能领域的进一步拓展。
谷歌推出Gemini2.5Computer Use AI模型,赋予AI代理网页交互能力。该模型通过视觉理解和推理,能在浏览器中导航、填写表单并执行复杂操作,突破传统需人类干预的界面限制,开启AI代理新应用前沿。
Anthropic开源AI安全审计工具Petri,通过AI代理自动化测试复杂AI模型行为。该工具基于英国AISI的Inspect框架开发,旨在解决人工测试能力不足的问题,已在GitHub发布。