小米发布大语言模型 MiLM-6B 参数规模 64 亿

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
Exa与OpenRouter宣布达成合作,为超过400种大语言模型(LLMs)提供实时网络搜索功能。这一突破性进展将显著提升AI模型的实用性和信息获取能力,为开发者、研究人员以及普通用户带来全新的交互体验。以下是AIbase对这一合作的深度解读与分析。Exa与OpenRouter强强联合,开启AI搜索新时代Exa是一家专注于利用大语言模型技术优化网络搜索的初创公司,其目标是通过精准、高效的搜索结果,将网络的庞杂信息转化为结构化、可用的数据。而OpenRouter作为统一的AI模型接口平台,支持开发者通过单一
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、小米将多枚“Kimi” 商标转让给月之暗面小米将“Kimi”商标转让给专注于AI助手的月之暗面,此举可能是小米优化资源的战略调整,同时助力月之暗面拓展其智能助手业务。【AiBase提要:】🌟 小米将多枚‘Kimi’商标转让给北京月之暗面科技有限公司,优化非核心商标资源。🤖 月之暗面推出的
近日,小米科技有限责任公司将多枚 “Kimi” 商标转让给北京月之暗面科技有限公司。这一商标最早于2013年申请,目前的状态多为已注册。小米作为一家在商标保护方面一向积极的企业,曾因商标侵权问题多次通过法律手段维权,此次转让可能是其业务聚焦的战略调整,旨在优化非核心商标资源。北京月之暗面科技有限公司成立于2023年4月,注册资本为100万元人民币,法定代表人是杨植麟。公司的经营范围包括软件开发、人工智能基础软件和应用软件开发等。值得注意的是,月之暗面近期
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里云通义灵码 AI IDE 正式上线,带来编程新体验阿里云推出了通义灵码 AI IDE,这款深度适配千问3的人工智能开发环境具备强大的编程智能体模式、长期记忆和行间建议预测功能,同时提供行间对话功能,显著提升开发效率,已成为国内最受欢迎的编程辅助工具之一。【AiBase提要:】🚀 AI IDE
近年来,大语言模型(LLM)的快速发展为人工智能领域带来了前所未有的突破,但其内部决策过程却常常被视为“黑盒子”,难以捉摸。5月29日,AI研究领域的明星公司Anthropic发布了一项重大开源成果——“电路追踪”(Circuit Tracing)工具,为破解大模型的内部工作机制提供了全新视角。这一工具不仅能帮助研究人员深入探索AI的“思考”过程,还为推动更透明、可控的AI发展迈出了重要一步。以下是AIbase为您整理的最新资讯,带您一探究竟!“电路追踪”:打开AI的“大脑”Anthropic此次开源的“
近日,小米公司研发的MiMo-VL多模态模型接过MiMo-7B的接力棒,在多个领域展现出了强大的实力。该模型在图片、视频、语言的通用问答和理解推理等多个任务上大幅领先同尺寸标杆多模态模型Qwen2.5-VL-7B,在GUI Grounding任务上的表现更是可与专用模型相媲美,为Agent时代的到来做好了准备。
Hume公司于2025年5月29日正式发布全新语音语言模型EVI3,这一创新标志着通用语音智能领域的重大飞跃。相较于传统文本到语音(TTS)模型,EVI3不仅能够理解和生成任意人类语音,还能精准捕捉语调、节奏和情感表达,展现出前所未有的语音表现力。得益于其先进的语音到语音架构,EVI3在保持低延迟的同时,具备与前沿大语言模型相当的智能水平,为用户带来更自然、更高效的交互体验。核心技术亮点:低延迟与高表现力兼得EVI3的独特之处在于其突破性的语音到语音技术。与传统模型仅能处
Ollama官方宣布推出其最新版本Ollama v0.8,为本地运行大型语言模型(LLM)带来了突破性升级。新版本引入了流式传输响应和工具调用功能,支持实时网络搜索等交互场景,显著提升了本地AI的实用性和灵活性。AIbase为您整理了Ollama v0.8的核心亮点及其对AI生态的影响。流式传输响应:实时交互更流畅Ollama v0.8最大的亮点之一是新增了流式传输响应功能。用户在使用AI模型进行对话或任务处理时,可实时接收逐步生成的响应,而无需等待完整结果输出。这一功能显著提升了交互体验,尤其在处理复
近期,Meta 的 FAIR 团队与耶路撒冷希伯来大学的研究人员联合发布了一项新研究,表明减少大型语言模型的推理时间可以显著提高其在复杂推理任务中的表现。研究结果显示,使用较短推理链的 AI 模型准确率提高了34.5%,这一发现对当前 AI 行业的假设提出了挑战。图源备注:图片由AI生成,图片授权服务商Midjourney在这项研究中,作者指出,长时间的思考链条并不一定能够带来更好的推理能力,反而会导致计算资源的浪费。以往,许多公司投入大量资源以扩展计算能力,期望 AI 能够通过详尽
最近,通义实验室和北京大学的研究团队推出了一项名为 ZeroSearch 的创新框架,这一新技术可以在不需要真实搜索的情况下,激活大语言模型的检索能力,并且训练成本降低了惊人的88%。这一突破为大语言模型的训练和应用提供了全新的思路。传统的训练方法通常依赖于真实的搜索引擎来获取信息,这不仅造成了高昂的 API 调用成本,还可能因搜索结果的质量不稳定而影响模型的表现。ZeroSearch 巧妙地通过引入大语言模型作为 “模拟搜索引擎”,利用其在预训练过程中积累的丰富知识来生