Buddy Compiler成功打通LLaMA 2端到端推理
站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
Meta宣布扩大员工使用竞争对手AI工具的权限,旨在将AI技术更广泛融入工作流程。公司鼓励使用ChatGPT-5和Gemini3Pro等工具提升效率。首席信息官强调,将AI融入日常工作是首要任务。
Meta推行“AI优先”战略,打破技术壁垒,允许员工广泛使用谷歌、OpenAI、Anthropic等竞争对手的AI工具,并将其深度融入日常办公全流程,涵盖编码、写作、设计、决策等环节。
Meta 下一代旗舰大模型代号 Avocado,定位为 Llama 系列继任者,计划于 2026 年第一季度发布。该模型将采用闭源商业化路线,性能对标 GPT-5 与 Gemini,旨在与 OpenAI、Google 等公司的封闭模型生态正面竞争。
Meta与8家头部媒体达成数据授权协议,将在Meta AI聊天机器人中提供实时新闻问答和文章链接,覆盖全球突发、娱乐及本地新闻。用户提问可获得可点击信源,合作伙伴将获得新增流量和分成。这是Meta自2022年停止新闻付费、2024年取消Facebook新闻标签后,首次大规模为新闻内容支付版权费,覆盖200个国家,全平台即时接入。
Meta AI推出CoT-Verifier模型,通过分析链式思维每一步的“电路轨迹”来定位推理错误。与传统仅验证输出的方法不同,该模型先进行前向推理,再提取归因图,发现正确与错误推理的图结构差异显著。团队利用轻量级分类器实现高效验证,已在Hugging Face发布。

Meta AI实验室推出基于Llama3.18B的CoT-Verifier模型,通过TopK转码器机制实现白盒验证,帮助开发者精准定位和修正AI链式思维推理中的错误环节,突破传统验证方法的局限。
Meta宣布自2026年1月15日起,禁止竞争对手AI聊天机器人通过WhatsApp商业API运营。新政策直接影响OpenAI的ChatGPT和微软Copilot,将被迫退出平台。Meta禁止AI公司利用其商业解决方案运营聊天机器人,尤其针对以AI为核心产品的企业。禁令生效前,ChatGPT用户仍可继续使用。
新加坡AISG发布新一代大语言模型Qwen-Sea-Lion-v4,底层架构从Meta Llama切换为阿里Qwen3-32B,在东南亚语言评估基准Sea-Helm的<2000亿参数开源榜单夺冠。切换主因:Qwen3预训练覆盖119种语言/方言,对印尼语等低资源语言适配更优;分词优化放弃西方常用方案,原生多语架构降低后续训练门槛。
llama.cpp史诗级更新重塑本地AI体验:从极简C++引擎升级为带现代化Web界面的全能工作台,实现多模态输入、结构化输出和并行交互三大突破,功能直追Ollama等工具。这场社区驱动的革新使其从开发者专用工具转变为普通用户易用的AI平台。

微软Azure ND GB300v6虚拟机在Llama270B模型上创下每秒110万token推理速度新纪录。该成就基于与英伟达的深度合作,采用配备72个Blackwell Ultra GPU和36个Grace CPU的NVIDIA GB300NVL72系统,突显微软在规模化AI运算领域的专业实力。