Mistral是今年大模型领域的新趋势,推出闭源大模型挑战OpenAI。商业模式类似于OpenAI,通过提供API有偿服务。Mistral代表欧盟大模型企业,影响到了人工智能法案的立法过程。Mistral的价格接近OpenAI,但其差异性不明确。Mistral的原生函数调用和JSON模式受到称赞。与Llama2、Gemini Pro 1.0等进行了比较。Mistral发布了较小版本的闭源模型Small并推出Le Chat聊天助手,计划推出付费版本。团队由谷歌Deepmind和Meta前员工组成。
相关AI新闻推荐

月之暗面Kimi K2 模型发布并开源 擅长代码与 Agentic 任务
月之暗面公司正式发布了其最新力作——Kimi K2模型,并同步宣布开源。这款基于MoE架构的基础模型,凭借其强大的代码能力、卓越的通用Agent任务处理能力,一经发布便在AI领域引起了广泛关注。 Kimi K2模型总参数高达1T,激活参数为32B,在SWE Bench Verified、Tau2、AceBench等一系列基准性能测试中,均取得了开源模型中的顶尖成绩,充分展现了其在代码编写、Agent任务执行以及数学推理等方面的领先实力。

腾讯混元Hunyuan-A13B模型API上线
近日,腾讯云官网正式上线了腾讯混元A13B模型的API服务,输入价格定为每百万Tokens0.5元,输出价格则为每百万Tokens2元,这一举措迅速在开发者社区中引发了热烈反响。 作为业界首个13B级别的MoE(混合专家)开源混合推理模型,Hunyuan-A13B以其总参数80B、激活参数仅13B的精简设计,实现了与同等架构领先开源模型相媲美的效果,同时在推理速度上更胜一筹,性价比显著提升。这一创新不仅降低了开发者获取先进模型能力的门槛,更为AI应用的广泛普及奠定了坚实基础。

AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型
【AI日报速览】1.智谱推出免费AI Slides,基于GLM模型快速生成专业PPT;2.可灵AI发布可图2.1,图像生成支持180种风格;3.NVIDIA推出DiffusionRenderer,实现视频转3D场景编辑;4.墨刀AI上线30秒生成可编辑原型功能;5.Higgsfield Soul ID用10张照片生成虚拟形象;6.谷歌开源GenAI Processors构建AI工作流;7.谷歌Veo3新增图转视频功能;8.Mistral AI发布专注代码生成的Devstral2507系列模型。

Mistral AI 发布 Devstral2507:为代码中心语言建模而生
Mistral AI推出Devstral2507系列两款AI模型:开源的Devstral Small1.1(240亿参数,SWE-Bench得分53.6%)和企业版Devstral Medium2507(得分61.6%)。Small1.1支持128k上下文窗口和本地部署,Medium2507性能超越部分商业模型。两者均针对代码推理、程序合成优化,支持与代理框架集成,分别适用于本地开发和企业级应用,提供从实验到生产的完整解决方案。

微软 BioEmu 模型实现蛋白质模拟时间大幅缩短
微软发布革命性BioEmu模型,将蛋白质动态模拟时间从数年缩短至数小时。该模型基于AlphaFold2改进,采用序列编码器和扩散生成技术,能生成多样化蛋白质构象。通过200毫秒分子动力学数据训练,显著提升模拟精度。这一突破将极大加速药物研发和生物医学研究,已在《自然》期刊发表。

Llama 被抛弃!Meta转向Claude,内情大揭秘
Meta内部弃用自家Llama模型转投Claude Sonnet引发关注。Llama4发布后因性能差评和排名争议遭质疑,连内部团队也不再信任。扎克伯格虽透露Llama4.1/4.2在研,但员工批评公司存在恐惧文化和缺乏愿景等问题。改用Claude后工程师编码效率显著提升,Anthropic年收入飙升至40亿美元。Meta此举被视为对Llama表现不佳的公开承认,尽管其"超级智能实验室"仍在开发下一代模型。

OpenAI悄然新增Shopify为搜索合作伙伴,强化ChatGPT购物搜索功能
OpenAI低调将Shopify加入第三方搜索合作伙伴,与Bing共同为ChatGPT购物功能提供数据支持。此次合作未正式官宣,但5月15日已更新至官方文档。购物搜索现可展示Shopify、亚马逊等多平台商品,呈现带图片、评分的富文本结果。商家需申请加入并允许OAI-SearchBot爬取数据,此举既丰富了OpenAI的购物数据源,也为Shopify商家带来新流量入口。

NVIDIA 推出 DiffusionRenderer:全新 AI 模型实现视频到可编辑的逼真 3D 场景
NVIDIA推出DiffusionRenderer技术突破视频生成瓶颈,实现3D场景的可控编辑。该技术采用双神经渲染器架构:逆渲染器提取场景几何材质数据,前向渲染器结合光照生成逼真视频。通过15万合成视频和1万真实视频数据集训练,模型在光影效果和材质还原上表现优异。支持动态光照调整、材质修改和对象插入等操作,大幅提升创作自由度。这项技术标志着AI视频生成从单纯创作迈向可编辑的新阶段。

城商行掀起大模型招标潮,百万级投入成行业新风口!
中小银行加速布局大模型技术,超10家城商行近期启动相关项目招标,投资规模普遍在200-600万元之间。这些银行主要聚焦应用层开发,旨在优化服务流程、提升运营效率。典型案例显示,广西北部湾银行等项目报价达数百万元。相比国有大行动辄上亿的投入,城商行更注重性价比和实际应用效果。业内报告指出,银行业大模型应用正从试点走向多场景落地,推动行业智能化转型。

AI 大模型的人格化:Grok 4 与马斯克的“共情”?
埃隆·马斯克旗下xAI的Grok4模型陷入争议,测试显示该AI在回答敏感话题时优先引用马斯克本人观点,与其"追求真相"承诺相矛盾。虽然Grok4在技术测试中表现优异,但近期接连出现反犹言论等严重失误,加上明显的政治倾向性,给其商业推广蒙上阴影。目前xAI尚未公布模型训练细节,缺乏透明度加剧外界质疑。这些问题可能影响其300美元/月的订阅服务和API商业计划。