科大讯飞发布讯飞星火认知大模型 V3.0,超越 ChatGPT 3.5

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
月之暗面公司正式发布了其最新力作——Kimi K2模型,并同步宣布开源。这款基于MoE架构的基础模型,凭借其强大的代码能力、卓越的通用Agent任务处理能力,一经发布便在AI领域引起了广泛关注。 Kimi K2模型总参数高达1T,激活参数为32B,在SWE Bench Verified、Tau2、AceBench等一系列基准性能测试中,均取得了开源模型中的顶尖成绩,充分展现了其在代码编写、Agent任务执行以及数学推理等方面的领先实力。
近日,腾讯云官网正式上线了腾讯混元A13B模型的API服务,输入价格定为每百万Tokens0.5元,输出价格则为每百万Tokens2元,这一举措迅速在开发者社区中引发了热烈反响。 作为业界首个13B级别的MoE(混合专家)开源混合推理模型,Hunyuan-A13B以其总参数80B、激活参数仅13B的精简设计,实现了与同等架构领先开源模型相媲美的效果,同时在推理速度上更胜一筹,性价比显著提升。这一创新不仅降低了开发者获取先进模型能力的门槛,更为AI应用的广泛普及奠定了坚实基础。
【AI日报速览】1.智谱推出免费AI Slides,基于GLM模型快速生成专业PPT;2.可灵AI发布可图2.1,图像生成支持180种风格;3.NVIDIA推出DiffusionRenderer,实现视频转3D场景编辑;4.墨刀AI上线30秒生成可编辑原型功能;5.Higgsfield Soul ID用10张照片生成虚拟形象;6.谷歌开源GenAI Processors构建AI工作流;7.谷歌Veo3新增图转视频功能;8.Mistral AI发布专注代码生成的Devstral2507系列模型。
微软发布革命性BioEmu模型,将蛋白质动态模拟时间从数年缩短至数小时。该模型基于AlphaFold2改进,采用序列编码器和扩散生成技术,能生成多样化蛋白质构象。通过200毫秒分子动力学数据训练,显著提升模拟精度。这一突破将极大加速药物研发和生物医学研究,已在《自然》期刊发表。
Meta内部弃用自家Llama模型转投Claude Sonnet引发关注。Llama4发布后因性能差评和排名争议遭质疑,连内部团队也不再信任。扎克伯格虽透露Llama4.1/4.2在研,但员工批评公司存在恐惧文化和缺乏愿景等问题。改用Claude后工程师编码效率显著提升,Anthropic年收入飙升至40亿美元。Meta此举被视为对Llama表现不佳的公开承认,尽管其"超级智能实验室"仍在开发下一代模型。
OpenAI低调将Shopify加入第三方搜索合作伙伴,与Bing共同为ChatGPT购物功能提供数据支持。此次合作未正式官宣,但5月15日已更新至官方文档。购物搜索现可展示Shopify、亚马逊等多平台商品,呈现带图片、评分的富文本结果。商家需申请加入并允许OAI-SearchBot爬取数据,此举既丰富了OpenAI的购物数据源,也为Shopify商家带来新流量入口。
NVIDIA推出DiffusionRenderer技术突破视频生成瓶颈,实现3D场景的可控编辑。该技术采用双神经渲染器架构:逆渲染器提取场景几何材质数据,前向渲染器结合光照生成逼真视频。通过15万合成视频和1万真实视频数据集训练,模型在光影效果和材质还原上表现优异。支持动态光照调整、材质修改和对象插入等操作,大幅提升创作自由度。这项技术标志着AI视频生成从单纯创作迈向可编辑的新阶段。
中小银行加速布局大模型技术,超10家城商行近期启动相关项目招标,投资规模普遍在200-600万元之间。这些银行主要聚焦应用层开发,旨在优化服务流程、提升运营效率。典型案例显示,广西北部湾银行等项目报价达数百万元。相比国有大行动辄上亿的投入,城商行更注重性价比和实际应用效果。业内报告指出,银行业大模型应用正从试点走向多场景落地,推动行业智能化转型。
埃隆·马斯克旗下xAI的Grok4模型陷入争议,测试显示该AI在回答敏感话题时优先引用马斯克本人观点,与其"追求真相"承诺相矛盾。虽然Grok4在技术测试中表现优异,但近期接连出现反犹言论等严重失误,加上明显的政治倾向性,给其商业推广蒙上阴影。目前xAI尚未公布模型训练细节,缺乏透明度加剧外界质疑。这些问题可能影响其300美元/月的订阅服务和API商业计划。
可灵AI推出新一代图像生成模型"可图2.1",在指令理解、人像美感和电影质感等方面全面提升。新模型具备强大文字生成能力,支持180多种风格,7月17日前会员可免费体验。该模型能精准呈现复杂场景,如3D沙盘、海底火山爆发等宏大场面,在人像光影处理上尤为出色。可灵AI已发展为多模态创意平台,用户累计生成3.44亿张图片和1.68亿个视频,展现强大技术实力和市场影响力。