南方科技大学联合 IDEA 研究院发布 SUS-Chat-34B 双语模型

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
可灵AI推出可图2.1模型,在指令理解、人像美化、电影质感及180多种风格响应能力上全面升级,同时优化了文字生成效果。新模型将向所有会员免费开放7天,支持文生图、单图参考和多图参考等功能。
vivo发布全新端侧多模态模型BlueLM-2.5-3B,具备GUI理解能力。该模型采用2.9B参数设计,支持长短思考模式切换,在20余项评测中表现优异:文本处理能力突出,有效缓解多模态模型"遗忘问题";长思考模式下数学和逻辑推理能力显著优于同规模模型;GUI理解能力尤其出色,得益于大量中文应用截屏数据训练。模型通过优化数据利用策略和训练流程,实现了高效低成本运行,为AI普及应用奠定基础。
【AI日报速览】1.xAI发布Grok4模型,数学推理与代码生成能力突出,含开发者专用版本Grok4Code;2.微软开源Phi-4-mini,推理效率提升10倍,适配边缘设备;3.上海82款大模型通过备案,垂类应用成效显著;4.Hugging Face推出开源机器人Reachy Mini赋能AI开发者;5.Perplexity发布AI浏览器Comet挑战Chrome;6.OpenAI将首推开放权重模型打破闭源惯例;7.谷歌医疗AI模型MedGemma上新,单GPU可运行;8.OpenAI斥资65亿收购艾维AI硬件公司,进军硬件市场。
苹果AI团队负责人Ruoming Pang跳槽至Meta超级智能实验室,Meta开出超2亿美元薪酬方案(含股票、奖金),远超苹果CEO库克薪资。苹果未匹配报价,已任命新负责人并调整团队架构。此次高薪挖角或引发苹果AI团队离职潮,凸显Meta在AI人才争夺战的激进策略。
2025世界人工智能大会透露,上海已备案82款大模型,重点推进制造、金融等领域的AI示范应用。徐汇"模速空间"和浦东"模力社区"成为产业载体,分别聚集500家和200家AI企业。上海通过国家及市级人工智能基金,构建从种子期到成熟期的全周期融资支持体系,重点投向算力、语料等关键领域。
谷歌推出医疗AI开发工具包HAI-DEF,包含MedGemma和MedSigLIP两大开放模型。MedGemma27B多模态模型支持医疗文本生成和电子病历分析,MedSigLIP则擅长医学图像分类检索。这些模型可在单GPU运行,支持本地部署和微调,确保数据隐私和定制需求。相比API模型,开放架构让开发者能灵活应对医疗场景的特殊要求,如隐私保护和性能优化。项目提供详细教程,支持Hugging Face和Vertex AI平台部署。
OpenAI计划下周发布首款开放权重语言模型,打破自2019年以来的闭源传统。该模型允许用户在非OpenAI服务器上运行,包括Azure、Hugging Face等云平台。据悉,新模型具备强大推理能力,类似"o3mini",已向开发者展示并收集反馈。此举可能改变AI模型开发格局,但OpenAI尚未正式回应。
【AI日报速览】阿里开源ThinkSound音频生成模型,支持链式推理实现高保真空间音频;谷歌Veo3升级,单图即可生成专业运镜视频;Hugging Face发布30亿参数SmolLM3模型,支持双模式推理;阿里WebSailor智能体展现强大检索能力;Moonvalley推出1080P无版权风险视频模型;Vidu Q1支持7图融合生成一致性视频;苹果研发AI客服助手优化用户体验;飞书发布多款企业AI产品及成熟度模型;微软等科技巨头联合成立AI教育学院,投入2300万美元培训教师。
Hugging Face推出3B参数开源模型SmolLM3,性能媲美4B参数模型。该模型采用GQA和NoPE技术优化,支持128K长上下文和六种语言处理,在多项基准测试中表现优异。创新性地提供"思考"与"非思考"双推理模式,复杂任务性能提升显著。完全开源训练数据与代码,适合边缘设备部署,为教育、客服等场景提供高性价比解决方案。其开源特性将推动AI生态发展,展现小模型的巨大潜力。
智元机器人公司近日公布一项机器人运动控制模型训练专利。该专利通过对比机器人实际接触序列与预期接触序列的差异,生成摆动激励值来优化模型参数。其中预期接触序列基于相位变量和步态映射关系生成,包含摆动相占空比和足间相位偏移量等信息。该方法能有效提升机器人运动控制精度,使机器人动作更加精准稳定。