万兴科技发布国内首个百亿参数多媒体大模型 “天幕”

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
中国首个海洋领域的开源大模型 OceanGPT(沧渊)在浙江杭州正式发布。这一创新成果由浙江大学海洋精准感知技术全国重点实验室牵头研发,标志着中国在海洋科技领域迈出了重要一步。OceanGPT 具备基础的海洋专业知识问答能力,能够对声呐图像、海洋观测图等多模态数据进行自然语言解读。这一能力使得 OceanGPT 在处理复杂的海洋数据时,表现出色。该模型还采用了一种领域知识增强的 “慢思考” 推理机制,这意味着它能够有效降低生成错误信息的风险,解决了现有通用大模型常见的 “
欢迎来到AIbase【AI日报】栏目!每天三分钟了解当日AI大事件,助你洞悉AI行业趋势、创新AI产品应用。更多AI资讯访问:https://www.aibase.com/zh1、腾讯开源轻量级混元-A13B模型1张中低端GPU卡即可部署腾讯发布混元大模型家族的新成员混元-A13B模型,采用专家混合(MoE)架构,总参数规模达800亿,激活参数为130亿,大幅降低推理延迟与计算开销,为个人开发者和中小企业提供更具性价比的AI解决方案。该模型在数学、科学和逻辑推理任务中表现出色,支持调用工具生成复杂指令响应。体验入口:https:/
腾讯正式发布并开源混元大模型家族的新成员——混元-A13B模型。该模型采用基于专家混合(MoE)架构,总参数规模达800亿,激活参数为130亿,在保持顶尖开源模型效果的同时,大幅降低了推理延迟与计算开销,为个人开发者和中小企业提供了更具性价比的AI解决方案。
可灵AI近日宣布,其全系列视频模型已正式上线**“视频音效”功能**,为用户带来革命性的沉浸式体验。现在,用户在生成视频的同时,可以同步生成立体声音效,真正实现“所见即所听”。不仅如此,平台原有的“音效生成”功能也得到了升级,新增了**“视频生音效”模块**。这意味着用户可以上传自己的视频或调用历史作品,一键匹配合适的音效。这项功能的强大之处在于,它基于可灵自研的多模态视频生音效模型 Kling-Foley,能够实现音画的帧级对齐,确保音效与画面内容高度同步。
谷歌于本周四在美国iOS和Android平台推出了一款名为 Doppl 的实验性新应用,旨在通过人工智能技术,让用户直观地看到不同服装穿在自己身上的效果。这款应用利用AI生成用户穿着服装的虚拟形象,甚至能将静态图像转换为动态视频,为用户提供沉浸式的试穿体验。Doppl 的核心功能在于允许用户上传自己的全身照片,然后通过导入服装照片或截图,在自己的数字版本上进行虚拟试穿。无论是你在旧货店发现的心仪服装,还是社交媒体上的时尚灵感,都能通过Doppl轻松呈现。用户不仅可以保存
巨人网络旗下的社交推理游戏**《太空杀》近日上线了全新的AI原生玩法——“残局对决”。此次更新联合了阿里通义千问、腾讯混元、字节豆包这三大国产大模型,共同打造了游戏行业首个“多用户与AI智能体混合对抗”**的创新竞技机制。这不仅是《太空杀》AI原生玩法的重要升级,也标志着国产大模型在游戏场景落地应用的前沿探索。相较于传统的人机对抗和AI陪玩模式,“残局对决”在AI玩法创新上实现了显著突破。该玩法基于PvPvE(Player vs Player vs Environment)架构,构建了一个独特的
OpenAI于2025年6月26日宣布推出两款全新的 Deep Research API模型:o3-deep-research-2025-06-26和 o4-mini-deep-research-2025-06-26,标志着其在自动化研究与复杂任务处理领域的重大突破。这两款模型专为高阶分析和深度信息合成设计,支持开发者通过API实现自动化的网页搜索、数据分析、代码执行等功能,为企业、研究人员和开发者提供了强大的工具。o3与o4-mini:性能与效率的平衡o3-deep-research 是OpenAI目前最强大的深度研究模型,推论能力达到最高等级(5/5),专为需要复杂推理和精准分析的任务打造,例如金
谷歌于本周五凌晨正式发布并开源全新端侧多模态大模型Gemma3n,这一突破性产品为手机、平板、笔记本等端侧设备带来了此前只能在云端体验的强大多模态功能。核心特性:小体积大能力Gemma3n提供E2B和E4B两个版本,虽然原始参数量分别为5B和8B,但通过架构创新,其内存占用仅相当于传统2B和4B模型,分别只需2GB和3GB内存即可运行。该模型原生支持图像、音频、视频和文本的多模态输入处理,支持140种文本语言和35种语言的多模态理解。值得一提的是,E4B版本在LMArena评测中得分超过1300,成为
近日,AI视频生成领域的领军企业HeyGen推出了一款革命性的AI视频Agent,为视频内容创作带来了全新突破。据AIbase了解,这款AI视频Agent能够通过简单的素材上传,自动完成从故事规划、脚本编写到镜头选择的整个视频制作流程,让用户在几分钟内即可获得可直接发布的专业级视频内容。这一创新功能不仅大幅降低了视频创作门槛,还为广告、短视频、产品演示等场景提供了高效解决方案。一键创作,智能高效HeyGen AI视频Agent的核心亮点在于其全自动视频生成能力。用户只需上传图片、视频片
近日,谷歌正式推出了一款名为 Doppl 的 AI 试衣应用,旨在为用户提供一种全新的虚拟试穿体验。通过这款应用,用户只需上传一张全身照片,就可以选择自己喜欢的服装进行试穿,无论这些服装来自旧货店、朋友的穿搭,还是社交媒体上的图片,都能轻松实现。Doppl 的操作流程非常简单。用户首先需要将自己的全身照上传到应用中。接着,可以通过上传其他服装的照片或截图,来进行虚拟试穿。应用会基于用户的形象生成相应的试穿效果图,帮助用户在自己的数字化身上查看衣物的搭配