模型越大越爱拍马屁!谷歌大神 Quoc Le 团队新作:用简单合成数据微调即可解决

微信公众平台
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
近日,Qwen VLo多模态大模型正式发布,该模型在图像内容理解与生成方面取得了显著进展,为用户带来了全新的视觉创作体验。 据介绍,Qwen VLo在继承原有Qwen-VL系列模型优势的基础上,进行了全面升级。该模型不仅能够精准“看懂”世界,更能基于理解进行高质量的再创造,真正实现了从感知到生成的跨越。用户现在可以在Qwen Chat(chat.qwen.ai)平台上直接体验这一新模型。
中国首个海洋领域的开源大模型 OceanGPT(沧渊)在浙江杭州正式发布。这一创新成果由浙江大学海洋精准感知技术全国重点实验室牵头研发,标志着中国在海洋科技领域迈出了重要一步。OceanGPT 具备基础的海洋专业知识问答能力,能够对声呐图像、海洋观测图等多模态数据进行自然语言解读。这一能力使得 OceanGPT 在处理复杂的海洋数据时,表现出色。该模型还采用了一种领域知识增强的 “慢思考” 推理机制,这意味着它能够有效降低生成错误信息的风险,解决了现有通用大模型常见的 “
欢迎来到AIbase【AI日报】栏目!每天三分钟了解当日AI大事件,助你洞悉AI行业趋势、创新AI产品应用。更多AI资讯访问:https://www.aibase.com/zh1、腾讯开源轻量级混元-A13B模型1张中低端GPU卡即可部署腾讯发布混元大模型家族的新成员混元-A13B模型,采用专家混合(MoE)架构,总参数规模达800亿,激活参数为130亿,大幅降低推理延迟与计算开销,为个人开发者和中小企业提供更具性价比的AI解决方案。该模型在数学、科学和逻辑推理任务中表现出色,支持调用工具生成复杂指令响应。体验入口:https:/
腾讯正式发布并开源混元大模型家族的新成员——混元-A13B模型。该模型采用基于专家混合(MoE)架构,总参数规模达800亿,激活参数为130亿,在保持顶尖开源模型效果的同时,大幅降低了推理延迟与计算开销,为个人开发者和中小企业提供了更具性价比的AI解决方案。
谷歌于本周四在美国iOS和Android平台推出了一款名为 Doppl 的实验性新应用,旨在通过人工智能技术,让用户直观地看到不同服装穿在自己身上的效果。这款应用利用AI生成用户穿着服装的虚拟形象,甚至能将静态图像转换为动态视频,为用户提供沉浸式的试穿体验。Doppl 的核心功能在于允许用户上传自己的全身照片,然后通过导入服装照片或截图,在自己的数字版本上进行虚拟试穿。无论是你在旧货店发现的心仪服装,还是社交媒体上的时尚灵感,都能通过Doppl轻松呈现。用户不仅可以保存
巨人网络旗下的社交推理游戏**《太空杀》近日上线了全新的AI原生玩法——“残局对决”。此次更新联合了阿里通义千问、腾讯混元、字节豆包这三大国产大模型,共同打造了游戏行业首个“多用户与AI智能体混合对抗”**的创新竞技机制。这不仅是《太空杀》AI原生玩法的重要升级,也标志着国产大模型在游戏场景落地应用的前沿探索。相较于传统的人机对抗和AI陪玩模式,“残局对决”在AI玩法创新上实现了显著突破。该玩法基于PvPvE(Player vs Player vs Environment)架构,构建了一个独特的
OpenAI于2025年6月26日宣布推出两款全新的 Deep Research API模型:o3-deep-research-2025-06-26和 o4-mini-deep-research-2025-06-26,标志着其在自动化研究与复杂任务处理领域的重大突破。这两款模型专为高阶分析和深度信息合成设计,支持开发者通过API实现自动化的网页搜索、数据分析、代码执行等功能,为企业、研究人员和开发者提供了强大的工具。o3与o4-mini:性能与效率的平衡o3-deep-research 是OpenAI目前最强大的深度研究模型,推论能力达到最高等级(5/5),专为需要复杂推理和精准分析的任务打造,例如金
近日,谷歌宣布其 AI 驱动的 “Ask Photos” 搜索工具将重新开放访问,并对该功能进行了一系列改进。在此之前,谷歌曾悄然暂停了该工具的推出,以便进一步优化用户体验。“Ask Photos” 工具由谷歌的 Gemini AI 模型提供支持,用户可以通过提出复杂的问题来快速找到所需的照片。尽管该功能具有很大的潜力,但在本月初,谷歌照片团队的一位成员在社交媒体平台 X 上表示,当前的工具在延迟、质量和用户体验方面仍未达到理想状态。对此,谷歌在周四发布的博客中表示,他们已听取用户反
AIbase报道 — 功能特性与应用场景Offerwall允许出版商为网站读者提供多种内容访问方式,包括小额支付、参与调查、观看广告等选项。出版商还可添加自定义选项,如订阅新闻通讯等。该工具现已在Google Ad Manager中免费提供,并由AI智能决定何时向访客展示,以最大化参与度和收益。经过超过一年的测试,已有1000家出版商参与试用。谷歌与第三方合作伙伴Supertab合作,支持用户通过小额支付获得24小时、数天或一周的内容访问权限。变现效果与数据表现测试数据显示,Offerwall在帮助出版商增
谷歌于本周五凌晨正式发布并开源全新端侧多模态大模型Gemma3n,这一突破性产品为手机、平板、笔记本等端侧设备带来了此前只能在云端体验的强大多模态功能。核心特性:小体积大能力Gemma3n提供E2B和E4B两个版本,虽然原始参数量分别为5B和8B,但通过架构创新,其内存占用仅相当于传统2B和4B模型,分别只需2GB和3GB内存即可运行。该模型原生支持图像、音频、视频和文本的多模态输入处理,支持140种文本语言和35种语言的多模态理解。值得一提的是,E4B版本在LMArena评测中得分超过1300,成为