谷歌发布首个原生多模态嵌入模型 Gemini Embedding 2：让机器真正“读懂”世界

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Mar 11, 2026

谷歌正式推出全新 Gemini Embedding2模型。作为谷歌首个原生多模态嵌入模型，它打破了传统模型仅支持单一数据类型的局限，能够将文本、图像、视频、音频和文档同时映射到同一个数学向量空间中，从而实现跨媒体的深度理解。

与专注于内容创作的 Gemini3等生成式模型不同，嵌入模型的核心职能是“理解”。它通过将复杂数据转化为机器可读的向量，帮助系统识别语义关系，在搜索精度和上下文关联上远超传统的关键词检索。

Gemini Embedding2的技术特性与突破:

全能多模态支持:该模型不仅支持文本，还可直接处理 PNG/JPEG 图像、最长120秒的 MP4/MOV 视频、原生音频数据以及最多6页的 PDF 文档。
全球化语言理解:支持在全球100种语言中精准识别用户的语义意图。
多维度联合分析:模型可以在单次请求中同时接收“图像 + 文本”等组合输入，从而深度分析不同媒介类型之间的内在联系。
广泛的应用场景:新模型将显著提升检索增强生成（RAG）、语义搜索、情感分析以及大规模数据聚类的性能。

谷歌在官方博客中举例称，在法律诉讼取证等复杂场景下，Gemini Embedding2能在数百万条跨媒体记录中快速定位关键证据，大幅提升了检索的精度与召回率。目前，该模型已通过 Gemini API 和 Vertex AI 提供公开预览。

对于开发者而言，这一更新意味着可以更轻松地构建处理复杂现实数据的 AI 应用，让机器不仅能“看”和“听”，更能理解不同信息背后的统一逻辑。

GeminiEmbedding2 多模态嵌入模型 AI新词谷歌

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

钉钉发布 AI 录音硬件 DingTalk A1Pro:售价1299元，支持手机反向充电

钉钉发布AI硬件新品DingTalk A1Pro，定价1299元，定位专业AI录音卡片，专为高频出差商务人士设计。该设备厚度仅6.4mm，支持磁吸与触控屏，搭载专业级MEMS指向性麦克风，具备“AI办公+应急补能”复合功能，拓展钉钉软硬一体化服务边界。

2026年4月30号 17:59

620

押注于人而非代码：Zig 项目全面禁止 LLM 辅助贡献引发热议

生成式AI席卷编程领域之际，Zig开源项目逆势推出严格政策：全面禁止使用大语言模型生成的代码或评论参与贡献。知名开发者Simon Willison解读后，引发社区对技术效率与人才培养博弈的讨论。核心矛盾在于代码产出与人才成长的取舍，Zig维护者重新定义“贡献”，强调原创与学习过程。

2026年4月30号 17:24

120

快手推出 KroWork:AI 桌面助手助你高效办公

快手推出AI桌面智能体KroWork，面向非技术用户，支持自然语言指令完成文件处理、浏览器自动化及应用生成等办公任务。用户可将重复工作转化为本地应用，无需额外付费。所有操作在安全沙箱环境中执行，数据不上传云端，保障隐私安全。

2026年4月30号 17:17

800

AI日报：DeepSeek识图模式灰测；小红书成立AI一级部门；阿里发布程序员“数字分身”QoderWake

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://app.aibase.com/zh1、DeepSeek开启识图模式灰度测试，多模态视觉理解能力正式落地DeepSeek在发布DeepSeek-V4后迅速开启多模态识图功能的灰度测试，标志着其多模态能力进入实质性阶段。Gemini迎来史诗级更新，一键生成Office文档Gemini通过新增直接生成和导出多种格式文件的功能，显著提升了其作为生产力工具的能力，同时增强了与办公软件的衔接性，为用户提供了更高效的办公体验。

2026年4月30号 16:27