谷歌的 DeepMind 人工智能研究团队近日发布了一款名为 Gemma3270M 的开源 AI 模型。该模型拥有2.7亿个参数,相比许多拥有700亿以上参数的先进大语言模型而言,其体积小巧得多。尽管参数较少,谷歌的目标却是提供一种高效的模型,开发者可以直接在智能手机上离线运行,尤其在内测中显示出在 Pixel9Pro SoC 上表现良好。
Gemma3270M 的设计使其能够胜任复杂的领域特定任务,并且只需几分钟就能快速进行微调,以适应企业或独立开发者的需求。谷歌 DeepMind 的工程师在社交平台 X 上表示,Gemma3270M 不仅可以在用户的网络浏览器中运行,甚至可以在树莓派及一些轻量硬件上使用。
该模型结合了1.7亿个嵌入参数和1亿个变换块参数,凭借一个256k 的词汇量,使其能够处理稀有和特定的词汇。根据谷歌的说法,Gemma3270M 在指令跟随任务上的表现也相当出色,在 IFEval 基准测试中得分达到了51.2%,超越了许多同类小型模型。
在内部测试中,使用 INT4量化模型时,Gemma3270M 在 Pixel9Pro SoC 上仅消耗了0.75% 的电池电量,显示出其在设备上的能效。此模型不仅适用于企业开发,也适合创造性场景,谷歌在 YouTube 上展示了一款基于 Gemma3270M 的 “睡前故事生成器” 应用,能够在不连接网络的情况下生成多样化的故事。
Gemma3270M 在 Gemma 生态系统中与其他大型模型兼容,且配备了丰富的文档和微调指南,开发者能够迅速从实验过渡到部署。该模型根据 Gemma 使用条款开源,允许开发者在遵循一定条件下进行使用、修改和分发,且生成的内容不归谷歌所有。
随着 Gemma 系列的下载量突破两亿,谷歌 AI 开发者正致力于将 Gemma3270M 打造成为构建快速、高效且关注隐私的 AI 解决方案的基础。
项目:https://developers.googleblog.com/en/introducing-gemma-3-270m/
划重点:
🧠 Gemma3270M 是谷歌发布的开源 AI 模型,拥有2.7亿个参数,可在智能手机上离线运行。
⚡ 该模型在指令跟随任务上表现出色,能效高,内部测试显示仅消耗0.75% 电池电量。
📱 Gemma3270M 支持快速微调,适用于企业开发和创造性应用,满足多样化需求。