谷歌DeepMind推出Gemma Scope2,这是一个开放的可解释性工具套件,旨在深入分析Gemma3语言模型从2.7亿到270亿参数的各层次信息处理。该工具帮助AI安全与对齐团队追踪模型内部特征,以应对“越狱”、幻觉或不当行为等问题。
Starcloud公司利用搭载NVIDIA H100GPU的卫星,在太空中成功训练了nano-GPT模型并完成Gemma模型推理,标志着太空数据中心发展的重要进展。
初创公司Starcloud成功在太空轨道上训练大语言模型,成为全球首例。其卫星搭载英伟达H100芯片,并运行基于谷歌开源模型Gemma的应用程序,开启了太空数据中心的新纪元。公司计划为客户提供商业服务,卫星发回的信号展示了其独特视角。
谷歌Gemma模型因误传美国参议员布莱克本的虚假信息引发争议,被指诽谤。谷歌于10月31日宣布将Gemma3模型从AI Studio平台撤下,以防止误解。目前该模型仅通过API可用,AI Studio上已无法访问。
Gemma 3 是基于 Gemini 2.0 技术的轻量级、高性能开源模型,专为单 GPU 或 TPU 设备设计。
基于Gemma-2-27B架构的先进奖励模型
Gemma 2 9B和2B模型的稀疏自编码器套件
轻量级、先进的2B参数文本生成模型。
Google
-
输入tokens/百万
输出tokens/百万
上下文长度
$140
$280
32
$0.14
$0.28
131
$0.35
$0.7
$1.4
Alibaba
$2
$1
uaritm
Gemma-UA-Cardio 是两款专为乌克兰语心脏病学领域设计的专业大语言模型。它们基于 Google 的 Gemma 和 MedGemma 模型,经过两阶段微调(语言适配与领域专业化),能够以乌克兰语精准提供心血管医学信息、解答临床问题,是面向医疗专业人士的辅助工具。
MuXodious
Gemma 3n E4B IT 是谷歌推出的轻量级多模态开放模型,基于与Gemini模型相同的研究构建。该模型支持文本、音频和视觉输入,适用于多种任务,采用MatFormer架构实现高效参数利用。
ExaltedSlayer
Gemma 3是谷歌推出的轻量级开源多模态模型,本版本为12B参数的指令调优量化感知训练模型,已转换为MLX框架的MXFP4格式,支持文本和图像输入并生成文本输出,具有128K上下文窗口和140+语言支持。
RiosWesley
巴西范围路由模型是一个基于Gemma 3 270M的微调微型大语言模型,专为巴西外卖服务系统设计,可作为极快速且轻量级的意图分类器(路由)。该模型使用Unsloth进行训练并转换为GGUF格式。
mradermacher
这是 vanta-research/atom-v1-preview-12b 模型的量化版本,提供多种量化类型选择,适用于对话、协作、教育等多种场景。该模型基于 Gemma 架构,支持英语语言处理。
dogeater1612
这是一个基于Google Gemma 2 9B模型微调的荷兰语患者模拟模型,专门为医疗教育场景设计。模型始终以固定的JSON结构响应,模拟一位刚做完手术正在康复的患者'玛丽亚',支持护理专业学生在安全环境中锻炼沟通和临床推理能力。
McG-221
该模型是基于summykai/gemma3-27b-abliterated-dpo,使用mlx-lm 0.28.3版本转换而成的MLX格式模型。它是一个经过DPO(直接偏好优化)微调的27B参数Gemma 3大语言模型,专为在Apple Silicon(MLX框架)上高效运行而优化。
fibonacciai
RealRobot_chatbot_llm是基于Gemma3n架构的专业产品人工智能模型,专门在RealRobot产品目录的专有数据集上进行了微调。该模型能够根据企业自身的产品数据,快速创建准确、经济高效且可部署的专业语言模型,提供高度专业化的产品问答服务。
mudasir13cs
这是一个基于Google Gemma-3-4B-IT模型微调的文本生成模型,专门用于根据演示模板元数据生成多样化且相关的搜索查询。该模型使用LoRA适配器进行高效微调,是结构化文档字段自适应密集检索框架的关键组成部分。
kirankumarpetlu
这是一个基于Google Gemma-2B-IT基础模型,使用PEFT(参数高效微调)和LoRA技术进行优化的文本生成模型。该模型通过参数高效的方法在保持基础模型能力的同时,针对特定任务进行了优化。
yanolja
YanoljaNEXT-Rosetta-27B-2511是基于Gemma3架构微调的270亿参数解码器语言模型,专门为结构化数据翻译设计,能在保留数据结构的同时实现多语言间的高效准确翻译。
DavidAU
这是一个基于Gemma-3模型使用内部恐怖数据集进行微调的文本生成模型,专门用于生成恐怖风格的内容。模型通过Unsloth进行调优,能够生成从轻度到强烈程度的恐怖内容,包括长篇恐怖故事。
vanta-research
Scout是VANTA Research基于Google Gemma 3 4B Instruct架构微调的专业语言模型,在约束感知推理和自适应问题解决方面表现出色,擅长侦察式情报收集、系统问题分解和自适应解决方案生成。
Gemma 3 27B IT QAT的MLX MXFP4量化版本,是由Google开发的轻量级开源多模态模型。该模型能够同时处理文本和图像输入并生成文本输出,拥有128K大上下文窗口,支持超过140种语言,适用于多种文本生成和图像理解任务。
Lamapi
Next 12B是基于Gemma 3的120亿参数多模态视觉语言模型,是土耳其最先进的开源视觉语言模型。该模型在文本和图像理解方面表现出色,具备先进的推理和上下文感知多模态输出能力,特别提供专业级的土耳其语支持,同时具备广泛的多语言能力。
dario-mazzola
这是基于Google Gemma-3模型进行专门微调的文本生成模型,经过训练能够利用外部工具生成逐步计划。该模型在rewoo/planner_instruction_tuning_2k数据集上训练,使用LoRA技术进行高效微调。
hirundo-io
这是一个基于🤗 Transformers的模型,已发布至HuggingFace模型中心。由于模型卡片信息不完整,具体功能和应用场景需进一步确认。
lapa-llm
Lapa LLM v0.1.2是基于Gemma-3-12B开发的乌克兰语处理开源大语言模型,专注于乌克兰语的自然语言处理任务,在乌克兰语处理方面表现出卓越性能。
Lambent
Mira是一个基于多个Gemma 3 27B基础模型融合的文本生成模型,通过精心挑选的训练数据和特定训练方式,具备独特的诗意文本生成能力。该模型在角色扮演和创意写作方面表现出色,能够根据不同的系统提示生成富有文学色彩的文本。
suayptalha
Sungur-9B是一个专门针对土耳其语优化的文本生成模型,基于Gemma-2-9b架构,通过直接偏好优化(DPO)数据集和4位QLoRA微调技术训练而成,能够生成流畅且符合人类偏好的土耳其语文本。
ConsultingAgents MCP Server是一个多模型咨询代理服务器,通过MCP协议为Claude Code提供四种AI专家咨询服务(Darren、Sonny、Sergey、Gemma),支持代码分析、文档搜索和仓库级开发规划。
该项目展示了如何利用Google的ADK(代理开发工具包)和MCP(模型上下文协议)构建一个由Gemma 3驱动的YouTube搜索助手,支持自然语言查询和格式化搜索结果。