谷歌DeepMind推出Gemma Scope2,這是一個開放的可解釋性工具套件,旨在深入分析Gemma3語言模型從2.7億到270億參數的各層次信息處理。該工具幫助AI安全與對齊團隊追蹤模型內部特徵,以應對“越獄”、幻覺或不當行爲等問題。
Starcloud公司利用搭載NVIDIA H100GPU的衛星,在太空中成功訓練了nano-GPT模型並完成Gemma模型推理,標誌着太空數據中心發展的重要進展。
初創公司Starcloud成功在太空軌道上訓練大語言模型,成爲全球首例。其衛星搭載英偉達H100芯片,並運行基於谷歌開源模型Gemma的應用程序,開啓了太空數據中心的新紀元。公司計劃爲客戶提供商業服務,衛星發回的信號展示了其獨特視角。
谷歌Gemma模型因誤傳美國參議員布萊克本的虛假信息引發爭議,被指誹謗。谷歌於10月31日宣佈將Gemma3模型從AI Studio平臺撤下,以防止誤解。目前該模型僅通過API可用,AI Studio上已無法訪問。
Gemma 3 是基於 Gemini 2.0 技術的輕量級、高性能開源模型,專為單 GPU 或 TPU 設備設計。
基於Gemma-2-27B架構的先進獎勵模型
Gemma 2 9B和2B模型的稀疏自編碼器套件
輕量級、先進的2B參數文本生成模型。
Google
-
輸入tokens/百萬
輸出tokens/百萬
上下文長度
$140
$280
32
$0.14
$0.28
131
$0.7
$1.4
$0.35
Alibaba
$2
$1
MuXodious
Gemma 3n E4B IT 是谷歌推出的輕量級多模態開放模型,基於與Gemini模型相同的研究構建。該模型支持文本、音頻和視覺輸入,適用於多種任務,採用MatFormer架構實現高效參數利用。
ExaltedSlayer
Gemma 3是谷歌推出的輕量級開源多模態模型,本版本為12B參數的指令調優量化感知訓練模型,已轉換為MLX框架的MXFP4格式,支持文本和圖像輸入並生成文本輸出,具有128K上下文窗口和140+語言支持。
RiosWesley
巴西範圍路由模型是一個基於Gemma 3 270M的微調微型大語言模型,專為巴西外賣服務系統設計,可作為極快速且輕量級的意圖分類器(路由)。該模型使用Unsloth進行訓練並轉換為GGUF格式。
mradermacher
這是 vanta-research/atom-v1-preview-12b 模型的量化版本,提供多種量化類型選擇,適用於對話、協作、教育等多種場景。該模型基於 Gemma 架構,支持英語語言處理。
dogeater1612
這是一個基於Google Gemma 2 9B模型微調的荷蘭語患者模擬模型,專門為醫療教育場景設計。模型始終以固定的JSON結構響應,模擬一位剛做完手術正在康復的患者'瑪麗亞',支持護理專業學生在安全環境中鍛鍊溝通和臨床推理能力。
fibonacciai
RealRobot_chatbot_llm是基於Gemma3n架構的專業產品人工智能模型,專門在RealRobot產品目錄的專有數據集上進行了微調。該模型能夠根據企業自身的產品數據,快速創建準確、經濟高效且可部署的專業語言模型,提供高度專業化的產品問答服務。
mudasir13cs
這是一個基於Google Gemma-3-4B-IT模型微調的文本生成模型,專門用於根據演示模板元數據生成多樣化且相關的搜索查詢。該模型使用LoRA適配器進行高效微調,是結構化文檔字段自適應密集檢索框架的關鍵組成部分。
kirankumarpetlu
這是一個基於Google Gemma-2B-IT基礎模型,使用PEFT(參數高效微調)和LoRA技術進行優化的文本生成模型。該模型通過參數高效的方法在保持基礎模型能力的同時,針對特定任務進行了優化。
yanolja
YanoljaNEXT-Rosetta-27B-2511是基於Gemma3架構微調的270億參數解碼器語言模型,專門為結構化數據翻譯設計,能在保留數據結構的同時實現多語言間的高效準確翻譯。
DavidAU
這是一個基於Gemma-3模型使用內部恐怖數據集進行微調的文本生成模型,專門用於生成恐怖風格的內容。模型通過Unsloth進行調優,能夠生成從輕度到強烈程度的恐怖內容,包括長篇恐怖故事。
vanta-research
Scout是VANTA Research基於Google Gemma 3 4B Instruct架構微調的專業語言模型,在約束感知推理和自適應問題解決方面表現出色,擅長偵察式情報收集、系統問題分解和自適應解決方案生成。
Gemma 3 27B IT QAT的MLX MXFP4量化版本,是由Google開發的輕量級開源多模態模型。該模型能夠同時處理文本和圖像輸入並生成文本輸出,擁有128K大上下文窗口,支持超過140種語言,適用於多種文本生成和圖像理解任務。
Lamapi
Next 12B是基於Gemma 3的120億參數多模態視覺語言模型,是土耳其最先進的開源視覺語言模型。該模型在文本和圖像理解方面表現出色,具備先進的推理和上下文感知多模態輸出能力,特別提供專業級的土耳其語支持,同時具備廣泛的多語言能力。
dario-mazzola
這是基於Google Gemma-3模型進行專門微調的文本生成模型,經過訓練能夠利用外部工具生成逐步計劃。該模型在rewoo/planner_instruction_tuning_2k數據集上訓練,使用LoRA技術進行高效微調。
hirundo-io
這是一個基於🤗 Transformers的模型,已發佈至HuggingFace模型中心。由於模型卡片信息不完整,具體功能和應用場景需進一步確認。
lapa-llm
Lapa LLM v0.1.2是基於Gemma-3-12B開發的烏克蘭語處理開源大語言模型,專注於烏克蘭語的自然語言處理任務,在烏克蘭語處理方面表現出卓越性能。
Lambent
Mira是一個基於多個Gemma 3 27B基礎模型融合的文本生成模型,通過精心挑選的訓練數據和特定訓練方式,具備獨特的詩意文本生成能力。該模型在角色扮演和創意寫作方面表現出色,能夠根據不同的系統提示生成富有文學色彩的文本。
suayptalha
Sungur-9B是一個專門針對土耳其語優化的文本生成模型,基於Gemma-2-9b架構,通過直接偏好優化(DPO)數據集和4位QLoRA微調技術訓練而成,能夠生成流暢且符合人類偏好的土耳其語文本。
Lapa LLM 12B PT是基於Google Gemma 3-12B開發的開源大語言模型,專門針對烏克蘭語處理優化。由烏克蘭多所高校研究團隊開發,在烏克蘭語處理方面表現卓越,具備高效的指令微調和多模態能力。
Lyte
基於Gemma-3-1B模型微調的摩洛哥阿拉伯語(達裡賈語)指令模型,專門針對摩洛哥地區的問答任務進行優化,能夠有效理解和生成達裡賈語內容。
該項目展示瞭如何利用Google的ADK(代理開發工具包)和MCP(模型上下文協議)構建一個由Gemma 3驅動的YouTube搜索助手,支持自然語言查詢和格式化搜索結果。
ConsultingAgents MCP Server是一個多模型諮詢代理服務器,通過MCP協議為Claude Code提供四種AI專家諮詢服務(Darren、Sonny、Sergey、Gemma),支持代碼分析、文檔搜索和倉庫級開發規劃。