字節跳動Seed AI團隊發佈數學推理模型Seed Prover1.5,在國際數學奧林匹克競賽中表現優異,獲得金牌。該模型基於Scaling Law理論,僅用16.5小時便解決IMO2025前五題,僅失一題,以35分達到金牌標準,成績與谷歌Gemini相當,相比此前模型效率大幅提升。
Waymo正測試將谷歌Gemini大模型集成到無人駕駛出租車中,打造名爲“Waymo出行助手”的車載AI伴侶。一份長達1200多行的內部指令曝光,顯示該AI被設計爲安全、剋制、高度場景化的乘客服務引擎。
Waymo正測試在無人駕駛出租車中集成谷歌Gemini AI助手,旨在打造一位全程陪伴、答疑解惑的“虛擬管家”。根據代碼顯示,Waymo爲助手製定了長達1200多行的系統指令,要求其保持友善、貼心且不打擾乘客。
近日,Google Gemini和OpenAI的ChatGPT等生成式AI工具被曝遭惡意利用,用戶通過特定提示詞繞過安全審查,將正常照片中的女性篡改爲暴露的“深僞”圖像。相關教程曾在Reddit等平臺傳播,引發對AI安全邊界的擔憂。
AI SEO平臺,助您在ChatGPT、Gemini等搜索引擎提升可見性和排名
一站式管理Claude Code、Codex CLI和Gemini CLI,優化AI開發工作流
免費AI檢測器,可驗證文本真偽,識別ChatGPT、Gemini等模型內容
基於Gemini 3 Pro圖像預覽技術的專業AI圖像生成器,免費上手
Google
$0.49
輸入tokens/百萬
$2.1
輸出tokens/百萬
1k
上下文長度
$0.7
$2.8
$17.5
Chatglm
-
128
$8
$16
$2
$140
$280
32
$8.75
$70
Alibaba
131
MuXodious
Gemma 3n E4B IT 是谷歌推出的輕量級多模態開放模型,基於與Gemini模型相同的研究構建。該模型支持文本、音頻和視覺輸入,適用於多種任務,採用MatFormer架構實現高效參數利用。
ExaltedSlayer
Gemma 3是谷歌推出的輕量級開源多模態模型,本版本為12B參數的指令調優量化感知訓練模型,已轉換為MLX框架的MXFP4格式,支持文本和圖像輸入並生成文本輸出,具有128K上下文窗口和140+語言支持。
RiosWesley
巴西範圍路由模型是一個基於Gemma 3 270M的微調微型大語言模型,專為巴西外賣服務系統設計,可作為極快速且輕量級的意圖分類器(路由)。該模型使用Unsloth進行訓練並轉換為GGUF格式。
mradermacher
這是 vanta-research/atom-v1-preview-12b 模型的量化版本,提供多種量化類型選擇,適用於對話、協作、教育等多種場景。該模型基於 Gemma 架構,支持英語語言處理。
dogeater1612
這是一個基於Google Gemma 2 9B模型微調的荷蘭語患者模擬模型,專門為醫療教育場景設計。模型始終以固定的JSON結構響應,模擬一位剛做完手術正在康復的患者'瑪麗亞',支持護理專業學生在安全環境中鍛鍊溝通和臨床推理能力。
TeichAI
本模型是基於Qwen3-4B架構的知識蒸餾模型,通過約5440萬個由Gemini 2.5 Flash生成的標記進行訓練,旨在整合Gemini-2.5 Flash的行為、推理過程和知識到單一數據集中。
fibonacciai
RealRobot_chatbot_llm是基於Gemma3n架構的專業產品人工智能模型,專門在RealRobot產品目錄的專有數據集上進行了微調。該模型能夠根據企業自身的產品數據,快速創建準確、經濟高效且可部署的專業語言模型,提供高度專業化的產品問答服務。
mudasir13cs
這是一個基於Google Gemma-3-4B-IT模型微調的文本生成模型,專門用於根據演示模板元數據生成多樣化且相關的搜索查詢。該模型使用LoRA適配器進行高效微調,是結構化文檔字段自適應密集檢索框架的關鍵組成部分。
kirankumarpetlu
這是一個基於Google Gemma-2B-IT基礎模型,使用PEFT(參數高效微調)和LoRA技術進行優化的文本生成模型。該模型通過參數高效的方法在保持基礎模型能力的同時,針對特定任務進行了優化。
yanolja
YanoljaNEXT-Rosetta-27B-2511是基於Gemma3架構微調的270億參數解碼器語言模型,專門為結構化數據翻譯設計,能在保留數據結構的同時實現多語言間的高效準確翻譯。
DavidAU
這是一個基於Gemma-3模型使用內部恐怖數據集進行微調的文本生成模型,專門用於生成恐怖風格的內容。模型通過Unsloth進行調優,能夠生成從輕度到強烈程度的恐怖內容,包括長篇恐怖故事。
vanta-research
Scout是VANTA Research基於Google Gemma 3 4B Instruct架構微調的專業語言模型,在約束感知推理和自適應問題解決方面表現出色,擅長偵察式情報收集、系統問題分解和自適應解決方案生成。
Gemma 3 27B IT QAT的MLX MXFP4量化版本,是由Google開發的輕量級開源多模態模型。該模型能夠同時處理文本和圖像輸入並生成文本輸出,擁有128K大上下文窗口,支持超過140種語言,適用於多種文本生成和圖像理解任務。
Lamapi
Next 12B是基於Gemma 3的120億參數多模態視覺語言模型,是土耳其最先進的開源視覺語言模型。該模型在文本和圖像理解方面表現出色,具備先進的推理和上下文感知多模態輸出能力,特別提供專業級的土耳其語支持,同時具備廣泛的多語言能力。
dario-mazzola
這是基於Google Gemma-3模型進行專門微調的文本生成模型,經過訓練能夠利用外部工具生成逐步計劃。該模型在rewoo/planner_instruction_tuning_2k數據集上訓練,使用LoRA技術進行高效微調。
hirundo-io
這是一個基於🤗 Transformers的模型,已發佈至HuggingFace模型中心。由於模型卡片信息不完整,具體功能和應用場景需進一步確認。
lapa-llm
Lapa LLM v0.1.2是基於Gemma-3-12B開發的烏克蘭語處理開源大語言模型,專注於烏克蘭語的自然語言處理任務,在烏克蘭語處理方面表現出卓越性能。
Lambent
Mira是一個基於多個Gemma 3 27B基礎模型融合的文本生成模型,通過精心挑選的訓練數據和特定訓練方式,具備獨特的詩意文本生成能力。該模型在角色扮演和創意寫作方面表現出色,能夠根據不同的系統提示生成富有文學色彩的文本。
suayptalha
Sungur-9B是一個專門針對土耳其語優化的文本生成模型,基於Gemma-2-9b架構,通過直接偏好優化(DPO)數據集和4位QLoRA微調技術訓練而成,能夠生成流暢且符合人類偏好的土耳其語文本。
Lapa LLM 12B PT是基於Google Gemma 3-12B開發的開源大語言模型,專門針對烏克蘭語處理優化。由烏克蘭多所高校研究團隊開發,在烏克蘭語處理方面表現卓越,具備高效的指令微調和多模態能力。
Zen MCP是一個多模型AI協作開發服務器,為Claude和Gemini CLI等AI編碼助手提供增強的工作流工具和跨模型上下文管理。它支持多種AI模型的無縫協作,實現代碼審查、調試、重構等開發任務,並能保持對話上下文在不同工作流間的延續。
該項目通過搭建Claude Code與Google Gemini AI的橋樑,實現在Claude Code環境中直接調用Gemini進行問答、代碼審查和創意頭腦風暴,提供便捷的AI協作工具。
一個實現Claude Desktop與Google Gemini AI模型交互的MCP服務器項目
MCProto是一個Ruby gem,用於將MCP服務器與Ruby代碼鏈式組合,構建自定義解決方案。它支持創建多個服務器實例,並通過鏈式調用實現功能組合。
MCP Tailwind Gemini Server是一個集成了Gemini AI的高級Tailwind CSS服務器,提供智能組件生成、設計優化和跨平臺支持,適用於多種開發環境和框架。
一個基於Google Gemini API的異步對話AI服務,通過Redis隊列處理請求,提供MCP協議兼容的API接口。
一個基於Gemini Flash 2 AI模型的數據分析與研究MCP服務器,提供數據解析、智能分析、報告生成和郵件自動發送功能。
該項目展示瞭如何利用Google的ADK(代理開發工具包)和MCP(模型上下文協議)構建一個由Gemma 3驅動的YouTube搜索助手,支持自然語言查詢和格式化搜索結果。
一個基於Gemini API的MCP服務器,提供AI驅動的網頁搜索和摘要服務,能夠合成信息並返回帶引用的綜合答案。
一個與Gemini CLI工具集成的MCP服務器,提供聊天、內容生成和模型列表功能。
Gemini Bridge是一個輕量級MCP服務器,通過官方CLI連接AI編程助手與Google Gemini AI,支持多客戶端無API成本交互。
一個基於Node.js和Gemini API的AI研究助手工具,通過Firecrawl進行網頁數據抓取,利用Gemini大模型進行深度語言理解和報告生成,支持迭代式深度研究,並可與MCP協議集成。
一個基於Google Gemini圖像生成模型的MCP服務器,允許AI代理通過文本提示生成、編輯和描述圖像,支持多種模型和配置選項。
該項目通過MCP協議將MongoDB數據庫操作封裝為AI工具,實現Gemini AI與MongoDB的交互式終端操作。
MCP Vision Relay 是一個 MCP 服務器,通過封裝本地安裝的 Gemini 和 Qwen 命令行工具,為 Claude、Codex 等僅支持文本的 MCP 客戶端提供圖像分析能力,使其能夠處理本地路徑、URL 或 base64 編碼的圖片。
該項目是一個基於Python的多MCP服務器管理框架,通過SSE協議實現與Google Gemini API的交互,包含日曆管理和瀏覽器自動化兩大功能模塊,支持通過配置文件動態加載多個服務。
一個基於Google Gemini AI的MCP服務器,提供圖像、音頻和視頻識別功能,支持多種傳輸方式和客戶端集成。
該項目是一個基於MCP協議的Gemini模型服務端,封裝了Google的Gemini API,提供文本生成、函數調用、文件處理等功能。
一個與AI代碼編輯器集成的MCP服務器,通過Gemini 2.5的百萬token上下文窗口和任務管理功能,優化Cursor的代理能力。
OmniMind是一個開源的Python庫,旨在簡化Model Context Protocol(MCP)集成,支持AI代理、工作流和自動化開發。它提供即插即用功能,內置多種工具,並基於Google Gemini提供智能響應,適合開發者和初學者快速構建AI應用。