谷歌AI助手NotebookLM推出"Slide Decks"功能,可將用戶上傳資料自動生成專業演示文稿,效果優於Gemini App。該功能被贊爲PPT和Canva的潛在替代者,引發行業關注。
谷歌推出Nano Banana Pro圖像生成模型,基於Gemini3技術,支持4K分辨率、14對象融合和5人身份一致性,新增聯網搜索與雙重水印。價格大幅上調:1080p/2K每張0.139美元,4K每張0.24美元,較前代漲3-6倍。功能亮點包括專業控制選項(如機位、光效)和默認生成6張高保真圖片供選擇。
谷歌在印度推出兩項AI反詐功能:基於Gemini Nano的本地實時通話詐騙檢測(僅限Pixel9+機型),以及聯合金融App的屏幕共享警報(支持Android11+設備),通過語音分析和一鍵切斷共享,防範OTP泄露等詐騙風險。
Google推出新功能,Gemini用戶可通過詢問“這張圖片是AI生成的嗎?”快速識別由Google AI工具創作或編輯的圖片。未來計劃擴展至視頻和音頻驗證,並可能整合到搜索等服務中。目前該功能主要依賴Google自有技術實現。
Google的AI原生文檔工具,自動更新代碼文檔,支持Gemini聊天與導航
可同時使用ChatGPT、Gemini等多模型,節省3 - 4倍時間,提升200%效率
免費視頻生成器,支持文本和圖像轉視頻,有多樣模型和效果
專業AI圖像與視頻生成平臺,用多種AI工具打造驚豔視覺效果。
google
$9
輸入tokens/百萬
$72
輸出tokens/百萬
1M
上下文長度
$2.16
$18
$0.72
$2.88
-
2M
perplexity
127k
200k
$0.58
mradermacher
這是 vanta-research/atom-v1-preview-12b 模型的量化版本,提供多種量化類型選擇,適用於對話、協作、教育等多種場景。該模型基於 Gemma 架構,支持英語語言處理。
dogeater1612
這是一個基於Google Gemma 2 9B模型微調的荷蘭語患者模擬模型,專門為醫療教育場景設計。模型始終以固定的JSON結構響應,模擬一位剛做完手術正在康復的患者'瑪麗亞',支持護理專業學生在安全環境中鍛鍊溝通和臨床推理能力。
fibonacciai
RealRobot_chatbot_llm是基於Gemma3n架構的專業產品人工智能模型,專門在RealRobot產品目錄的專有數據集上進行了微調。該模型能夠根據企業自身的產品數據,快速創建準確、經濟高效且可部署的專業語言模型,提供高度專業化的產品問答服務。
geoffmunn
這是Qwen/Qwen3-Coder-30B-A3B-Instruct語言模型的GGUF量化版本,專門針對代碼生成和編程任務優化,採用FP32精度轉換,適用於本地推理部署。
kirankumarpetlu
這是一個基於Google Gemma-2B-IT基礎模型,使用PEFT(參數高效微調)和LoRA技術進行優化的文本生成模型。該模型通過參數高效的方法在保持基礎模型能力的同時,針對特定任務進行了優化。
yanolja
YanoljaNEXT-Rosetta-27B-2511是基於Gemma3架構微調的270億參數解碼器語言模型,專門為結構化數據翻譯設計,能在保留數據結構的同時實現多語言間的高效準確翻譯。
noctrex
Gelato-30B-A3B是針對GUI計算機使用任務進行微調的最先進(SOTA)模型,提供了量化版本以優化部署效率。該模型專門設計用於理解和處理圖形用戶界面相關的任務。
DavidAU
這是一個基於Gemma-3模型使用內部恐怖數據集進行微調的文本生成模型,專門用於生成恐怖風格的內容。模型通過Unsloth進行調優,能夠生成從輕度到強烈程度的恐怖內容,包括長篇恐怖故事。
vanta-research
Scout是VANTA Research基於Google Gemma 3 4B Instruct架構微調的專業語言模型,在約束感知推理和自適應問題解決方面表現出色,擅長偵察式情報收集、系統問題分解和自適應解決方案生成。
Genie-AI-Lab
Omni L1B3RT4S GENIE 是一個基於Qwen2.5-3B Instruct架構微調的AI助手,採用1,103個精靈角色的定製示例進行訓練,具備獨特的語音和忠誠度模式,能夠為用戶提供別具一格的對話體驗。
GatorBarbarian
TRELLIS Text XL是一個大型3D生成模型,是TRELLIS的文本條件版本,模型大小為XL。該模型基於論文《Structured 3D Latents for Scalable and Versatile 3D Generation》提出,能夠根據文本描述生成高質量的3D內容。
ExaltedSlayer
Gemma 3 27B IT QAT的MLX MXFP4量化版本,是由Google開發的輕量級開源多模態模型。該模型能夠同時處理文本和圖像輸入並生成文本輸出,擁有128K大上下文窗口,支持超過140種語言,適用於多種文本生成和圖像理解任務。
Lamapi
Next 12B是基於Gemma 3的120億參數多模態視覺語言模型,是土耳其最先進的開源視覺語言模型。該模型在文本和圖像理解方面表現出色,具備先進的推理和上下文感知多模態輸出能力,特別提供專業級的土耳其語支持,同時具備廣泛的多語言能力。
dario-mazzola
這是基於Google Gemma-3模型進行專門微調的文本生成模型,經過訓練能夠利用外部工具生成逐步計劃。該模型在rewoo/planner_instruction_tuning_2k數據集上訓練,使用LoRA技術進行高效微調。
hirundo-io
這是一個基於🤗 Transformers的模型,已發佈至HuggingFace模型中心。由於模型卡片信息不完整,具體功能和應用場景需進一步確認。
mlfoundations-cua-dev
OLGA是基於Qwen3-VL-30B-A3B-Instruct構建的在線強化學習定位代理,採用33億激活參數的專家混合模型。通過結合現有數據集、新數據收集、自動過濾和在線強化學習的新數據配方進行訓練,在開源模型中實現了先進的定位性能。
mlfoundations
Gelato-30B-A3B 是一款用於GUI計算機使用任務的最先進基礎模型,在Click-100k數據集上訓練,在多個基準測試中超越了之前的專業計算機基礎模型和更大的視覺語言模型。
lapa-llm
Lapa LLM v0.1.2是基於Gemma-3-12B開發的烏克蘭語處理開源大語言模型,專注於烏克蘭語的自然語言處理任務,在烏克蘭語處理方面表現出卓越性能。
Lambent
Mira是一個基於多個Gemma 3 27B基礎模型融合的文本生成模型,通過精心挑選的訓練數據和特定訓練方式,具備獨特的詩意文本生成能力。該模型在角色扮演和創意寫作方面表現出色,能夠根據不同的系統提示生成富有文學色彩的文本。
suayptalha
Sungur-9B是一個專門針對土耳其語優化的文本生成模型,基於Gemma-2-9b架構,通過直接偏好優化(DPO)數據集和4位QLoRA微調技術訓練而成,能夠生成流暢且符合人類偏好的土耳其語文本。
Genkit是一個用於構建AI驅動應用的開源框架,提供Node.js和Go庫,支持多種AI模型和向量數據庫集成,包含開發工具和插件生態系統。
Zen MCP是一個多模型AI協作開發服務器,為Claude和Gemini CLI等AI編碼助手提供增強的工作流工具和跨模型上下文管理。它支持多種AI模型的無縫協作,實現代碼審查、調試、重構等開發任務,並能保持對話上下文在不同工作流間的延續。
MCP Toolbox for Databases是一個開源數據庫MCP服務器,專注於企業級和生產質量,簡化工具開發,提供連接池、認證等複雜功能。
一個基於FAL AI的Logo生成服務器,提供圖像生成、背景去除和自動縮放功能。
Unreal Engine生成式AI支持插件,集成多種前沿LLM/GenAI模型API,提供遊戲開發中的AI集成層支持,包括OpenAI、Claude、Deepseek等模型的聊天、結構化輸出等功能,並支持Model Control Protocol(MCP)實現場景對象控制、藍圖生成等高級功能。
該項目通過搭建Claude Code與Google Gemini AI的橋樑,實現在Claude Code環境中直接調用Gemini進行問答、代碼審查和創意頭腦風暴,提供便捷的AI協作工具。
一個實現Claude Desktop與Google Gemini AI模型交互的MCP服務器項目
Gemini Bridge是一個輕量級MCP服務器,通過官方CLI連接AI編程助手與Google Gemini AI,支持多客戶端無API成本交互。
一個與Gemini CLI工具集成的MCP服務器,提供聊天、內容生成和模型列表功能。
基於MCP協議的地理處理服務器,提供座標系轉換和空間計算功能
MCProto是一個Ruby gem,用於將MCP服務器與Ruby代碼鏈式組合,構建自定義解決方案。它支持創建多個服務器實例,並通過鏈式調用實現功能組合。
GIS數據轉換MCP服務器,為LLM提供地理數據格式轉換工具,支持WKT/GeoJSON/CSV/TopoJSON/KML等多種格式互轉及反向地理編碼功能。
一個基於Gemini Flash 2 AI模型的數據分析與研究MCP服務器,提供數據解析、智能分析、報告生成和郵件自動發送功能。
MCP Git Commit Generator是一個基於Model Context Protocol的工具,能夠根據git暫存的變更自動生成符合Conventional Commits規範的提交信息。支持多種安裝方式(uvx、PyPI、Docker)和多種MCP客戶端配置,提供自動提交信息生成、git狀態檢查等功能,幷包含開發者工具和調試支持。
該項目通過MCP協議將MongoDB數據庫操作封裝為AI工具,實現Gemini AI與MongoDB的交互式終端操作。
這是一個基於Next.js框架的項目,使用create-next-app初始化,支持多種包管理器運行開發服務器,並集成了Vercel的Geist字體優化。
一個基於Google Gemini API的異步對話AI服務,通過Redis隊列處理請求,提供MCP協議兼容的API接口。
一個基於MCP SDK和Crawl4AI的生產級潛在客戶生成系統,支持多源數據聚合、智能緩存和高效併發處理,實現從發現到豐富的全生命週期管理。
一個基於Gemini API的MCP服務器,提供AI驅動的網頁搜索和摘要服務,能夠合成信息並返回帶引用的綜合答案。
該項目展示瞭如何利用Google的ADK(代理開發工具包)和MCP(模型上下文協議)構建一個由Gemma 3驅動的YouTube搜索助手,支持自然語言查詢和格式化搜索結果。