谷歌Gemini Live語音功能實現五大突破:實時語速調節、情緒化語氣、個性口音切換、無障礙優化及多模態整合,推動AI語音進入“擬人化2.0”時代。其超越基礎對話能力,模擬人類呼吸節奏,精準打擊ChatGPT語音模式,標誌着AI從“能聽會說”邁向“懂你所想”新階段。(140字)
谷歌計劃在德國投資約55億歐元,加速AI領域佈局,力爭主導市場。投資包括在迪岑巴赫新建數據中心,並對哈瑙現有設施增資,預計2029年前完成。這是谷歌在歐洲最大規模投資。
谷歌推出“私有AI計算”雲端系統,通過隔離環境運行AI任務,確保用戶數據安全,連谷歌自身也無法訪問。該系統基於現有隱私框架,利用TPU技術,旨在革命性保護AI處理中的數據隱私。
百度推出多模態AI模型ERNIE-4.5-VL-28B-A3B-Thinking,能深度融合圖像進行推理。該模型在多項基準測試中表現優異,有時超越谷歌Gemini2.5Pro和OpenAI GPT-5High等頂尖商業模型。雖總參數量280億,但採用路由架構,僅激活30億參數,實現輕量高效推理。
dynares利用AI為谷歌廣告生成高轉化著陸頁和廣告活動,節省廣告支出。
Banono AI藉助谷歌Nano Banana模型,可創建、編輯圖像視頻,無需應用程序。
谷歌VEO 3.1 AI視頻生成器,可創建8秒高質量帶原生音頻的視頻。
Banana Nano AI提供基於谷歌模型的AI圖像工具,可生成、轉換和增強圖像。
google
$9
輸入tokens/百萬
$72
輸出tokens/百萬
1M
上下文長度
-
8.2k
VaultGemma是谷歌推出的基於差分隱私技術預訓練的輕量級語言模型,具有強大的隱私保護能力。它採用差分隱私隨機梯度下降(DP-SGD)進行預訓練,為訓練數據提供數學隱私保證,參數少於10億,適用於多種自然語言處理任務。
prithivMLmods
Gemma 3 270M是谷歌推出的輕量級多模態模型,基於與Gemini系列相同的研究技術,支持文本和圖像輸入,具有32K上下文窗口,在問答、總結、圖像理解和代碼生成等任務上提供高質量輸出。
lmstudio-community
這是谷歌Gemma 3 270M Instruct模型的4位量化版本,使用MLX框架針對蘋果芯片進行了專門優化。該模型是一個輕量級但功能強大的語言模型,適用於各種文本生成任務,並參與了LM Studio社區模型亮點計劃。
unsloth
Gemma 3是谷歌推出的輕量級、最先進的開放模型家族,基於與Gemini模型相同的研究和技術構建。具有多模態處理能力,支持文本和圖像輸入,並生成文本輸出,適用於各種文本生成和圖像理解任務。
Gemma 3是谷歌推出的輕量級、最先進的開源多模態模型家族,基於與Gemini模型相同的研究和技術構建。該270M版本是經過指令調優的模型,採用量化感知訓練(QAT),能夠在顯著降低內存需求的同時保持與bfloat16相近的質量。
Gemma 3是谷歌推出的輕量級開源多模態模型系列,基於與Gemini相同技術構建。270M版本是其中最小規模模型,支持文本和圖像輸入,具備128K上下文窗口,適用於資源受限環境部署。
Gemma 3是谷歌推出的輕量級開源多模態模型家族,能夠處理文本和圖像輸入並生成文本輸出。具有128K大上下文窗口,支持140多種語言,適用於文本生成和圖像理解等多種任務。
Gemma 3是谷歌推出的輕量級開源多模態模型家族,基於與Gemini相同的研究技術構建。270M版本是其中最小的指令微調模型,支持140多種語言,具有32K上下文長度,適用於資源受限環境下的文本生成任務。
Gemma 3是谷歌推出的輕量級、最先進的開源多模態模型家族,基於與Gemini模型相同的研究和技術構建。270M版本是其中最小的模型,能夠處理文本和圖像輸入並生成文本輸出,適用於多種文本生成和圖像理解任務。
onnx-community
Gemma 3是谷歌推出的輕量級、最先進的開源多模態模型家族,支持140多種語言,具備文本生成和圖像理解能力。270M參數版本專為資源受限環境設計,可在筆記本電腦、臺式機等設備上部署。
Gemma 3是谷歌推出的輕量級、最先進的多模態開放模型家族,能夠處理文本和圖像輸入並生成文本輸出。具有128K大上下文窗口,支持超過140種語言,提供從270M到27B多種規模選擇,適用於各種文本生成和圖像理解任務。
ericrisco
醫療Gemma-3N是基於谷歌Gemma-3N-4B模型專門針對緊急醫療援助和離線醫療應用進行微調的版本。該模型在86,667個醫療問答對上進行訓練,專注於提供準確的急救指導和醫療諮詢,特別適用於網絡連接有限的緊急情況。
Gemma 3n是谷歌推出的輕量級、最先進的多模態開放模型,基於Gemini技術構建。專為低資源設備設計,支持文本、圖像、視頻和音頻輸入,生成文本輸出。採用選擇性參數激活技術,在4B參數規模下高效運行。
谷歌推出的社區模型,適用於多種圖像文本到文本轉換任務,針對蘋果芯片優化
T5Gemma是谷歌推出的輕量級且強大的編解碼器研究模型家族,通過將僅解碼器模型改編為編解碼器架構,實現了質量與效率的良好平衡。該模型適用於多種生成任務,可在資源有限的環境中部署。
T5Gemma是谷歌推出的輕量級編碼器-解碼器研究模型家族,通過將預訓練的僅解碼器模型改編為編碼器-解碼器架構,在質量和效率之間實現了更好的平衡。該模型支持多種生成和判別任務,適用於資源有限的環境部署。
T5Gemma是谷歌推出的輕量級編碼器-解碼器研究模型家族,通過將僅解碼器的預訓練模型改編為編碼器-解碼器架構,實現了質量與效率的良好平衡。該模型適用於多種生成和判別任務,支持英文處理。
T5Gemma是谷歌推出的輕量級且強大的編解碼器研究模型家族,通過將僅解碼器模型改編為編解碼器架構,繼承了基礎能力並在質量與效率間取得良好平衡。該模型適用於多種生成任務,編碼器也可用於判別任務,能在資源有限的環境中部署。
T5Gemma是谷歌推出的輕量級編解碼器研究模型家族,通過將預訓練的僅解碼器模型轉換為編解碼器架構,實現了質量與效率的平衡。該模型適用於多種生成任務,編碼器也可用於判別任務,能在資源有限的環境中部署。
T5Gemma是谷歌推出的輕量級且強大的編碼器-解碼器研究模型家族,適用於多種生成和判別任務。
一個實現模型上下文協議(MCP)的服務端概念驗證項目,為AI助手提供自定義工具和資源增強能力,包括文檔搜索、網頁爬取和谷歌搜索API集成功能。
一個提供谷歌搜索和網頁內容查看功能的MCP服務器,具備高級反機器人檢測規避能力,包含搜索過濾、緩存、瀏覽器池管理等特性。
PageSpeed MCP服務器是一個連接AI助手與谷歌PageSpeed Insights API的橋樑,為AI模型提供網站性能分析功能,包括核心性能指標、SEO評估、可訪問性審計和資源優化建議。
Google Calendar MCP服務是一個通過Claude Desktop與谷歌日曆交互的工具,支持自然語言指令創建和管理日程事件。
基於MCP協議的谷歌學術搜索與分析工具,提供論文搜索、學者主頁分析功能,支持與MCP客戶端及Cherry Studio集成。
一個用於網頁即時研究的MCP服務器,集成谷歌搜索、網頁內容提取、研究會話跟蹤和截圖功能,幫助Claude獲取即時網絡信息。
一個為Claude設計的網頁研究服務,集成谷歌搜索和內容提取功能
一個基於MCP平臺的本地代理服務器和客戶端實現,集成天氣查詢、谷歌搜索、攝像頭控制、圖片生成和智能對話等多種AI工具功能,支持模塊化擴展和高性能併發處理。
一個用於爬取LeetCode討論區面試題目的工具,特別關注谷歌面試題,支持按月份整理數據並導出為CSV和Google表格。
一個提供谷歌搜索和網頁內容查看功能的MCP服務器,具備高級反爬蟲規避技術
一個結合AI助手與谷歌日曆的智能待辦事項應用,支持自然語言交互和多語言操作,提供任務管理和日程同步功能。
PageSpeed MCP服務器是一個連接AI助手與谷歌PageSpeed Insights API的橋樑,提供網站性能分析功能。
一個用於網頁研究的MCP服務器,集成谷歌搜索、網頁內容提取、會話跟蹤和截圖功能,幫助Claude進行即時信息檢索。
一個基於Serper API的MCP服務器,提供谷歌搜索功能和AI深度研究工具,支持可配置搜索參數、多級研究深度和結果質量監控。
一個無需API密鑰的谷歌搜索MCP服務,提供結構化網頁搜索結果
G2N MCP谷歌日曆SSE服務器是一個實現Model Context Protocol的服務器,通過Server-Sent Events提供谷歌日曆集成功能,支持AI模型和應用程序管理日曆事件。
一個基於MCP協議的服務器,提供西班牙薩拉戈薩市電車、公交和公共自行車系統的即時到站信息及站點查詢服務,整合了DNDzgz API和谷歌地圖功能。
一個提供蘋果和谷歌應用商店市場情報分析的MCP服務
一個集成了LangChain、自定義MCP服務器和谷歌Gemini AI模型的聊天平臺,提供增強的對話功能。
GemForge是將谷歌Gemini AI與MCP生態系統連接的企業級工具,提供即時網絡訪問、高級推理、代碼分析和多文件處理等功能,支持60多種文件格式,具備智能模型選擇和強大的錯誤處理機制。