蘋果曾與AI公司Anthropic洽談合作,計劃用其大模型徹底升級Siri,涉及數十億美元年費,但談判於去年夏天陷入僵局。
蘋果正加速AI佈局,計劃將新版Siri深度整合進iOS核心應用,以追趕行業步伐。此前曾祕密研發對標ChatGPT的聊天機器人,但現已調整戰略,轉向與谷歌Gemini合作。
蘋果與谷歌合作,基於Gemini架構的新版Siri將於2月下半月發佈。這是兩家巨頭AI合作的首個成果,兌現了蘋果在WWDC上的承諾。新版Siri將具備深度語境感知能力,可訪問用戶個人數據,實現更智能的交互。
頂尖機構聯合研究顯示,AI視覺推理能力仍遠落後於人類兒童。即便是領先的Gemini 3 Pro Preview,其表現僅略勝三歲幼兒,與六歲兒童認知水平仍有差距。
由Google Labs驅動,藉助Gemini與Imagen 3技術秒速創作獨特圖像作品。
複製粘貼Gemini AI照片提示及各類AI提示,滿足多樣需求
1000+精選nano banana提示詞,免費社區驅動,為Gemini Nano Banana設計
AI SEO平臺,助您在ChatGPT、Gemini等搜索引擎提升可見性和排名
Google
$0.49
輸入tokens/百萬
$2.1
輸出tokens/百萬
1k
上下文長度
Openai
$2.8
$11.2
$7.7
$30.8
200
$0.7
$17.5
$0.4
-
128
$1.75
$14
400
$8.75
$70
$56
$1.4
131
Alibaba
$2
32
Xai
$3.5
Baidu
$1
$4
64
Stepfun
$38
$120
16
MuXodious
Gemma 3n E4B IT 是谷歌推出的輕量級多模態開放模型,基於與Gemini模型相同的研究構建。該模型支持文本、音頻和視覺輸入,適用於多種任務,採用MatFormer架構實現高效參數利用。
TeichAI
本模型是基於Qwen3-4B架構的知識蒸餾模型,通過約5440萬個由Gemini 2.5 Flash生成的標記進行訓練,旨在整合Gemini-2.5 Flash的行為、推理過程和知識到單一數據集中。
prithivMLmods
Gemma 3 270M是谷歌推出的輕量級多模態模型,基於與Gemini系列相同的研究技術,支持文本和圖像輸入,具有32K上下文窗口,在問答、總結、圖像理解和代碼生成等任務上提供高質量輸出。
unsloth
Gemma 3是Google推出的輕量級、最先進的開源模型家族,基於與Gemini模型相同的研究和技術構建。該模型具有多模態處理能力,支持文本和圖像輸入,並生成文本輸出,適用於各種文本生成和圖像理解任務。
Gemma 3是谷歌推出的輕量級、最先進的開放模型家族,基於與Gemini模型相同的研究和技術構建。具有多模態處理能力,支持文本和圖像輸入,並生成文本輸出,適用於各種文本生成和圖像理解任務。
Gemma 3是谷歌推出的輕量級、最先進的開源多模態模型家族,基於與Gemini模型相同的研究和技術構建。該270M版本是經過指令調優的模型,採用量化感知訓練(QAT),能夠在顯著降低內存需求的同時保持與bfloat16相近的質量。
Gemma 3是谷歌推出的輕量級開源多模態模型系列,基於與Gemini相同技術構建。270M版本是其中最小規模模型,支持文本和圖像輸入,具備128K上下文窗口,適用於資源受限環境部署。
Gemma 3是谷歌推出的輕量級開源多模態模型家族,基於與Gemini相同的研究技術構建。270M版本是其中最小的指令微調模型,支持140多種語言,具有32K上下文長度,適用於資源受限環境下的文本生成任務。
Gemma 3是谷歌推出的輕量級、最先進的開源多模態模型家族,基於與Gemini模型相同的研究和技術構建。270M版本是其中最小的模型,能夠處理文本和圖像輸入並生成文本輸出,適用於多種文本生成和圖像理解任務。
google
Gemma 3是Google推出的輕量級、最先進的多模態開放模型家族,基於與Gemini模型相同的研究和技術構建。該模型能夠處理文本和圖像輸入並生成文本輸出,具有128K的大上下文窗口,支持超過140種語言,提供從270M到27B的多種尺寸選擇。
Gemma 3n是谷歌推出的輕量級、最先進的多模態開放模型,基於Gemini技術構建。專為低資源設備設計,支持文本、圖像、視頻和音頻輸入,生成文本輸出。採用選擇性參數激活技術,在4B參數規模下高效運行。
Gemma 3n-E2B-it 是 Google 推出的輕量級開源多模態模型,基於與 Gemini 相同技術構建,專為低資源設備優化。
Gemma 3n是Google推出的輕量級、最先進的開源多模態模型家族,基於與Gemini模型相同的研究和技術構建。支持文本、音頻和視覺輸入,適用於多種任務。
Gemma 3n是Google推出的輕量級、最先進的開源多模態模型家族,基於與Gemini模型相同的研究和技術構建,支持文本、音頻和視覺輸入。
iqbalamo93
Gemma 3是谷歌推出的輕量級多模態模型,基於與Gemini相同的技術構建。它支持文本和圖像輸入,輸出文本,適用於文本生成和圖像理解等多種任務,且模型尺寸多樣,能在資源有限的環境中部署。
Gemma 3是Google推出的輕量級開放模型系列,基於Gemini技術構建,支持多模態輸入和文本輸出。
bespokelabs
由Bespoke Labs開發的7B參數規模開源圖表理解視覺語言模型,在圖表問答任務上超越Gemini-1.5-Pro等閉源模型
Gemma 3是谷歌基於Gemini技術構建的輕量級開放模型系列,12B版本採用量化感知訓練(QAT)技術,支持多模態輸入和128K上下文窗口。
Gemma 3是谷歌推出的輕量級、最先進的開放模型家族,基於與Gemini模型相同的研究和技術構建。該27B版本採用量化感知訓練(QAT),能夠在顯著降低內存需求的同時保持與bfloat16相近的質量,具備多模態處理能力和128K大上下文窗口。
Gemma 3是Google基於Gemini技術構建的輕量級開放模型系列,支持多模態輸入和文本輸出,具有128K大上下文窗口和140+語言支持。
Zen MCP是一個多模型AI協作開發服務器,為Claude和Gemini CLI等AI編碼助手提供增強的工作流工具和跨模型上下文管理。它支持多種AI模型的無縫協作,實現代碼審查、調試、重構等開發任務,並能保持對話上下文在不同工作流間的延續。
該項目通過搭建Claude Code與Google Gemini AI的橋樑,實現在Claude Code環境中直接調用Gemini進行問答、代碼審查和創意頭腦風暴,提供便捷的AI協作工具。
一個實現Claude Desktop與Google Gemini AI模型交互的MCP服務器項目
一個基於Google Gemini API的異步對話AI服務,通過Redis隊列處理請求,提供MCP協議兼容的API接口。
MCP Tailwind Gemini Server是一個集成了Gemini AI的高級Tailwind CSS服務器,提供智能組件生成、設計優化和跨平臺支持,適用於多種開發環境和框架。
一個基於Gemini API的MCP服務器,提供AI驅動的網頁搜索和摘要服務,能夠合成信息並返回帶引用的綜合答案。
Gemini Bridge是一個輕量級MCP服務器,通過官方CLI連接AI編程助手與Google Gemini AI,支持多客戶端無API成本交互。
一個基於Google Gemini圖像生成模型的MCP服務器,允許AI代理通過文本提示生成、編輯和描述圖像,支持多種模型和配置選項。
MCP Vision Relay 是一個 MCP 服務器,通過封裝本地安裝的 Gemini 和 Qwen 命令行工具,為 Claude、Codex 等僅支持文本的 MCP 客戶端提供圖像分析能力,使其能夠處理本地路徑、URL 或 base64 編碼的圖片。
一個基於Gemini Flash 2 AI模型的數據分析與研究MCP服務器,提供數據解析、智能分析、報告生成和郵件自動發送功能。
一個基於Node.js和Gemini API的AI研究助手工具,通過Firecrawl進行網頁數據抓取,利用Gemini大模型進行深度語言理解和報告生成,支持迭代式深度研究,並可與MCP協議集成。
該項目通過MCP協議將MongoDB數據庫操作封裝為AI工具,實現Gemini AI與MongoDB的交互式終端操作。
一個與Gemini CLI工具集成的MCP服務器,提供聊天、內容生成和模型列表功能。
這是一個基於Google Gemini API的MCP服務器,提供文本對話、圖像生成和視頻生成功能,可作為Codex MCP的替代方案。
該項目是一個基於Python的多MCP服務器管理框架,通過SSE協議實現與Google Gemini API的交互,包含日曆管理和瀏覽器自動化兩大功能模塊,支持通過配置文件動態加載多個服務。
一個與AI代碼編輯器集成的MCP服務器,通過Gemini 2.5的百萬token上下文窗口和任務管理功能,優化Cursor的代理能力。
一個結合Claude Code和Google Gemini AI的MCP服務器,通過多模型協作實現深度代碼分析,Claude擅長本地上下文操作和CLI工作流,Gemini則利用其超大上下文窗口進行分佈式系統調試和長軌跡分析。
該項目是一個基於MCP協議的Gemini模型服務端,封裝了Google的Gemini API,提供文本生成、函數調用、文件處理等功能。
一個基於Google Gemini AI的MCP服務器,提供圖像、音頻和視頻識別功能,支持多種傳輸方式和客戶端集成。
OmniMind是一個開源的Python庫,旨在簡化Model Context Protocol(MCP)集成,支持AI代理、工作流和自動化開發。它提供即插即用功能,內置多種工具,並基於Google Gemini提供智能響應,適合開發者和初學者快速構建AI應用。