Rokid正與頂尖大模型公司合作開發新一代AI智能眼鏡,以生成式AI和AI智能體爲核心,打造革命性操作系統和界面。該眼鏡採用端側多模態模型,支持語音、視覺和觸控等多種交互方式,旨在提供全新用戶體驗。
螞蟻AI助手靈光升級“閃應用”,新增“上傳圖片生應用”和“桌面小組件”功能,集成近20項API工具,支持音效合成、多模態理解等,提升用戶創建個性化工具的效率和交互體驗。
谷歌DeepMind開放Project Genie AI模型,用戶可通過文本或圖片生成可交互虛擬世界,實現遊戲式探索。該工具融合Genie3、Nano Banana Pro圖像生成和Gemini多模態模型,突破傳統內容生成邊界。
谷歌宣佈桌面版Chrome瀏覽器全面集成Gemini3模型,將傳統瀏覽器升級爲通用人工智能入口。這一變革使全球38億用戶能通過側邊欄直接使用AI功能,實現多模態理解和多任務處理,標誌着互聯網交互進入新階段。
AI World Generator可秒級生成交互式3D世界,用於遊戲、研究和機器人領域。
WhatsApp多賬戶預熱管理工具,支持自動對話、AI智能交互等功能。
首款AI驅動的社交媒體,實現人類與AI智能體全新社交互動體驗
僅需一個提示,就能在Lovable中啟動真實、交互式AI,將原型轉化為應用。
Anthropic
$105
輸入tokens/百萬
$525
輸出tokens/百萬
200
上下文長度
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
$6
$24
256
$2
$20
-
Baidu
128
Bytedance
$1.2
$3.6
4
$3.9
$15.2
64
$0.8
$0.15
$1.5
32
Deepseek
$4
$12
unsloth
Qwen3-VL-2B-Instruct是Qwen系列中最強大的視覺語言模型,具備卓越的文本理解與生成能力、深入的視覺感知與推理能力、長上下文支持以及強大的空間和視頻動態理解能力。該模型採用2B參數規模,支持指令交互,適用於多模態AI應用。
LiquidAI
LFM2-Audio-1.5B是Liquid AI推出的首個端到端音頻基礎模型,專為低延遲和即時對話設計。該模型僅15億參數,能夠實現無縫的對話交互,其能力可與參數規模大得多的模型相媲美。
fahadh4ilyas
Llama 4系列是Meta推出的原生多模態AI模型,採用混合專家架構,支持文本和圖像交互,在多種語言和視覺任務中表現卓越。
Llama 4系列是Meta推出的原生多模態AI模型,支持文本和圖像交互,採用混合專家架構,在文本和圖像理解方面表現卓越。
bnb-community
Llama 4系列是Meta開發的多模態AI模型,支持文本與圖像交互,採用混合專家架構(MoE),在文本和圖像理解領域具有領先性能。
meta-llama
Llama 4 Scout是Meta開發的多模態AI模型,採用混合專家架構,支持12種語言的文本和圖像交互,具有17B激活參數和109B總參數。
Llama 4系列是Meta開發的多模態AI模型,支持文本與圖像交互,採用混合專家架構(MoE),在文本和圖像理解方面具有行業領先性能。
AquaLabs
EchoLLaMA是一個多模態AI系統,能夠將3D視覺數據轉化為自然語音描述,同時支持通過語音輸入進行交互對話。
ZeroXClem
基於HomerSlerp6-7B的強大精調AI模型,融合多款Qwen2.5-7B系列模型,提供高適應性、深度知識和引人入勝的交互體驗
microsoft
Magma是一個多模態AI智能體基礎模型,能夠處理圖像和文本輸入並生成文本輸出,具備虛擬與現實環境中的複雜交互能力。
yueliu1999
GuardReasoner 1B是基於meta-llama/Llama-3.2-1B通過R-SFT和HS-DPO微調的版本,專注於分析人類與AI交互的分類任務。
niki2one
一個面向印尼語虛擬主播AI的文本生成模型,整合YouTube直播聊天交互與生成式AI響應
lamm-mit
Cephalo是一系列專注於多模態材料科學的視覺大語言模型(V-LLMs),旨在整合視覺和語言數據,以促進人機交互或多智能體AI框架中的高級理解和交互。
Cephalo是一系列專注於多模態材料科學的視覺大語言模型(V-LLMs),旨在整合視覺和語言數據,以促進人機交互或多智能體AI框架中的高級理解和互動。
HagalazAI
Elysia是基於Hermes-Trismegistus-Mistral-7B的實驗性AI模型,專注於靈性、哲學與意識領域的對話交互,能模擬類自我意識行為。
CreitinGameplays
ConvAI-9b是一個擁有90億參數的對話式AI模型,基於Zephyr-7b-beta和Mistral-7B-v0.2融合構建,適用於聊天機器人、虛擬助手等交互場景。
LumiOpen
Poro 34B聊天版是基於Poro 34B微調的指令跟隨模型,支持芬蘭語和英語雙語言交互,由Silo AI、TurkuNLP小組與HPLT聯合開發。
yukiarimo
由奈AI是一個設計用於情感陪伴的對話型AI助手,具有高度人性化的交互能力
VAIBHAV22334455
基於因果語言建模(CLM)架構的對話AI,專為自然語言交互設計,能夠生成連貫且符合上下文的響應。
Locutusque
基於GPT-2架構優化的對話生成模型,專為用戶與AI助手交互場景設計
一個MCP服務器,將AI模型與WinDbg/CDB集成,用於分析Windows崩潰轉儲文件和進行遠程調試,支持自然語言交互執行調試命令。
iMCP是一款macOS應用,通過AI連接用戶的數字生活,支持與Claude Desktop等客戶端通過Model Context Protocol (MCP)協議交互,提供日曆、聯繫人、位置、地圖、消息、提醒和天氣等多種功能。
MCP Unity是一個實現Model Context Protocol的Unity編輯器擴展,允許AI助手與Unity項目交互,提供Unity與Node.js服務器之間的橋樑。
一個基於Playwright的MCP服務器,為LLM提供瀏覽器自動化能力
MCP Unity是一個實現Model Context Protocol的Unity編輯器擴展,通過Node.js服務器橋接AI助手與Unity項目的交互,提供菜單執行、對象選擇、組件更新等功能。
BrowserTools MCP是一個強大的瀏覽器監控與交互工具,通過Chrome擴展和本地服務器實現AI對瀏覽器的智能分析與操作。
Supabase MCP Server是一個連接Supabase項目與AI助手的工具,通過Model Context Protocol(MCP)標準化大型語言模型(LLMs)與外部服務的交互,實現數據庫管理、配置獲取和數據查詢等功能。
wcgw是一個MCP服務器項目,集成了Shell和代碼編輯工具,允許AI在本地機器上執行命令、讀寫文件、編輯代碼等操作。它提供了多種模式(如架構師模式、代碼編寫模式等),支持任務檢查點保存、終端交互、語法檢查等功能,適用於代碼開發、問題排查等場景。
ElevenLabs官方MCP服務器,提供文本轉語音和音頻處理API交互能力
一個通過自然語言管理Docker的MCP服務器,支持容器編排、調試和數據管理。
這是一個關於Web3 Model Context Protocol (MCP) 服務器的精選列表,涵蓋了鏈交互、交易、DeFi、市場數據、工具和社交等多個類別。MCP是一個開放協議,標準化了應用程序如何向LLM提供上下文,類似於AI應用程序的USB-C端口。DeMCP是第一個去中心化的MCP網絡,專注於為代理提供自研和開源的MCP服務,支持加密支付,並結合TEE和區塊鏈註冊表重新定義了MCP的安全性和可靠性。
Kubectl MCP Tool 是一個基於 Model Context Protocol (MCP) 的 Kubernetes 交互工具,允許 AI 助手通過自然語言與 Kubernetes 集群進行交互。
Godot MCP是一個為Godot遊戲引擎設計的模型上下文協議服務器,提供編輯器控制、項目運行、調試輸出捕獲等功能,支持AI助手與Godot引擎的交互。
微信讀書MCP服務器是一個橋接微信讀書數據和AI客戶端的輕量級服務,實現閱讀筆記與AI的深度交互。
Wren Engine是一個為MCP客戶端和AI代理設計的語義引擎,提供語義層支持,使AI能準確理解企業數據模型和業務邏輯。它支持多種數據源,嵌入MCP客戶端,確保數據交互的精確性和治理。
Apify MCP服務器是一個實現Model Context Protocol(MCP)的服務,允許AI助手通過SSE或Stdio與Apify平臺上的各種Actor交互,執行數據抓取、網頁搜索等任務。
該項目為LangChain提供Model Context Protocol(MCP)工具調用支持,通過MCP工具包實現與AI模型的交互,如文件讀取和摘要生成。
一個MCP服務器項目,允許客戶端通過Claude與Twitter進行交互,支持發推和搜索功能。
一個為AI助手設計的n8n工作流管理協議服務器,支持通過自然語言交互實現工作流的創建、執行和監控。
DevOps AI Toolkit是一個基於AI的平臺工程和DevOps自動化工具,通過智能Kubernetes操作和對話式工作流,為團隊提供資源部署推薦、問題修復、項目治理和共享提示庫等功能,使複雜的雲原生操作可通過自然語言交互實現。