阿里雲在5月20日峯會上宣佈,其大模型服務平臺“百鍊”強化開放生態,接入多家第三方頂尖模型,覆蓋文本、圖像、視頻及多模態生成等領域。此舉標誌着百鍊從阿里自研“千問”模型的展示臺,轉型爲涵蓋全行業主流模型的“AI模型超級市場”,首批接入的模型矩陣豐富多元。
網易有道發佈“子曰”大模型4.0,全面邁入全模態時代,實現文本、圖片、音頻高效融合交互。該版本以全量開源爲核心,向開發者社區開放核心技術,旨在降低AI落地成本與門檻。核心突破包括全模態融合交互、深層重構等維度,推動AI生態發展。
谷歌正對搜索引擎進行重大改革,旨在將傳統關鍵詞搜索升級爲更智能、互動的體驗。新推出的“智能搜索框”由Gemini 3.5 Flash模型驅動,支持對話式交互,使搜索平臺成爲生成式AI工具的入口,類似與聊天機器人交流。
谷歌在AI模式搜索中測試新型廣告格式,利用Gemini模型爲贊助產品生成“自定義解釋器”,直接向用戶解釋購買理由,如“緊湊型意式咖啡膠囊機”示例。此舉緊隨發佈更大對話性查詢搜索框之後,標誌着Gemini能力深度融入核心廣告領域。
利用先進AI模型將創意轉化為專業視頻,編輯完善實現創意控制。
由Gemini Omni Flash驅動的多模態AI視頻生成器,支持多形式創作編輯。
AI驅動,快速生成TikTok、YouTube Shorts和Reels無臉視頻,無模板無影子封禁
SeedanceGen可基於文本、圖像等生成Seedance AI視頻,支持多模型。
Google
$0.49
輸入tokens/百萬
$2.1
輸出tokens/百萬
1k
上下文長度
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
$6
$24
$2
$20
$4
$16
Baidu
128
Bytedance
$1.2
$3.6
4
$8
$240
52
RinggAI
這是一個專為通話記錄分析打造的混合語言AI模型,能夠處理印地語、英語和混合印地英語的通話轉錄內容。模型基於Qwen2.5-1.5B-Instruct進行微調,具備強大的多語言理解和信息提取能力。
prithivMLmods
Olmo-3-7B-Instruct-AIO-GGUF是基於Allen Institute for AI開發的Olmo-3-7B-Instruct模型的GGUF量化版本。這是一個70億參數的自迴歸語言模型,通過監督微調和直接偏好優化在Tulu 2和UltraFeedback等數據集上訓練,在問答和指令遵循方面表現出色。
bartowski
這是對ai-sage的GigaChat3-10B-A1.8B模型進行的量化處理版本,採用llama.cpp的imatrix量化技術,可在不同硬件條件下更高效地運行。模型支持俄語和英語,主要用於文本生成任務。
ubergarm
這是ai-sage/GigaChat3-10B-A1.8B-bf16模型的GGUF量化版本,提供了多種量化選項,從高精度的Q8_0到極度壓縮的smol-IQ1_KT,滿足不同硬件條件下的部署需求。該模型支持32K上下文長度,採用MLA架構,專為對話場景優化。
DevQuasar
這是 ai-sage/GigaChat3-702B-A36B-preview-bf16 模型的量化版本,旨在為大眾提供免費的知識獲取途徑。該模型是一個大型語言模型,專注於文本生成任務。
evilfreelancer
這是ai-sage/GigaChat3-10B-A1.8B模型的量化版本,採用GGUF格式,需要特定的llama.cpp分支支持。模型採用混合專家架構,總參數量約118億,其中激活參數量約18億。
VibeThinker-1.5B是微博AI推出的15億參數密集語言模型,基於Qwen2.5-Math-1.5B微調,專門針對數學和算法編碼問題設計。採用'頻譜到信號原理'框架訓練,在多個數學競賽測試中超越規模更大的模型,訓練成本約7800美元,支持最長約40k詞元的輸出。
allenai
Olmo 3是由Allen Institute for AI開發的新一代語言模型家族,包含7B和32B的指令和思維變體。該模型在長鏈式思維方面表現出色,能顯著提升數學和編碼等推理任務的性能。所有代碼、檢查點和訓練細節都將公開,推動語言模型科學發展。
Olmo 3是由Allen Institute for AI開發的新一代語言模型系列,包含7B和32B兩種規模,有指令和思考兩種變體。該模型基於Dolma 3數據集進行預訓練,在Dolci數據集上進行後訓練,具備長鏈式思維能力,在數學和編碼等推理任務上表現優異。
XiaomiMiMo
米模具身模型(MiMo-Embodied)是一款強大的跨具身視覺語言模型,在自動駕駛和具身AI任務中均展現出了卓越的性能。它是首個將這兩個關鍵領域相結合的開源視覺語言模型,顯著提升了在動態物理環境中的理解和推理能力。
Olmo 3是由Allen Institute for AI開發的一系列語言模型,包含7B和32B兩種規模,具有指令式和思考式兩種變體。該模型在長鏈式思維方面表現出色,能有效提升數學和編碼等推理任務的性能。採用多階段訓練方式,包括有監督微調、直接偏好優化和可驗證獎勵的強化學習。
Olmo-3-7B-Think-DPO是Allen Institute for AI開發的7B參數語言模型,具有長鏈式思考能力,在數學和編碼等推理任務中表現出色。該模型經過監督微調、直接偏好優化和基於可驗證獎勵的強化學習等多階段訓練,專為研究和教育用途設計。
Olmo 3是由Allen Institute for AI (Ai2)開發的一系列語言模型,包含7B和32B兩種規格,有Instruct和Think兩種變體。該模型基於Transformer架構,具有長鏈思維能力,可有效提升數學和編碼等推理任務的表現。
Olmo 3是由Allen Institute for AI開發的開源語言模型系列,包含7B和32B兩種規格,分為指令(Instruct)和思考(Think)兩種變體。該模型具有出色的長鏈思維能力,能夠顯著提升數學和編碼等推理任務的表現。
Olmo 3是由Allen Institute for AI開發的全新語言模型家族,包含7B和32B兩種規模,有指令(Instruct)和思維(Think)兩種變體。該模型採用長鏈式思維提升數學和編碼等推理任務表現,旨在推動語言模型科學發展。
Olmo 3 7B RL-Zero Math是Allen AI開發的專為數學推理任務優化的70億參數語言模型,採用RL-Zero強化學習方法在數學數據集上進行訓練,能有效提升數學推理能力。
Olmo 3 7B RL-Zero Mix是Allen AI開發的7B參數規模的語言模型,屬於Olmo 3系列。該模型在Dolma 3數據集上進行預訓練,在Dolci數據集上進行後訓練,並通過強化學習優化數學、編碼和推理能力。
DakkaWolf
Trouper-12B GGUF是由DarwinAnim8or基於原始模型開發的文本生成模型,專門針對角色扮演和創意寫作場景進行了優化。該模型從Mistral-Nemo-Base-12B微調而來,使用了自定義的'Actors'數據集進行訓練,生成的文本更加自然,避免了常見的'AI語言'特徵。
Olmo-3-32B-Think-DPO是Allen AI開發的32B參數語言模型,採用直接偏好優化(DPO)訓練,具備長鏈式思維推理能力,在數學、編碼等複雜推理任務上表現優異。
這是一個基於Moonshot AI技術的量化版本模型,專注於視覺語言理解與生成任務,致力於降低知識獲取門檻,讓知識為每個人所用。
XcodeBuild MCP是一個為AI助手和MCP客戶端提供Xcode相關工具集成的服務器,支持Xcode項目管理、模擬器控制和應用工具等功能,實現自動化開發流程。
Klavis AI是一個開源項目,提供在Slack、Discord和Web平臺上簡單易用的MCP(模型上下文協議)服務,包括報告生成、YouTube工具、文檔轉換等多種功能,支持非技術用戶和開發者使用AI工作流。
assistant-ui是一個開源TypeScript/React庫,用於快速構建生產級AI聊天界面,提供可組合的UI組件、流式響應、無障礙訪問等功能,支持多種AI後端和模型。
一個MCP服務器,將AI模型與WinDbg/CDB集成,用於分析Windows崩潰轉儲文件和進行遠程調試,支持自然語言交互執行調試命令。
Cognee是一個為AI代理提供記憶功能的開源項目,通過模塊化ECL管道構建動態知識圖譜,支持多種數據源和格式,減少幻覺並降低成本。
PG-MCP是一個為PostgreSQL數據庫設計的模型上下文協議服務器,提供AI代理發現、連接、查詢和理解數據庫的API,支持多數據庫連接、豐富的目錄信息和查詢解釋功能。
Genkit是一個用於構建AI驅動應用的開源框架,提供Node.js和Go庫,支持多種AI模型和向量數據庫集成,包含開發工具和插件生態系統。
HiveChat是一個專為中小團隊設計的AI聊天應用,支持多種大模型服務商,提供分組管理、Token限額、第三方登錄等功能。
UnityMCP是一個Unity編輯器插件,實現模型上下文協議(MCP),提供Unity與AI助手的無縫集成,包括即時狀態監控、遠程命令執行和日誌功能。
OpenSumi 是一個幫助快速構建 AI 原生 IDE 產品的框架,支持雲端和桌面端開發環境,提供豐富的示例項目和模板。
Supabase MCP Server是一個連接Supabase項目與AI助手的工具,通過Model Context Protocol(MCP)標準化大型語言模型(LLMs)與外部服務的交互,實現數據庫管理、配置獲取和數據查詢等功能。
微軟官方MCP服務器集合,提供Azure、GitHub、Microsoft 365、Fabric等多種服務的AI助手集成工具,支持本地和遠程部署,幫助開發者通過標準化協議連接AI模型與各類數據源和工具。
OpenDia是一款開源瀏覽器擴展工具,允許AI模型直接控制用戶瀏覽器,利用現有登錄狀態、書籤等數據進行自動化操作,支持多種瀏覽器和AI模型,注重隱私保護。
Zen MCP是一個多模型AI協作開發服務器,為Claude和Gemini CLI等AI編碼助手提供增強的工作流工具和跨模型上下文管理。它支持多種AI模型的無縫協作,實現代碼審查、調試、重構等開發任務,並能保持對話上下文在不同工作流間的延續。
wcgw是一個MCP服務器項目,集成了Shell和代碼編輯工具,允許AI在本地機器上執行命令、讀寫文件、編輯代碼等操作。它提供了多種模式(如架構師模式、代碼編寫模式等),支持任務檢查點保存、終端交互、語法檢查等功能,適用於代碼開發、問題排查等場景。
Apify MCP服務器是一個基於模型上下文協議(MCP)的工具,允許AI助手通過數千個現成的爬蟲、抓取器和自動化工具(Apify Actor)從社交媒體、搜索引擎、電商等網站提取數據。它支持OAuth和Skyfire代理支付,可通過HTTPS端點或本地stdio方式集成到Claude、VS Code等MCP客戶端中。
MCP Atlassian是一個為Atlassian產品(Confluence和Jira)設計的模型上下文協議服務器,支持雲端和本地部署,提供AI助手集成功能。
Claude Context是一個MCP插件,通過語義代碼搜索為AI編程助手提供整個代碼庫的深度上下文,支持多種嵌入模型和向量數據庫,實現高效代碼檢索。
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Vestige是一個基於認知科學的AI記憶引擎,通過實現預測誤差門控、FSRS-6間隔重複、記憶夢境等29個神經科學模塊,為AI提供長期記憶能力。包含3D可視化儀表板和21個MCP工具,完全本地運行,無需雲端。