騰訊自研大模型混元2.0(Tencent HY2.0)正式發佈,與此同時,DeepSeek V3.2也逐步接入騰訊生態。目前,這兩大模型已在元寶、ima等騰訊AI原生應用中率先上線,騰訊雲也同步開放了相關模型的API及平臺服務。 全新發布的Tencent HY2.0採用混合專家(MoE)架構,總參數量高達4
歐盟委員會對Meta啓動反壟斷調查,質疑其WhatsApp Business API新政僅允許自家Meta AI接入,禁止ChatGPT等第三方AI聊天機器人使用,涉嫌濫用市場支配地位。新政規定2025年10月起禁止第三方AI聊天機器人調用API,2026年1月15日前已集成服務必須退出,豁免範圍未明確。
英偉達與香港大學聯合發佈Orchestrator模型,擁有8億參數,能協調多種工具和大型語言模型解決複雜問題。該模型在工具使用基準測試中,以更低成本實現更高準確性,並能根據用戶偏好智能選擇工具。其訓練採用名爲ToolOrchestra的新強化學習框架,旨在提升小型模型的協調能力。
日本政府正推進AI計劃,用於早期識別有自殺傾向的青少年並提供心理支持,以應對青少年自殺問題。此舉在AI負面影響討論增多背景下進行,尤其近期OpenAI因AI工具被訴可能誘導青少年自殺,引發社會對AI應用風險的廣泛關注。
基於Flux AI模型,可實現文本生成圖像和圖像編輯轉換
提供匿名24/7在線AI心理治療,支持焦慮、壓力等心理健康問題。
Tikpal是多智能體創意AI夥伴,無干擾設計,多應用集成,助力創意工作。
Noiz AI提供自然流暢的語音合成服務,應用場景豐富,生成高效。
Anthropic
$105
輸入tokens/百萬
$525
輸出tokens/百萬
200
上下文長度
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
$6
$24
256
Baidu
-
128
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
$0.8
$0.15
$1.5
32
Deepseek
$4
$12
Tencent
$1
RinggAI
這是一個專為通話記錄分析打造的混合語言AI模型,能夠處理印地語、英語和混合印地英語的通話轉錄內容。模型基於Qwen2.5-1.5B-Instruct進行微調,具備強大的多語言理解和信息提取能力。
prithivMLmods
Olmo-3-7B-Instruct-AIO-GGUF是基於Allen Institute for AI開發的Olmo-3-7B-Instruct模型的GGUF量化版本。這是一個70億參數的自迴歸語言模型,通過監督微調和直接偏好優化在Tulu 2和UltraFeedback等數據集上訓練,在問答和指令遵循方面表現出色。
bartowski
這是對ai-sage的GigaChat3-10B-A1.8B模型進行的量化處理版本,採用llama.cpp的imatrix量化技術,可在不同硬件條件下更高效地運行。模型支持俄語和英語,主要用於文本生成任務。
ubergarm
這是ai-sage/GigaChat3-10B-A1.8B-bf16模型的GGUF量化版本,提供了多種量化選項,從高精度的Q8_0到極度壓縮的smol-IQ1_KT,滿足不同硬件條件下的部署需求。該模型支持32K上下文長度,採用MLA架構,專為對話場景優化。
DevQuasar
這是 ai-sage/GigaChat3-702B-A36B-preview-bf16 模型的量化版本,旨在為大眾提供免費的知識獲取途徑。該模型是一個大型語言模型,專注於文本生成任務。
evilfreelancer
這是ai-sage/GigaChat3-10B-A1.8B模型的量化版本,採用GGUF格式,需要特定的llama.cpp分支支持。模型採用混合專家架構,總參數量約118億,其中激活參數量約18億。
VibeThinker-1.5B是微博AI推出的15億參數密集語言模型,基於Qwen2.5-Math-1.5B微調,專門針對數學和算法編碼問題設計。採用'頻譜到信號原理'框架訓練,在多個數學競賽測試中超越規模更大的模型,訓練成本約7800美元,支持最長約40k詞元的輸出。
ai-sage
GigaChat3-10B-A1.8B是GigaChat系列的對話模型,基於混合專家(MoE)架構,共有100億參數,其中18億為活躍參數。該模型採用多頭潛在注意力和多令牌預測技術,支持25.6萬令牌的長上下文,在多語言對話和推理任務中表現出色。
allenai
Olmo 3是由Allen Institute for AI開發的新一代語言模型家族,包含7B和32B的指令和思維變體。該模型在長鏈式思維方面表現出色,能顯著提升數學和編碼等推理任務的性能。所有代碼、檢查點和訓練細節都將公開,推動語言模型科學發展。
Olmo 3是由Allen Institute for AI開發的新一代語言模型系列,包含7B和32B兩種規模,有指令和思考兩種變體。該模型基於Dolma 3數據集進行預訓練,在Dolci數據集上進行後訓練,具備長鏈式思維能力,在數學和編碼等推理任務上表現優異。
GigaAM-v3是基於Conformer架構的俄語自動語音識別基礎模型,擁有2.2-2.4億參數。它是GigaAM系列的第三代模型,在70萬小時俄語語音數據上使用HuBERT-CTC目標進行預訓練,在廣泛的俄語ASR領域提供最先進的性能。
GigaChat3-10B-A1.8B-base是GigaChat系列的基礎預訓練模型,採用混合專家(MoE)架構,總參數100億,活躍參數18億。模型集成了多頭潛在注意力(MLA)和多令牌預測(MTP)技術,在推理時具備高吞吐量優勢。
XiaomiMiMo
米模具身模型(MiMo-Embodied)是一款強大的跨具身視覺語言模型,在自動駕駛和具身AI任務中均展現出了卓越的性能。它是首個將這兩個關鍵領域相結合的開源視覺語言模型,顯著提升了在動態物理環境中的理解和推理能力。
Olmo 3是由Allen Institute for AI開發的一系列語言模型,包含7B和32B兩種規模,具有指令式和思考式兩種變體。該模型在長鏈式思維方面表現出色,能有效提升數學和編碼等推理任務的性能。採用多階段訓練方式,包括有監督微調、直接偏好優化和可驗證獎勵的強化學習。
Olmo-3-7B-Think-DPO是Allen Institute for AI開發的7B參數語言模型,具有長鏈式思考能力,在數學和編碼等推理任務中表現出色。該模型經過監督微調、直接偏好優化和基於可驗證獎勵的強化學習等多階段訓練,專為研究和教育用途設計。
Olmo 3是由Allen Institute for AI (Ai2)開發的一系列語言模型,包含7B和32B兩種規格,有Instruct和Think兩種變體。該模型基於Transformer架構,具有長鏈思維能力,可有效提升數學和編碼等推理任務的表現。
Olmo 3是由Allen Institute for AI開發的開源語言模型系列,包含7B和32B兩種規格,分為指令(Instruct)和思考(Think)兩種變體。該模型具有出色的長鏈思維能力,能夠顯著提升數學和編碼等推理任務的表現。
Olmo 3是由Allen Institute for AI開發的全新語言模型家族,包含7B和32B兩種規模,有指令(Instruct)和思維(Think)兩種變體。該模型採用長鏈式思維提升數學和編碼等推理任務表現,旨在推動語言模型科學發展。
Olmo 3 7B RL-Zero Math是Allen AI開發的專為數學推理任務優化的70億參數語言模型,採用RL-Zero強化學習方法在數學數據集上進行訓練,能有效提升數學推理能力。
Olmo 3 7B RL-Zero Mix是Allen AI開發的7B參數規模的語言模型,屬於Olmo 3系列。該模型在Dolma 3數據集上進行預訓練,在Dolci數據集上進行後訓練,並通過強化學習優化數學、編碼和推理能力。
Scrapling是一個自適應網頁抓取庫,能自動學習網站變化並重新定位元素,支持多種抓取方式和AI集成,提供高性能解析和開發者友好體驗。
XcodeBuild MCP是一個為AI助手和MCP客戶端提供Xcode相關工具集成的服務器,支持Xcode項目管理、模擬器控制和應用工具等功能,實現自動化開發流程。
Refact Agent 是一個開源AI編程助手,支持多語言代碼生成、調試和優化,集成主流開發工具,可本地化部署並提供智能補全和代碼解釋功能。
iMCP是一款macOS應用,通過AI連接用戶的數字生活,支持與Claude Desktop等客戶端通過Model Context Protocol (MCP)協議交互,提供日曆、聯繫人、位置、地圖、消息、提醒和天氣等多種功能。
Klavis AI是一個開源項目,提供在Slack、Discord和Web平臺上簡單易用的MCP(模型上下文協議)服務,包括報告生成、YouTube工具、文檔轉換等多種功能,支持非技術用戶和開發者使用AI工作流。
MCP Unity是一個實現Model Context Protocol的Unity編輯器擴展,允許AI助手與Unity項目交互,提供Unity與Node.js服務器之間的橋樑。
Repomix是一個將代碼庫打包為AI友好格式的工具,支持本地和遠程倉庫處理,提供代碼壓縮、安全檢查和多種輸出格式。
Cognee是一個為AI代理提供記憶功能的開源項目,通過模塊化ECL管道構建動態知識圖譜,支持多種數據源和格式,減少幻覺並降低成本。
Deebo是一個AI調試助手,能夠加速代碼錯誤的解決過程,通過自動化調查和多線程工作流提升開發效率。
Solana Agent Kit是一個開源工具包,用於將AI代理連接到Solana協議,支持60多種區塊鏈操作。
微軟官方MCP服務器,為AI助手提供最新微軟技術文檔的搜索和獲取功能
Stripe Agent Toolkit是一個支持多種AI代理框架(如OpenAI、LangChain、CrewAI等)與Stripe API集成的工具包,提供Python和TypeScript支持,簡化支付相關操作。
MCP Unity是一個實現Model Context Protocol的Unity編輯器擴展,通過Node.js服務器橋接AI助手與Unity項目的交互,提供菜單執行、對象選擇、組件更新等功能。
Inbox Zero是一款開源AI郵件助手和客戶端,幫助用戶高效管理郵件,實現收件箱清零。
PG-MCP是一個為PostgreSQL數據庫設計的模型上下文協議服務器,提供AI代理發現、連接、查詢和理解數據庫的API,支持多數據庫連接、豐富的目錄信息和查詢解釋功能。
Browser MCP是一個MCP服務器+Chrome擴展,通過AI應用(如VS Code、Claude等)實現瀏覽器自動化操作,具有快速、隱私保護、保持登錄狀態和規避檢測等特點。
Supermemory是一個AI驅動的記憶引擎,旨在通過整合個人數據為LLM提供上下文知識,實現信息的智能管理和檢索。
hyper-mcp是一個基於WebAssembly插件的高性能MCP服務器,支持通過容器註冊表分發插件,適用於多種AI應用場景。
Desktop Commander MCP是一個讓Claude桌面應用能夠執行終端命令、管理文件系統的AI助手工具,支持代碼搜索、編輯、進程管理和遠程文件讀取等功能。
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。