微軟Azure ND GB300v6虛擬機在Llama270B模型上創下每秒110萬token推理速度新紀錄。該成就基於與英偉達的深度合作,採用配備72個Blackwell Ultra GPU和36個Grace CPU的NVIDIA GB300NVL72系統,突顯微軟在規模化AI運算領域的專業實力。
現代汽車與英偉達深化合作,共建基於Blackwell架構的AI工廠。雙方在CES上宣佈聯合開發自動駕駛、智能工廠及機器人技術項目,獲韓國政府支持,並將在2025年APEC韓國峯會上詳述。
字節跳動AI編程工具Trae宣佈,因服務中斷將停止支持Claude模型。爲補償Pro會員,平臺將在2026年1月31日前,每月額外提供50%快速請求額度,使會員每月可享300次快速請求。此舉旨在緩解服務調整帶來的影響。
谷歌Gemma模型因誤傳美國參議員布萊克本的虛假信息引發爭議,被指誹謗。谷歌於10月31日宣佈將Gemma3模型從AI Studio平臺撤下,以防止誤解。目前該模型僅通過API可用,AI Studio上已無法訪問。
一鍵生成高質量視頻,輕鬆實現創意。
即時文本轉語音,帶有笑聲和情感。
MailAI是AI郵件助手,實現自動化管理,每週省10+小時,提升300%生產力。
Your360 AI藉助語音AI實現360反饋,將同行見解轉化為職業發展計劃。
xai
$21.6
輸入tokens/百萬
$108
輸出tokens/百萬
256k
上下文長度
$2.16
$3.6
1M
nvidia
-
128k
deepseek
$3.96
$15.77
alibaba
$0.72
131.1k
anthropic
200k
$0.86
$1.3
upstage
64k
mistral
perplexity
127k
tencent
$18
32k
$2.88
Clemylia
Lam-3是Lamina系列的一個小型語言模型(SLM),基於Clemylia/lamina-suite-pretrain進行微調。該模型能夠回答問題,具有創造性,但有時回答可能比較奇特。模型從零開始創建,在包含1358個問答對的Clem27sey/Nacid數據集上訓練了3小時。
catalystsec
本項目是使用 mlx-lm 庫通過動態權重量化(DWQ)將 MiniMax-M2 模型量化為 3 位的成果。它能夠在資源受限的條件下,高效地進行文本生成任務,為相關應用提供了更輕量級的解決方案。
vanta-research
Scout是VANTA Research基於Google Gemma 3 4B Instruct架構微調的專業語言模型,在約束感知推理和自適應問題解決方面表現出色,擅長偵察式情報收集、系統問題分解和自適應解決方案生成。
mlx-community
這是MiniMax-M2模型的MLX格式轉換版本,使用mlx-lm 0.28.1從原始模型轉換而來,支持8位量化和分組大小為32的優化配置,專為Apple Silicon設備優化運行。
ByteDance
Ouro-2.6B是一款擁有26億參數的循環語言模型,通過迭代共享權重計算實現了卓越的參數效率,在僅用26億參數的情況下達到了30-40億標準Transformer模型的性能水平。
Ouro-1.4B是由字節跳動開發的具有14億參數的循環語言模型,通過迭代共享權重計算實現了卓越的參數效率,僅用14億參數就達到了30-40億標準Transformer模型的性能水平。
GatorBarbarian
TRELLIS Text XL是一個大型3D生成模型,是TRELLIS的文本條件版本,模型大小為XL。該模型基於論文《Structured 3D Latents for Scalable and Versatile 3D Generation》提出,能夠根據文本描述生成高質量的3D內容。
Wraith-8B是VANTA研究實體系列的首個模型,基於Meta的Llama 3.1 8B Instruct進行微調。該模型在數學推理方面表現卓越,在GSM8K基準測試中準確率達到70%,同時具備獨特的宇宙智能視角,能為多種應用場景提供強大支持。
QuantTrio
MiniMax-M2-AWQ是基於MiniMaxAI/MiniMax-M2模型的量化版本,通過vLLM框架實現高效的文本生成。該模型採用AWQ量化技術,在保持模型性能的同時顯著減少內存佔用和提升推理速度,支持32K上下文長度和工具調用功能。
Lamapi
Next 12B是基於Gemma 3的120億參數多模態視覺語言模型,是土耳其最先進的開源視覺語言模型。該模型在文本和圖像理解方面表現出色,具備先進的推理和上下文感知多模態輸出能力,特別提供專業級的土耳其語支持,同時具備廣泛的多語言能力。
nightmedia
這是一個基於Qwen3-Coder-REAP-25B-A3B的量化版本,專門為Mac設備優化。採用Deckard(qx)公式進行量化,嵌入層、頭部和選擇性注意力路徑使用6位量化,其餘部分使用5位量化,以32為分組大小,在保持接近q8量化質量的同時實現更高效的運行。
noctrex
P1 - 30B - A3B是一個300億參數的大語言模型,經過MXFP4_MOE量化處理,在保持模型性能的同時優化了推理效率,適用於文本生成任務。
Wwayu
這是一個基於GLM-4.6架構的混合專家模型,使用REAP方法對專家進行了40%的均勻剪枝,參數量為218B,並轉換為MLX格式的3位量化版本,適用於蘋果芯片設備高效運行。
yueqis
這是基於Qwen-Coder-14B模型在網絡數據集上進行微調的版本,專門針對網絡數據場景優化,相比基礎版本在特定網絡任務中表現更優。模型經過3個epochs的訓練,學習率為5e-5。
這是阿里巴巴通義深度研究30B-A3B模型的量化版本,採用MXFP4_MOE量化技術並額外添加imatrix量化,旨在優化模型性能和資源使用效率,適用於文本生成任務。
Nanbeige
Nanbeige4-3B-Thinking是第四代Nanbeige大語言模型家族中的30億參數推理模型,通過提升數據質量和訓練方法實現了先進的推理能力。該模型在數學、科學、創意寫作、工具使用等多個領域表現出色,支持多階段課程學習和強化學習訓練。
mlfoundations-cua-dev
OLGA是基於Qwen3-VL-30B-A3B-Instruct構建的在線強化學習定位代理,採用33億激活參數的專家混合模型。通過結合現有數據集、新數據收集、自動過濾和在線強化學習的新數據配方進行訓練,在開源模型中實現了先進的定位性能。
這是一個基於Qwen3-VL-32B-Thinking模型轉換的4位量化版本,專門針對MLX框架優化。該模型是一個32B參數規模的多模態視覺語言模型,具備思維鏈推理能力,能夠同時處理圖像和文本輸入,生成高質量的文本響應。
bartowski
這是inclusionAI的Ling-mini-2.0模型的量化版本,使用llama.cpp的imatrix技術進行量化處理,提供了從32.54GB的BF16到4.66GB的IQ2_XS等多種量化選項,可在多種硬件環境中高效運行。
maomao0819
BEVANet是一個專為即時語義分割設計的深度學習模型,在Cityscapes等數據集上表現出色,在RTX3090上實現了81.0%的mIoU和32.8FPS的優異性能,平衡了精度與速度的需求。
BlenderMCP通過MCP協議將Blender與Claude AI連接,實現AI輔助3D建模與場景控制
302AI BrowserUse MCP Server是一個基於AI的瀏覽器自動化服務器,通過Model Context Protocol (MCP)實現自然語言控制瀏覽器和網絡研究。
Blender MCP VXAI 是一個強大的集成工具,允許用戶通過自然語言控制 Blender,實現 3D 建模、動畫和場景的創建與修改。它簡化了複雜操作,並支持即時導出到項目中。
Tripo MCP Server是一個連接AI助手與Tripo AI的接口項目,支持通過自然語言生成3D資產並導入Blender。
Awesome MCP Servers 是一個全面的Model Context Protocol (MCP)服務器集合,涵蓋了7158個MCP服務器,分為33個類別,包括AI集成、藝術媒體、瀏覽器自動化、雲服務、數據庫、開發者工具、文件系統、金融、遊戲、硬件、醫療、基礎設施、知識管理、位置地圖、市場營銷、監控、多媒體處理、操作系統、項目管理、科學研究、安全、社交媒體、旅行交通、實用工具和版本控制等。
一個支持多鏈交互的EVM兼容區塊鏈服務MCP服務器,提供統一的區塊鏈操作接口,支持30+網絡和ENS解析。
FreeCAD MCP是一個通過Claude Desktop控制FreeCAD的插件,支持從2D圖紙創建3D模型等多種設計功能。
Lokka是一個基於模型-上下文-協議(MCP)的服務器,用於通過自然語言操作Microsoft Graph和Azure RM API,實現對Azure和Microsoft 365租戶的查詢與管理。
RhinoMCP是一個連接Rhino 3D建模軟件與AI代理的工具,通過Model Context Protocol實現雙向交互,支持3D對象操作、文檔檢查和腳本執行。
Tripo MCP Server是一個連接AI助手與Tripo AI的接口工具,支持通過自然語言生成3D資產並導入Blender。
Trellis MCP是一個連接AI助手與Trellis 3D生成模型的接口服務,支持通過自然語言快速生成3D資產並導入Blender。該項目基於開源模型,需自行部署API後端,具有快速、免費的特點,但存在穩定性風險。
MCP 3D打印機服務器是一個連接Claude與多種3D打印機管理系統的中間件,支持OctoPrint、Klipper、Duet等主流平臺,提供打印機控制、文件管理及高級STL模型處理功能。
MCP STL 3D浮雕生成器是一個將2D圖像轉換為3D浮雕模型的工具,支持控制模型尺寸、添加基座和深度反轉等功能,適合3D打印和渲染。
brain-trust是一個MCP服務器,通過3個簡單工具連接IDE與OpenAI,提供智能問答和結構化計劃評審功能,支持Docker部署和多種IDE集成
HoudiniMCP是一個連接Houdini與Claude AI的第三方集成工具,通過MCP協議實現AI輔助3D創作。
Payload CMS 3.0 MCP服務器是一個專為Payload CMS開發設計的模型上下文協議服務器,提供代碼驗證、模板生成和項目腳手架功能,幫助開發者遵循最佳實踐構建應用。
該項目展示瞭如何利用Google的ADK(代理開發工具包)和MCP(模型上下文協議)構建一個由Gemma 3驅動的YouTube搜索助手,支持自然語言查詢和格式化搜索結果。
360 AI 雲盤 MCP 服務為AI模型提供標準化的雲盤文件管理能力,支持多種接入方式和豐富的文件操作功能。
一個基於Spring Boot 3和Java 24的OAuth2授權服務器項目,支持GraalVM原生鏡像、CRaC檢查點恢復、本地AI模型測試及Docker部署。
SketchupMCP通過模型上下文協議(MCP)將Sketchup與Claude AI連接,實現雙向通信和3D建模控制。