Reverie公司發佈新款語音轉文本模型,支持印地語、英語及Hinglish混合語言,適應印度多語言環境。該模型已處理300萬次API調用,在銀行和呼叫中心等行業應用中展現出高精確度和快速響應能力。
約翰・霍普金斯大學推出EGO-Prompt框架,顯著提升小型語言模型在醫療、交通等專業任務中的表現,性能提高近50%,成本降低83%。該框架通過優化提示詞設計,融入專業知識,使小模型媲美大型推理模型,解決了專業領域AI應用的關鍵挑戰。
蘋果發佈Xcode 26.1.1版本,支持Swift 6.2.1並優化多項功能。更新重點修復漏洞,提升AI編碼助手性能,顯著改善內存使用效率,尤其在處理大型Git項目時表現更佳。
字節跳動推出Doubao-Seed-Code編程模型,在性能、價格和遷移成本上實現突破。該模型兼容Claude API,具備高效代碼生成能力,可簡化網頁開發。通過與TRAE開發環境深度集成,能以更快速度和更高準確性解決編程問題,在SWE-Bench驗證中表現優異。
全球唯一全自動化、性能優化的網紅市場平臺
高性能 PDF 轉 MS Office 轉換庫,支持多種格式。
高性能KVM VPS,30秒部署,香港及美西可用,功能豐富
提供高性能GPU出租服務,包括B200、H200、RTX4090、H100等型號。即時部署,價格透明。
openai
$7.92
輸入tokens/百萬
$31.68
輸出tokens/百萬
200k
上下文長度
chatglm
$0.43
$1.01
131.1k
$108
$432
minimax
-
1M
google
$2.16
$18
128k
xai
$21.6
mistral
anthropic
$540
$1080
$2.88
$11.52
$14.4
$57.6
baidu
$4
$16
deepseek
$3.6
$15.48
upstage
64k
unsloth
aquif-3.5系列是2025年11月3日發佈的巔峰之作,包含Plus和Max兩個版本,提供先進的推理能力和前所未有的100萬標記上下文窗口,在各自類別中實現了最先進的性能。
Qwen3-Coder-REAP-363B-A35B是通過REAP方法對Qwen3-Coder-480B-A35B-Instruct進行25%專家剪枝得到的稀疏混合專家模型,在保持接近原模型性能的同時顯著降低了參數規模和內存需求,特別適用於資源受限的代碼生成和智能編碼場景。
noctrex
這是 aquif-3.5-Plus-30B-A3B 模型的 MXFP4_MOE 量化版本,通過量化技術顯著降低了模型資源佔用,同時保持了相近的性能表現,具有較高的工程實踐價值。
慧慧Qwen3-VL-8B指令消融模型的量化版本,專門用於圖像文本到文本的轉換任務。該模型基於Qwen3-VL-8B架構,經過指令消融優化和量化處理,可在保持性能的同時降低計算資源需求。
這是一個基於Huihui-Qwen3-VL-4B-Instruct-abliterated模型的量化版本,專門用於圖像文本到文本的轉換任務,通過量化處理優化了模型性能,為多模態應用提供支持。
catalystsec
本項目對MiniMax-M2模型進行4位量化處理,使用DWQ(動態權重量化)方法,藉助mlx-lm庫達成。該模型是MiniMax-M2的輕量化版本,在保持較好性能的同時大幅減小模型體積。
anikifoss
本項目是對MiniMax-M2模型進行的高質量HQ4_K量化,專門針對文本生成任務優化,特別適用於對話場景。該量化版本未使用imatrix,保持了模型的性能表現。
本項目是對Qwen3-Coder-30B-A3B-Instruct模型進行MXFP4_MOE量化的成果,將上下文大小從256k擴展到1M,為代碼生成和編程任務提供了更優化的模型版本,具有提升性能和節省資源的價值。
bartowski
這是英偉達Qwen3-Nemotron-32B-RLBFF大語言模型的GGUF量化版本,使用llama.cpp工具進行多種精度量化,提供從BF16到IQ2_XXS共20多種量化選項,適用於不同硬件配置和性能需求。
BAAI
Emu3.5是北京智源人工智能研究院開發的原生多模態模型,能夠跨視覺和語言聯合預測下一狀態,實現連貫的世界建模和生成。通過端到端預訓練和大規模強化學習後訓練,在多模態任務中展現出卓越性能。
Minthy
這是一個基於RouWei-0.8的實驗性預訓練模型,採用16通道潛在空間架構,使用Flux自動編碼器。該模型旨在以較低計算成本實現更精細的圖像細節,同時保留原有模型的知識和性能。
mradermacher
這是Qwen3-VL-8B-Abliterated-Caption-it模型的靜態量化版本,支持多語言圖像描述任務,提供多種量化級別選擇,平衡性能與資源需求。
本項目是基於Qwen3-VL-32B-Instruct模型的llama.cpp GGUF量化版本,提供多種量化類型以滿足不同硬件和性能需求。使用特定數據集結合imatrix選項進行量化,保證量化質量,支持在線重新打包權重以提高ARM和AVX機器的性能。
moonshotai
Kimi Linear是一種高效混合線性注意力架構,在短上下文、長上下文和強化學習場景中均優於傳統全注意力方法。它通過Kimi Delta Attention (KDA)機制優化注意力計算,顯著提升性能和硬件效率,特別擅長處理長達100萬令牌的長上下文任務。
alenphilip
這是一款專門用於Python代碼審查的AI模型,基於Qwen2.5-7B-Instruct微調,能夠識別安全漏洞、性能問題並提供代碼質量改進建議。
woodBorjo
本模型是基於facebook/mask2former-swin-tiny-coco-instance在qubvel-hf/ade20k-mini數據集上進行微調的實例分割模型。該模型專門針對ADE20K-mini數據集中的場景理解任務進行了優化,在實例分割任務上表現出良好的性能。
這是對internlm的JanusCoder-8B模型進行量化處理的版本,採用llama.cpp的imatrix量化技術,在保證性能的前提下顯著減少模型的存儲和計算資源需求,使模型能夠在更多設備上高效運行。
這是Qwen3-Yoyo-V4-42B-A3B-Thinking-TOTAL-RECALL模型的MXFP4_MOE量化版本,專門針對文本生成任務進行了優化。該模型基於42B參數的大語言模型架構,通過量化技術降低計算和存儲需求,同時保持較好的性能表現。
ByteDance
Ouro-2.6B是一款擁有26億參數的循環語言模型,通過迭代共享權重計算實現了卓越的參數效率,在僅用26億參數的情況下達到了30-40億標準Transformer模型的性能水平。
Ouro-1.4B是由字節跳動開發的具有14億參數的循環語言模型,通過迭代共享權重計算實現了卓越的參數效率,僅用14億參數就達到了30-40億標準Transformer模型的性能水平。
MongoDB Lens是一個本地MCP服務器,通過自然語言與LLM交互實現對MongoDB數據庫的全面操作,包括查詢、聚合、性能優化等。
MCP-PostgreSQL-Ops是一個專業的PostgreSQL數據庫操作和監控MCP服務器,支持PostgreSQL 12-17版本,提供全面的數據庫分析、性能監控和智能維護建議,通過自然語言查詢實現數據庫管理。
MCPBench是一個用於評估MCP服務器性能的框架,支持Web搜索和數據庫查詢兩種任務的評估,兼容本地和遠程服務器,主要評估準確性、延遲和令牌消耗。
一個提供NPM包文檔和元數據查詢的MCP服務,支持本地緩存提升性能。
MCP pytest集成服務,提供測試會話記錄、結果跟蹤和性能分析功能
一個用於查詢New Relic日誌的MCP服務器,支持通過NRQL查詢語言與LLM模型(如Claude)交互,提供日誌查詢、錯誤分析和性能監控功能。
英雄聯盟模擬對戰預測器,提供基於歷史數據的召喚師分析和AI驅動的10階段對戰模擬,支持多語言和性能比較。
Umami Analytics MCP Server是一個增強Claude能力的模型上下文協議服務器,提供對Umami網站分析數據的訪問,支持用戶行為分析和網站性能跟蹤。
MyMCP是一個基於Python的應用程序,支持通過Aider工具並行執行多個AI編碼任務,提供並行/順序執行選擇、詳細報告和性能比較功能。
TurboVault是一個生產級的MCP服務器,將Obsidian知識庫轉換為由AI驅動的智能知識系統,提供44個專業工具用於筆記的讀寫、搜索、分析和管理,具有亞100毫秒的性能表現。
PageSpeed MCP服務器是一個連接AI助手與谷歌PageSpeed Insights API的橋樑,為AI模型提供網站性能分析功能,包括核心性能指標、SEO評估、可訪問性審計和資源優化建議。
該項目是基於UnityMCP的改進版本,專注於通過AI輔助開發VRChat世界,提供了增強的命令執行、編輯器集成、腳本測試和性能優化等功能,特別支持UdonSharp腳本生成。
Lighthouse MCP Server是一個基於Google Lighthouse的模型上下文協議服務器,提供全面的網站性能審計和分析功能,包括性能評分、可訪問性檢查、SEO分析和安全評估。
一個提供Google PageSpeed Insights分析的MCP服務器,幫助AI模型通過標準化接口分析網頁性能。
TikTok廣告API的MCP服務器,提供廣告活動管理、性能分析和創意管理等功能,支持OAuth認證和完整廣告操作流程
一個基於AI的NPM包分析MCP服務器,提供即時安全掃描、依賴分析、性能評估等功能,集成Claude和Anthropic AI技術,優化npm生態管理。
Scout Monitoring MCP是一個本地運行的MCP服務器,通過Docker鏡像讓AI助手能夠訪問Scout應用性能監控數據,包括錯誤追蹤、性能指標和代碼級分析,幫助AI直接修復代碼中的性能問題。
一個全面的Stacks區塊鏈MCP服務器,提供30多個專業工具用於Clarity智能合約開發、SIP標準合規、安全性和性能優化,支持完整的dApp開發流程。
NPM Sentinel MCP是一個基於AI的NPM包分析服務器,提供即時安全掃描、依賴分析、性能評估等功能,支持與Claude和Anthropic AI集成,優化NPM生態管理。
MCP Analytics Middleware 是一個用於跟蹤和可視化 MCP 服務器使用情況的工具,提供性能監控、錯誤追蹤和即時數據分析功能。