谷歌正祕密測試其Gemini Flash系列新成員Nano Banana2Flash,該模型由科技博主MarsForTech曝光,是谷歌目前速度最快的生成式AI圖像模型,旨在提供更實惠、高效的視覺生成體驗。不過,它在推理深度、細節精確度及處理複雜創意任務方面存在性能上限。
Meta旗下Llama系列AI模型曾備受好評,但2025年4月推出的Llama4引發信任危機。Meta宣傳其基準測試表現優秀,但開發者實測發現性能遠低於宣傳,外界懷疑Meta在測試中可能採取了不當手段。
Meta AI發佈Pixio圖像模型,通過改進MAE框架,證明簡單訓練路徑在深度估計和3D重建等任務中性能卓越,挑戰了MAE遜於DINOv2等複雜算法的傳統認知。
初創公司Resemble AI發佈開源語音模型“Chatterbox Turbo”,挑戰行業巨頭。該模型僅需5秒音頻即可克隆語音,延遲低至150毫秒,適用於實時AI代理、客服、遊戲角色等場景,性能顯著提升。
一個API連接所有頂尖AI模型,高性能且性價比高,支持多類型生成。
Didoo AI將鏈接轉化為高性能Meta廣告,精準定位買家並持續優化。
Flux.2 AI圖像生成器,支持文生圖、圖生圖,質量高、性能快。
Snowglobe幫助AI團隊在規模上測試LLM應用。在推出之前模擬真實對話,發現風險並提高模型性能。
Openai
$2.8
輸入tokens/百萬
$11.2
輸出tokens/百萬
1k
上下文長度
Anthropic
$105
$525
200
Google
$0.7
$7
$35
$2.1
$17.5
$21
Alibaba
$1
$10
256
$6
$24
$4
$16
Baidu
-
128
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
$0.8
$0.15
$1.5
allenai
Olmo 3是由Allen Institute for AI開發的新一代語言模型家族,包含7B和32B的指令和思維變體。該模型在長鏈式思維方面表現出色,能顯著提升數學和編碼等推理任務的性能。所有代碼、檢查點和訓練細節都將公開,推動語言模型科學發展。
XiaomiMiMo
米模具身模型(MiMo-Embodied)是一款強大的跨具身視覺語言模型,在自動駕駛和具身AI任務中均展現出了卓越的性能。它是首個將這兩個關鍵領域相結合的開源視覺語言模型,顯著提升了在動態物理環境中的理解和推理能力。
Olmo 3是由Allen Institute for AI開發的一系列語言模型,包含7B和32B兩種規模,具有指令式和思考式兩種變體。該模型在長鏈式思維方面表現出色,能有效提升數學和編碼等推理任務的性能。採用多階段訓練方式,包括有監督微調、直接偏好優化和可驗證獎勵的強化學習。
alenphilip
這是一款專門用於Python代碼審查的AI模型,基於Qwen2.5-7B-Instruct微調,能夠識別安全漏洞、性能問題並提供代碼質量改進建議。
pnnbao-ump
VieNeu-TTS是首個可在個人設備上運行的越南語文本轉語音模型,具備即時語音克隆能力。基於NeuTTS Air微調,能夠生成自然逼真的越南語語音,在CPU上具備即時性能。
TheStageAI
TheWhisper-Large-V3-Turbo 是 OpenAI Whisper Large V3 模型的高性能微調版本,由 TheStage AI 針對多平臺即時、低延遲和低功耗語音轉文本推理進行優化。支持流式轉錄、單詞時間戳和可擴展性能,適用於即時字幕、會議和設備端語音界面等場景。
noctrex
這是慧慧AI模型Huihui-MoE-60B-A3B-abliterated的MXFP4_MOE量化版本,為文本生成提供支持。該量化版本基於特定的基礎模型進行處理,能在一定程度上優化模型的性能和使用體驗。
unsloth
Apertus是一款由瑞士AI開發的全開放多語言大語言模型,提供70億和80億兩種參數規模。該模型支持超過1000種語言,使用完全合規且開放的訓練數據,性能可與閉源模型相媲美。Apertus在15T標記上進行預訓練,採用分階段課程訓練方法,支持長達65,536個標記的上下文長度。
redponike
Apertus是一款由瑞士AI開發的全開放多語言大語言模型,參數規模達80億和700億,支持超過1000種語言和長上下文處理,僅使用完全合規的開放訓練數據,性能可與閉源模型相媲美。
GLM-4.6是智譜AI推出的新一代文本生成模型,相比GLM-4.5在多個方面有顯著改進,包括更長的上下文窗口、更優的編碼性能和更強的推理能力。該模型在多個公開基準測試中表現出色,與國內外領先模型相比具有競爭優勢。
GLM-4.6是智譜AI開發的新一代大語言模型,相比GLM-4.5在上下文處理、編碼能力和推理性能方面有顯著提升。該模型支持200K上下文長度,在多個公開基準測試中表現出色,特別在代碼生成、推理和代理任務方面具有競爭優勢。
zai-org
GLM-4.6是智譜AI推出的新一代文本生成模型,相比GLM-4.5在上下文處理、編碼性能、推理能力等方面實現顯著提升,支持200K上下文長度,具備更強的智能體能力和精緻的寫作能力。
GLM-4.6-FP8是智譜AI推出的新一代文本生成模型,相比GLM-4.5在多個關鍵方面有顯著改進。該模型具有更長的上下文窗口、卓越的編碼性能、高級推理能力和更強大的智能體功能,能夠處理更復雜的任務。
Salesforce
CoDA是Salesforce AI Research研發的基於擴散模型的代碼生成語言模型,具備雙向上下文理解能力,專為強大的代碼生成和補全任務而設計。該模型僅17億參數,在保持低計算要求的同時實現了卓越的代碼生成性能。
neuphonic
NeuTTS Air是世界上首個具備即時語音克隆功能的超逼真、端側文本轉語音(TTS)語言模型。基於0.5B參數的大語言模型骨幹構建,能為本地設備帶來自然的語音、即時性能、內置安全性和說話人克隆功能。
NeuTTS Air是全球首個具有即時語音克隆功能的超逼真設備端文本轉語音模型,基於0.5B參數的大語言模型骨幹構建,能在本地設備上實現自然語音生成、即時性能和說話人克隆功能。
NeuTTS Air是世界上首個具備即時語音克隆功能的超逼真、設備端文本轉語音(TTS)語言模型。基於0.5B大語言模型骨幹網絡構建,能為本地設備帶來自然的語音、即時性能、內置安全功能和說話人克隆能力。
nvidia
NVIDIA Qwen2.5-VL-7B-Instruct-FP4是阿里巴巴Qwen2.5-VL-7B-Instruct模型的量化版本,採用優化的Transformer架構,支持多模態輸入(文本和圖像),適用於多種AI應用場景。該模型通過TensorRT Model Optimizer進行FP4量化,在NVIDIA GPU上提供高效的推理性能。
NVIDIA Qwen3-8B FP4 模型是阿里巴巴Qwen3-8B模型的量化版本,採用優化的Transformer架構的自迴歸語言模型。該模型使用FP4量化技術,在保持性能的同時顯著減少內存佔用和計算需求,適用於AI智能體系統、聊天機器人、RAG系統等應用場景。
anikifoss
這是對Moonshot AI的Kimi-K2-Instruct-0905模型的高質量量化版本,採用HQ4_K量化方法,專門優化了推理性能,支持75000上下文長度,適用於文本生成任務。
PageSpeed MCP服務器是一個連接AI助手與谷歌PageSpeed Insights API的橋樑,為AI模型提供網站性能分析功能,包括核心性能指標、SEO評估、可訪問性審計和資源優化建議。
MyMCP是一個基於Python的應用程序,支持通過Aider工具並行執行多個AI編碼任務,提供並行/順序執行選擇、詳細報告和性能比較功能。
TurboVault是一個生產級的MCP服務器,將Obsidian知識庫轉換為由AI驅動的智能知識系統,提供44個專業工具用於筆記的讀寫、搜索、分析和管理,具有亞100毫秒的性能表現。
英雄聯盟模擬對戰預測器,提供基於歷史數據的召喚師分析和AI驅動的10階段對戰模擬,支持多語言和性能比較。
一個基於AI的NPM包分析MCP服務器,提供即時安全掃描、依賴分析、性能評估等功能,集成Claude和Anthropic AI技術,優化npm生態管理。
一個提供Google PageSpeed Insights分析的MCP服務器,幫助AI模型通過標準化接口分析網頁性能。
Scout Monitoring MCP是一個本地運行的MCP服務器,通過Docker鏡像讓AI助手能夠訪問Scout應用性能監控數據,包括錯誤追蹤、性能指標和代碼級分析,幫助AI直接修復代碼中的性能問題。
該項目是基於UnityMCP的改進版本,專注於通過AI輔助開發VRChat世界,提供了增強的命令執行、編輯器集成、腳本測試和性能優化等功能,特別支持UdonSharp腳本生成。
pyResToolbox MCP服務器是一個生產就緒的AI工具,將石油工程計算庫pyResToolbox的47個工具通過Model Context Protocol集成到Claude等AI助手中,支持PVT分析、井性能計算、油藏模擬等專業計算。
Meta Ads MCP是一個基於Model Context Protocol的服務器,用於通過標準化接口與Meta廣告API交互,使AI模型能夠訪問、分析和管理Meta廣告活動,包括獲取性能數據、可視化廣告創意和提供戰略建議。
NPM Sentinel MCP是一個基於AI的NPM包分析服務器,提供即時安全掃描、依賴分析、性能評估等功能,支持與Claude和Anthropic AI集成,優化NPM生態管理。
mcp-server-webcrawl是一個高級網絡爬蟲數據搜索與檢索工具,專為AI客戶端設計,支持多種爬蟲格式(如WARC、wget等),提供全文搜索、布爾邏輯查詢及資源類型/狀態過濾功能。它可與Claude Desktop無縫集成,通過Python安裝,適用於構建網站知識庫或進行SEO/性能審計等任務。
Mandoline MCP服務器是一個AI助手評估框架,通過Model Context Protocol為Claude和Cursor等AI助手提供自定義評估指標創建、批量評分和性能分析工具,幫助AI持續改進自身表現。
一個基於MCP協議的PostgreSQL性能調優服務器,提供AI驅動的查詢分析、索引優化、數據庫健康檢查和性能監控功能,支持HypoPG虛擬索引測試和多種部署模式。
PageSpeed MCP服務器是一個連接AI助手與谷歌PageSpeed Insights API的橋樑,提供網站性能分析功能。
Gemini CLI編排器是一個基於Google Gemini AI的多步驟代碼分析工具,通過結構化工作流引導開發者進行系統化分析,而非替代人工思考。它提供四大核心功能:分析規劃、提示詞優化、迭代分析和結果合成,適用於安全審計、性能優化等複雜場景。
MCP互聯網速度測試是一個實驗性項目,通過標準化的MCP協議為AI模型提供網絡性能測試工具,包括下載/上傳速度、延遲和抖動測量等功能。
Tailpipe MCP服務器是一個AI驅動的日誌分析工具,通過模型上下文協議連接AI助手與雲端/SaaS日誌數據,支持自然語言查詢和分析各類雲服務日誌,提供安全事件調查、成本性能洞察等功能。
一個基於Ruby的AI結對編程MCP服務器,通過OpenRouter提供代碼審查、頭腦風暴、性能分析和安全檢查等AI輔助編程功能。
OpenRouter MCP服務器提供與OpenRouter.ai模型生態系統的無縫集成,支持多種AI模型訪問和性能優化。