谷歌發佈Magika 1.0 AI文件檢測系統,核心引擎改用Rust語言,顯著提升處理速度和內存安全性。自去年開源後月下載超百萬次,新版經架構重構,在性能與安全方面實現重大突破。
印度支付巨頭Paytm與美國硬件公司Groq合作,將利用GroqCloud雲端服務提升AI模型性能,優化交易處理、風險評估、欺詐檢測和消費者互動。GroqCloud基於自主研發的語言處理單元,專注於AI推理,旨在增強Paytm平臺的智能化水平。
MiniMax M2模型採用全注意力機制,放棄線性或稀疏注意力技術。開發團隊認爲,儘管後者能節省計算資源,但全注意力在工業應用中更高效,能提升模型性能。這一決策旨在優化實際部署效果,推動AI技術發展。
Pinterest採用微調開源大模型,在視覺AI任務中實現與頂級閉源模型相當性能,成本降低一個數量級。這一高性價比策略緩解廣告收入壓力,爲電商和內容推薦行業提供降本增效新範式。
Snowglobe幫助AI團隊在規模上測試LLM應用。在推出之前模擬真實對話,發現風險並提高模型性能。
Relyable 讓您快速部署高性能 AI 電話代理。
本地AI與雲端性能相匹配,適用於日常任務。離線工作,保護數據隱私而不降低質量。
GPT 5是下一代AI模型,提供卓越的編碼、數學和推理性能。
chatglm
$0.43
輸入tokens/百萬
$1.01
輸出tokens/百萬
131.1k
上下文長度
minimax
-
1M
xai
$21.6
$108
mistral
128k
google
$2.16
$18
anthropic
200k
deepseek
$3.6
$15.48
upstage
64k
65.5k
alibaba
32k
aws
$0.5
reka-ai
4.1k
ai21-labs
$3.53
$7.99
260k
65.4k
alenphilip
這是一款專門用於Python代碼審查的AI模型,基於Qwen2.5-7B-Instruct微調,能夠識別安全漏洞、性能問題並提供代碼質量改進建議。
pnnbao-ump
VieNeu-TTS是首個可在個人設備上運行的越南語文本轉語音模型,具備即時語音克隆能力。基於NeuTTS Air微調,能夠生成自然逼真的越南語語音,在CPU上具備即時性能。
TheStageAI
TheWhisper-Large-V3-Turbo 是 OpenAI Whisper Large V3 模型的高性能微調版本,由 TheStage AI 針對多平臺即時、低延遲和低功耗語音轉文本推理進行優化。支持流式轉錄、單詞時間戳和可擴展性能,適用於即時字幕、會議和設備端語音界面等場景。
noctrex
這是慧慧AI模型Huihui-MoE-60B-A3B-abliterated的MXFP4_MOE量化版本,為文本生成提供支持。該量化版本基於特定的基礎模型進行處理,能在一定程度上優化模型的性能和使用體驗。
unsloth
Apertus是一款由瑞士AI開發的全開放多語言大語言模型,提供70億和80億兩種參數規模。該模型支持超過1000種語言,使用完全合規且開放的訓練數據,性能可與閉源模型相媲美。Apertus在15T標記上進行預訓練,採用分階段課程訓練方法,支持長達65,536個標記的上下文長度。
redponike
Apertus是一款由瑞士AI開發的全開放多語言大語言模型,參數規模達80億和700億,支持超過1000種語言和長上下文處理,僅使用完全合規的開放訓練數據,性能可與閉源模型相媲美。
GLM-4.6是智譜AI推出的新一代文本生成模型,相比GLM-4.5在多個方面有顯著改進,包括更長的上下文窗口、更優的編碼性能和更強的推理能力。該模型在多個公開基準測試中表現出色,與國內外領先模型相比具有競爭優勢。
GLM-4.6是智譜AI開發的新一代大語言模型,相比GLM-4.5在上下文處理、編碼能力和推理性能方面有顯著提升。該模型支持200K上下文長度,在多個公開基準測試中表現出色,特別在代碼生成、推理和代理任務方面具有競爭優勢。
zai-org
GLM-4.6是智譜AI推出的新一代文本生成模型,相比GLM-4.5在上下文處理、編碼性能、推理能力等方面實現顯著提升,支持200K上下文長度,具備更強的智能體能力和精緻的寫作能力。
GLM-4.6-FP8是智譜AI推出的新一代文本生成模型,相比GLM-4.5在多個關鍵方面有顯著改進。該模型具有更長的上下文窗口、卓越的編碼性能、高級推理能力和更強大的智能體功能,能夠處理更復雜的任務。
Salesforce
CoDA是Salesforce AI Research研發的基於擴散模型的代碼生成語言模型,具備雙向上下文理解能力,專為強大的代碼生成和補全任務而設計。該模型僅17億參數,在保持低計算要求的同時實現了卓越的代碼生成性能。
neuphonic
NeuTTS Air是世界上首個具備即時語音克隆功能的超逼真、端側文本轉語音(TTS)語言模型。基於0.5B參數的大語言模型骨幹構建,能為本地設備帶來自然的語音、即時性能、內置安全性和說話人克隆功能。
NeuTTS Air是全球首個具有即時語音克隆功能的超逼真設備端文本轉語音模型,基於0.5B參數的大語言模型骨幹構建,能在本地設備上實現自然語音生成、即時性能和說話人克隆功能。
NeuTTS Air是世界上首個具備即時語音克隆功能的超逼真、設備端文本轉語音(TTS)語言模型。基於0.5B大語言模型骨幹網絡構建,能為本地設備帶來自然的語音、即時性能、內置安全功能和說話人克隆能力。
anikifoss
這是對Moonshot AI的Kimi-K2-Instruct-0905模型的高質量量化版本,採用HQ4_K量化方法,專門優化了推理性能,支持75000上下文長度,適用於文本生成任務。
mradermacher
這是基於mookiezii/Discord-Hermes-3-8B模型進行量化處理後的版本,提供了多種量化格式的GGUF模型文件,適用於不同硬件環境和性能需求的對話AI應用場景。
TildeAI
TildeOpen LLM 是一個開源的基礎語言模型,專門為服務代表性不足的北歐和東歐語言而設計。該模型由歐盟委員會資助,在LUMI超級計算機上訓練,擁有300億參數,解決了19種重點語言使用者在現有AI系統中面臨的性能差距問題。
cpatonn
GLM-4.5V-AWQ-4bit是基於智譜AI下一代旗艦文本基礎模型構建的量化版本多模態模型,通過AWQ-4bit量化技術優化,在保持優異性能的同時顯著降低計算資源需求。該模型在42個公開視覺語言基準測試中達到同規模模型的SOTA性能,具備強大的視覺推理能力。
lmstudio-community
GLM 4.5 Air是由Zai-Org開發的高效文本生成模型,經過bartowski使用llama.cpp進行GGUF量化處理,在保持性能的同時顯著降低了硬件需求,適合在消費級硬件上運行。
danielkty22
TARS-SFT-7B是一個基於監督微調的安全推理模型,作為強化學習訓練的基礎模型,專門設計用於增強AI系統的安全性。該模型從Qwen2.5-7B-Instruct開始訓練,通過推理過程作為自適應防禦機制來提升模型的安全性能。
PageSpeed MCP服務器是一個連接AI助手與谷歌PageSpeed Insights API的橋樑,為AI模型提供網站性能分析功能,包括核心性能指標、SEO評估、可訪問性審計和資源優化建議。
英雄聯盟模擬對戰預測器,提供基於歷史數據的召喚師分析和AI驅動的10階段對戰模擬,支持多語言和性能比較。
MyMCP是一個基於Python的應用程序,支持通過Aider工具並行執行多個AI編碼任務,提供並行/順序執行選擇、詳細報告和性能比較功能。
一個基於AI的NPM包分析MCP服務器,提供即時安全掃描、依賴分析、性能評估等功能,集成Claude和Anthropic AI技術,優化npm生態管理。
Scout Monitoring MCP是一個本地運行的MCP服務器,通過Docker鏡像讓AI助手能夠訪問Scout應用性能監控數據,包括錯誤追蹤、性能指標和代碼級分析,幫助AI直接修復代碼中的性能問題。
一個提供Google PageSpeed Insights分析的MCP服務器,幫助AI模型通過標準化接口分析網頁性能。
該項目是基於UnityMCP的改進版本,專注於通過AI輔助開發VRChat世界,提供了增強的命令執行、編輯器集成、腳本測試和性能優化等功能,特別支持UdonSharp腳本生成。
NPM Sentinel MCP是一個基於AI的NPM包分析服務器,提供即時安全掃描、依賴分析、性能評估等功能,支持與Claude和Anthropic AI集成,優化NPM生態管理。
Meta Ads MCP是一個基於Model Context Protocol的服務器,用於通過標準化接口與Meta廣告API交互,使AI模型能夠訪問、分析和管理Meta廣告活動,包括獲取性能數據、可視化廣告創意和提供戰略建議。
Mandoline MCP服務器是一個AI助手評估框架,通過Model Context Protocol為Claude和Cursor等AI助手提供自定義評估指標創建、批量評分和性能分析工具,幫助AI持續改進自身表現。
mcp-server-webcrawl是一個高級網絡爬蟲數據搜索與檢索工具,專為AI客戶端設計,支持多種爬蟲格式(如WARC、wget等),提供全文搜索、布爾邏輯查詢及資源類型/狀態過濾功能。它可與Claude Desktop無縫集成,通過Python安裝,適用於構建網站知識庫或進行SEO/性能審計等任務。
PageSpeed MCP服務器是一個連接AI助手與谷歌PageSpeed Insights API的橋樑,提供網站性能分析功能。
Gemini CLI編排器是一個基於Google Gemini AI的多步驟代碼分析工具,通過結構化工作流引導開發者進行系統化分析,而非替代人工思考。它提供四大核心功能:分析規劃、提示詞優化、迭代分析和結果合成,適用於安全審計、性能優化等複雜場景。
MCP互聯網速度測試是一個實驗性項目,通過標準化的MCP協議為AI模型提供網絡性能測試工具,包括下載/上傳速度、延遲和抖動測量等功能。
一個基於Ruby的AI結對編程MCP服務器,通過OpenRouter提供代碼審查、頭腦風暴、性能分析和安全檢查等AI輔助編程功能。
Tailpipe MCP服務器是一個AI驅動的日誌分析工具,通過模型上下文協議連接AI助手與雲端/SaaS日誌數據,支持自然語言查詢和分析各類雲服務日誌,提供安全事件調查、成本性能洞察等功能。
OpenRouter MCP服務器提供與OpenRouter.ai模型生態系統的無縫集成,支持多種AI模型訪問和性能優化。
Yandex Tracker MCP服務器是一個為AI助手提供與Yandex Tracker API交互的模型上下文協議服務,支持隊列管理、用戶管理、問題操作和高級搜索功能,提供安全認證訪問和性能緩存。
該項目是一個基於Model Context Protocol (MCP)的服務器,專門用於與Amazon Redshift數據庫交互,通過AWS Data API安全連接,提供數據庫結構查詢、數據檢索、性能分析等功能,支持與Claude、Cursor等AI工具集成。
Ultimate MCP Server是一個基於模型上下文協議(MCP)的AI代理操作系統,提供數十種強大工具能力,包括認知增強、工具使用和智能編排等功能。該系統通過標準化MCP工具暴露功能,使高級AI代理能訪問豐富的工具生態系統和專業化服務,同時優化成本、性能和質量。