百度文心一言5.1預覽版低調上線國際盲測平臺LMSYS Chatbot Arena,最新數據顯示其在總榜排名第13位。這標誌着百度核心模型進入新一輪快速迭代週期,開始接受全球用戶檢驗。雖然官方未公佈具體參數和架構細節,但基於以往迭代邏輯和競技表現,該版本在語義理解方面預計有所提升。
馬斯克在加州聯邦法院出庭,起訴OpenAI及其CEO奧特曼“竊取慈善機構”,將非營利實驗室私有化牟利。他情緒激動地聲稱初衷是爲人類開發AI,但在交叉詢問中,面對自己社交平臺上的言論,改口否認特斯拉研發通用人工智能,暴露出矛盾立場。
阿里巴巴發佈QoderWake和Qoder移動端兩款AI智能體產品,實現從企業生產到個人移動的全場景覆蓋。QoderWake作爲生產級數字員工,可承擔軟件工程師、運營等職能,已上線“數字程序員”角色並在阿里內部深度應用,能自主執行代碼變更簡報整理等任務。
微軟CEO納德拉在財報電話會議上強硬迴應外界猜測,強調已準備好利用與OpenAI的新協議保持AI市場領先。根據修訂合作,微軟擁有至2032年OpenAI所有先進模型及代理產品的知識產權使用權,確保核心資源掌控。
Xai
$1.4
輸入tokens/百萬
$3.5
輸出tokens/百萬
2k
上下文長度
Openai
$7.7
$30.8
200
-
Anthropic
$105
$525
Google
$0.7
$2.8
1k
$7
$35
Alibaba
$1
$10
256
$2
$20
Bytedance
$1.2
$3.6
4
$8
$240
52
$15.8
$12.7
64
$3.9
$15.2
kyr0
這是一個專為蘋果硅芯片設備優化的自動語音識別模型,通過轉換為MLX框架並量化為FP8格式,實現在蘋果設備上的快速端上語音轉錄。該模型針對逐字精度進行微調,特別適用於需要高精度轉錄的場景。
ubergarm
這是ai-sage/GigaChat3-10B-A1.8B-bf16模型的GGUF量化版本,提供了多種量化選項,從高精度的Q8_0到極度壓縮的smol-IQ1_KT,滿足不同硬件條件下的部署需求。該模型支持32K上下文長度,採用MLA架構,專為對話場景優化。
bartowski
這是Precog-123B-v1模型的llama.cpp量化版本,提供了多種量化類型以滿足不同硬件配置和使用場景的需求。該模型是一個擁有1230億參數的大型語言模型,經過優化後可在各種硬件上高效運行。
moonshotai
Kimi Linear是一種混合線性注意力架構,在各種場景下包括短、長上下文以及強化學習擴展機制中,均優於傳統的全注意力方法。它能有效解決傳統注意力機制在長上下文任務中效率低下的問題,為自然語言處理等領域帶來更高效的解決方案。
Kimi Linear是一種高效混合線性注意力架構,在短上下文、長上下文和強化學習場景中均優於傳統全注意力方法。它通過Kimi Delta Attention (KDA)機制優化注意力計算,顯著提升性能和硬件效率,特別擅長處理長達100萬令牌的長上下文任務。
woodBorjo
本模型是基於facebook/mask2former-swin-tiny-coco-instance在qubvel-hf/ade20k-mini數據集上進行微調的實例分割模型。該模型專門針對ADE20K-mini數據集中的場景理解任務進行了優化,在實例分割任務上表現出良好的性能。
noctrex
本項目是對Qwen3-VL-235B-A22B-Thinking模型進行MXFP4_MOE量化處理,旨在提供更高效的圖像文本到文本轉換能力。該版本來自unloth,已將上下文大小從256k擴展到1M,通過特定的量化技術優化模型在不同場景下的性能表現。
yueqis
這是基於Qwen-Coder-14B模型在網絡數據集上進行微調的版本,專門針對網絡數據場景優化,相比基礎版本在特定網絡任務中表現更優。模型經過3個epochs的訓練,學習率為5e-5。
nvidia
NVIDIA-Nemotron-Nano-VL-12B-V2-FP8 是 NVIDIA 推出的量化視覺語言模型,採用優化的 Transformer 架構,在商業圖像上進行了三階段訓練。該模型支持單圖像推理,具備多語言和多模態處理能力,適用於圖像總結、文本圖像分析等多種場景。
rtr46
meiki.text.detect.v0.1是專門針對視頻遊戲和漫畫文本檢測的高精度、低延遲OCR模型,在日語相關內容上表現優異。該模型基於D-FINE檢測器架構,採用MobileNet v4 small作為骨幹網絡,提供兩種分辨率變體以適應不同應用場景。
redis
這是一個基於Cross Encoder架構的語義重排序模型,專門針對Redis LangCache語義緩存場景進行微調。模型在LangCache Sentence Pairs數據集上訓練,能夠有效計算文本對的語義相似度得分,用於句子對分類和重排序任務。
Guilherme34
Qwen2.5-14B-Instruct是基於Qwen2.5架構的多語言大語言模型,擁有140億參數,支持13種語言,具備優秀的指令跟隨和對話能力。該模型在多種語言任務上表現優異,適用於多語言場景的文本生成和理解。
NikolayKozloff
UserLM-8b-Q8_0-GGUF 是基於微軟 UserLM-8b 模型轉換的 GGUF 格式版本,專門針對用戶對話場景優化的大語言模型。該模型採用 8 位量化技術,在保持性能的同時顯著減小了模型體積,便於在各種硬件上部署運行。
DavidAU
這是一個基於Qwen3-Coder-30B-A3B-Instruct的混合專家模型,擁有540億參數和100萬上下文長度。模型通過三步合併和Brainstorm 40X優化,具備強大的編程能力和通用場景處理能力,特別集成了思考模塊,能夠在回答前進行深度推理。
mradermacher
Zen-Eco-4B-Instruct是一個4B參數的大語言模型,專門針對指令跟隨和工具使用場景進行優化。本項目提供了該模型的多個GGUF量化版本,支持不同的精度和性能需求,便於在各種硬件上部署使用。
ibm-granite
Granite-4.0-H-Small是IBM開發的320億參數長上下文指令模型,專為企業級AI助手構建設計,支持多種語言和專業應用場景。
Granite-4.0-Micro 是 IBM 開發的 30 億參數長上下文指令模型,具有優秀的指令遵循和工具調用能力,支持多種語言,適用於商業應用和 AI 助手場景。
adityak74
MEDFIT-LLM-3B是一個專門針對醫療問答優化的語言模型,基於Meta的Llama-3.2-3B-Instruct進行微調。該模型通過LoRA技術在醫療數據集上訓練,顯著提升了醫學領域理解和直接回答能力,適用於醫療聊天機器人、患者教育等應用場景。
MEGHT
基於Qwen3 0.6B模型微調的搜索查詢生成模型,能夠根據用戶輸入和對話上下文生成相關的搜索查詢,適用於搜索引擎建議系統和聊天機器人等應用場景。
owao
這是基於 driaforall/mem-agent 模型轉換的 GGUF 量化版本,採用 Q4_K_M 量化級別。該模型專注於記憶代理功能,能夠處理和回憶大量上下文信息,適用於需要長期記憶能力的對話和任務處理場景。
wcgw是一個MCP服務器項目,集成了Shell和代碼編輯工具,允許AI在本地機器上執行命令、讀寫文件、編輯代碼等操作。它提供了多種模式(如架構師模式、代碼編寫模式等),支持任務檢查點保存、終端交互、語法檢查等功能,適用於代碼開發、問題排查等場景。
這是一個關於Web3 Model Context Protocol (MCP) 服務器的精選列表,涵蓋了鏈交互、交易、DeFi、市場數據、工具和社交等多個類別。MCP是一個開放協議,標準化了應用程序如何向LLM提供上下文,類似於AI應用程序的USB-C端口。DeMCP是第一個去中心化的MCP網絡,專注於為代理提供自研和開源的MCP服務,支持加密支付,並結合TEE和區塊鏈註冊表重新定義了MCP的安全性和可靠性。
Alpaca MCP服務器是一個實現Alpaca交易API的模型上下文協議(MCP)服務,允許大型語言模型通過自然語言與Alpaca交易系統交互,支持股票/期權交易、投資組合管理和即時市場數據獲取。
MCP Analyst是一個MCP服務器,支持Claude分析本地的CSV或Parquet文件,適用於處理超出上下文窗口限制的大型數據集或需要優化成本的場景。
SketchupMCP是一個通過模型上下文協議(MCP)將Sketchup與Claude AI連接的整合工具,實現AI輔助3D建模和場景控制。
NSE-BSE MCP服務器是一個為印度國家證券交易所和孟買證券交易所提供即時股票市場數據的模型上下文協議服務器,支持66個工具進行市場數據查詢、歷史分析、期權衍生品、公司信息和文檔下載等功能。
ChatPPT是一款AI驅動的演示文稿生成服務,支持根據主題或需求生成PPT、上傳文檔自動創建PPT,並提供在線編輯和下載功能。其MCP服務器支持18種智能文檔處理API,涵蓋PPT製作、簡歷分析等多種場景。
TWStockMCPServer 是一個基於模型上下文協議 (MCP) 的服務器,專為臺灣證券交易所數據設計,提供即時股票信息、財務分析、ESG數據和市場趨勢分析功能。
Universal Crypto MCP 是一個功能全面的模型上下文協議服務器,支持所有EVM兼容網絡和Solana區塊鏈。它集成了超過380個工具,涵蓋代幣交換、跨鏈橋接、安全檢測、市場數據分析、DeFi操作、NFT管理、支付協議(x402)以及AI服務市場等功能,使AI代理能夠通過自然語言與區塊鏈進行交互。
ChainGPT MCP是一個模型上下文協議服務器,可將ChainGPT功能集成到AI代理中,提供加密貨幣新聞、價格、市場趨勢等信息查詢服務。
Octagon MCP是一個集成Octagon市場情報API的模型上下文協議服務器,提供公共和私有市場數據的AI代理分析工具。
Financial Modeling Prep MCP服務器是一個實現模型上下文協議(MCP)的金融數據服務,提供253+種金融工具,覆蓋股票信息、公司基本面、市場分析等24個類別。支持動態工具管理、選擇性工具加載和多種配置模式,為AI助手提供全面的金融數據訪問能力。
該項目包含兩個基於模型上下文協議(MCP)的服務器:物聯網設備控制服務器和內存管理服務器。物聯網服務器提供設備控制、狀態查詢和即時更新功能,適用於智能家居和工業物聯網等場景;內存管理服務器提供長期記憶存儲和語義搜索功能,適用於對話歷史和知識管理等領域。
基於Interactive Brokers Web API構建的模型上下文協議(MCP)服務,通過Docker容器化部署,提供股票交易、賬戶管理和市場數據查詢功能
一個動態MCP服務器管理服務,用於創建、運行和管理模型上下文協議(MCP)服務器。該項目通過Python實現,能夠生成六種不同類型的思維導圖,適用於學習、複習和演示等多種場景。
Octagon MCP是一個市場數據模型上下文協議服務器,集成了Octagon市場情報API,提供公共市場數據、私人市場數據和深度研究的AI代理服務。
Hive Intelligence MCP服務器為AI助手提供全面的加密貨幣和Web3分析服務,通過統一接口集成200+專業工具,涵蓋市場數據、鏈上分析、投資組合跟蹤、安全分析等多個領域。
AgentHotspot MCP服務器是一個允許AI智能體搜索和發現AgentHotspot市場上6000多個MCP連接器的工具,支持與Claude Desktop、OpenAI Agents等平臺集成。
Binance.US MCP服務器是一個基於模型上下文協議(MCP)的工具,提供對Binance.US加密貨幣交易所API的程序化訪問,包括市場數據、現貨交易、錢包管理、賬戶信息、質押、場外交易、子賬戶管理等功能,支持通過HTTP遠程部署使用。
Flippa MCP服務器提供AI驅動的在線商業市場分析工具,無需API密鑰即可搜索、分析和評估Flippa平臺上的商業列表,幫助用戶發現投資機會。