Moonshot AI與清華大學提出預填充即服務(PrfaaS)新架構,旨在解決大型語言模型推理中計算資源瓶頸。該架構將高計算密集的預填充階段(生成鍵值緩存)與解碼階段分離,以優化資源利用,突破傳統服務限制。
Nature最新研究揭示,大型語言模型存在“潛意識學習”現象,即使訓練數據經過嚴格過濾,不良行爲特徵仍能通過數字序列、代碼等看似無害的形式傳遞給下游模型。這暴露了“模型蒸餾”技術可能放大上游模型的隱性風險,AI安全面臨新挑戰。
谷歌發佈Gemma4系列開源模型,實現AI能力輕量化突破。其中一款僅激活3.8億參數,性能卻超越參數規模20倍的大型模型,使強大AI可輕鬆部署於手機和輕薄筆記本。該系列包含2.3B和4.5B等不同參數規模的模型,推動人工智能服務更便捷普及。
Carbon Robotics推出“大型植物模型”AI,作爲激光除草機器人LaserWeeder的智能核心。該模型基於15個國家、100多個農場超1.5億張高質量圖像訓練,具備深度植物結構理解能力,顯著提升農田除草效率。
一個支持DeepSeek R1的AI驅動研究助手,結合搜索引擎、網絡爬蟲和大型語言模型進行深度研究。
LG AI Research開發的多語言、高性能大型語言模型
自動化AI網絡研究助手,利用本地大型語言模型進行深入研究。
連接大型語言模型與谷歌數據共享平臺,減少AI幻覺現象。
Google
$0.49
輸入tokens/百萬
$2.1
輸出tokens/百萬
1k
上下文長度
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$6
$24
256
$4
$16
Baidu
128
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
Moonshot
$0.8
DevQuasar
這是 ai-sage/GigaChat3-702B-A36B-preview-bf16 模型的量化版本,旨在為大眾提供免費的知識獲取途徑。該模型是一個大型語言模型,專注於文本生成任務。
nineninesix
KaniTTS是一款專為即時對話式AI應用優化的高速、高保真文本轉語音模型,採用兩階段管道結合大型語言模型和高效音頻編解碼器,實現卓越的速度和音頻質量。該模型支持西班牙語,具有4億參數,採樣率為22kHz。
mistralai
Devstral是一款專為軟件工程任務設計的智能大型語言模型,由Mistral AI和All Hands AI合作開發,擅長代碼探索、編輯和驅動軟件工程代理。
Salesforce
xLAM-2是Salesforce研發的大型動作模型系列,專注於多輪對話和函數調用能力,可作為AI代理的核心組件。
xLAM-2是Salesforce推出的新一代大型動作模型,專注於多輪對話和函數調用能力,能夠將用戶意圖轉化為可執行動作,作為AI代理的核心組件。
xLAM-2系列是基於APIGen-MT框架訓練的大型動作模型,專注於多輪對話和函數調用能力,適用於AI代理開發。
xLAM-2是SalesforceAIResearch開發的大型動作模型(LAM)系列,專注於將用戶意圖轉化為可執行動作,增強AI代理的決策能力。
xGen-MM是Salesforce AI Research開發的一系列最新基礎大型多模態模型(LMMs),在BLIP系列成功設計的基礎上進行了改進,通過基礎性增強確保了更強大和卓越的模型基礎。
xGen-MM是Salesforce AI Research開發的一系列最新基礎大型多模態模型,基於BLIP系列的成功設計進行了改進,提供更強大的多模態處理能力。
qwp4w3hyb
Codestral-22B-v0.1是Mistral AI開發的大型代碼生成模型,支持80多種編程語言,適用於代碼生成、解釋和重構任務。
bullerwins
Codestral-22B-v0.1是由Mistral AI開發的大型語言模型,支持80多種編程語言,能夠執行代碼生成、解釋和重構等任務。
xGen-MM是Salesforce AI Research開發的最新基礎大型多模態模型系列,基於BLIP系列改進,具有強大的圖像理解和文本生成能力。
AI-Sweden-Models
GPT-SW3是由AI瑞典開發的大型北歐語言模型,支持5種北歐語言和英語的文本生成任務。
GPT-SW3是由AI Sweden開發的大型北歐語言模型,支持5種北歐語言和英語的文本生成任務
poisson-fish
基於《星空》遊戲中瓦斯科角色語音訓練的派珀文本轉語音模型,適用於AI夥伴模組和本地大型語言模型聊天
GPT-SW3是由AI Sweden聯合RISE和WASP WARA for Media and Language開發的大型預訓練Transformer語言模型,在包含北歐語言和英語的3200億令牌數據集上訓練,支持多語言文本生成和編程代碼生成。
nvidia
這是一個用於轉錄普通話語音的大型Conformer-Transducer模型,參數約1.2億,在AISHELL-2數據集上訓練。
facebook
OPT是由Meta AI開發的大型語言模型套件,包含125M至175B參數的僅解碼器預訓練變換器,旨在對標GPT-3性能並向研究社區開放。
Supabase MCP Server是一個連接Supabase項目與AI助手的工具,通過Model Context Protocol(MCP)標準化大型語言模型(LLMs)與外部服務的交互,實現數據庫管理、配置獲取和數據查詢等功能。
MCP2Lambda是一個將AWS Lambda函數作為大型語言模型(LLM)工具運行的MCP協議服務器,無需修改代碼即可讓AI模型調用Lambda函數訪問私有資源和AWS服務。
MCP2Lambda是一個MCP服務器,允許將AWS Lambda函數作為大型語言模型(LLM)的工具使用,無需修改代碼。它通過Model Context Protocol (MCP)在AI模型和Lambda函數之間建立橋樑,使模型能夠訪問私有資源和執行自定義操作。
GeoServer MCP Server是一個實現模型上下文協議(MCP)的服務端,連接大型語言模型(LLMs)與GeoServer REST API,使AI助手能夠交互地理空間數據和服務。
該項目實現了一個ClickHouse的MCP服務器,用於將ClickHouse數據庫與大型語言模型(LLMs)等AI應用無縫集成,支持查詢數據庫、獲取表結構等功能。
該項目是一個Model Context Protocol (MCP)適配器,用於連接大型語言模型(LLM)與Lisp開發環境,支持通過輕量級Lisply協議進行交互。主要功能包括Lisp代碼評估、HTTP請求和調試支持,適用於AI輔助符號編程、CAD設計自動化等場景。
Agent Farm v3.4是一個基於AI智能體進化和並行任務執行的系統,通過工具增強的代理實現任務處理。新版本引入了分塊寫入模式,支持並行生成大型文檔和代碼文件,性能提升8.6倍,並利用本地模型進行結果合成,無需依賴雲端令牌。
Model Context Protocol (MCP) 是一個開源協議,提供了一系列參考實現和社區開發的服務器,旨在為大型語言模型(LLM)提供安全、可控的工具和數據源訪問。這些服務器展示了MCP的多樣性和可擴展性,涵蓋了從文件系統操作到數據庫集成、從網絡搜索到AI圖像生成等多種功能。
該項目集成Graphistry的GPU加速圖可視化平臺與模型控制協議(MCP),為AI助手和大型語言模型提供先進的圖分析能力,支持多種數據格式和網絡分析功能。
OpenFGA MCP服務器是一個實驗性的模型上下文協議服務,使大型語言模型能夠讀寫OpenFGA授權存儲,為AI代理和開發者提供細粒度權限管理能力。
該項目是一個專為大型語言模型(LLMs)和其他AI代理設計的服務器工具,用於安全地與電子健康記錄(EHRs)交互。它通過SMART on FHIR標準實現安全數據訪問,並利用模型上下文協議(MCP)提供工具集,作為AI與多樣化EHR系統之間的安全網關和工具包。
NetBrain MCP是一個開源網絡運維平臺,通過Model Context Protocol連接大型語言模型與網絡設備,實現AI驅動的網絡配置、診斷和管理,並提供專業的Web終端界面和網絡拓撲可視化功能。
Unity-MCP是一個連接大型語言模型(LLM)與Unity編輯器的橋樑工具,通過暴露Unity編輯器功能給AI客戶端,實現AI驅動的自動化開發流程。它支持自定義工具擴展,目前提供遊戲對象管理、場景操作、資產處理等核心功能,主要適用於Unity編輯器環境。
BeeMCP是一個非官方的MCP服務器,用於連接Bee可穿戴設備的數據與大型語言模型(如Claude),讓AI助手能夠訪問和操作用戶的對話、事實記錄、待辦事項和位置歷史等個人數據。
CTX是一款連接代碼庫與大型語言模型(LLM)的工具,通過自動化生成結構化上下文文件,解決AI開發中代碼上下文傳遞效率低下的問題。支持從代碼文件、Git倉庫、網頁等多種來源收集信息,並可通過MCP服務器直接為AI助手提供項目上下文。
Unified MCP Tool Graph 是一個研究驅動的項目,通過將來自不同MCP服務器的工具API聚合並結構化到一個集中的Neo4j圖數據庫中,為大型語言模型(LLMs)和代理AI系統提供動態檢索最相關工具的智能基礎設施層。
Meta API MCP Server是一個支持多API的網關服務器,通過Model Context Protocol (MCP)協議連接各類API與大型語言模型(如Claude、GPT等),使AI助手能夠直接與API交互並訪問真實數據源。支持從JSON配置文件或Postman集合快速添加API,提供HTTP方法全面支持和多種認證方式。
Clockify MCP服務是一個與AI工具集成的服務器,用於管理Clockify中的時間記錄,用戶可以通過向大型語言模型發送提示來記錄時間條目。
Unity MCP服務器是一個基於C#的模型上下文協議(MCP)服務,用於連接Unity編輯器與外部大型語言模型(LLM)或雲端AI代理,實現即時自動化與智能交互。
OLS MCP服務器是一個為大型語言模型提供本體查詢服務的工具,通過連接EBI本體查詢服務API,幫助AI助手準確獲取生物醫學領域的本體術語、概念和層次結構。