斯坦福大學發佈全球AI競爭力排名,美國因投資、研究和初創企業活躍度居首,中國緊隨其後,在學術出版和專利申請方面表現突出。
谷歌等機構研究發現,多智能體系統性能波動顯著,任務類型是關鍵影響因素。在並行任務中,集中式架構表現更優。
螞蟻技術研究院發佈LLaDA2.0系列,包含16B和100B版本,其中100B版爲業內首個百億參數離散擴散大語言模型。該模型突破擴散模型規模化瓶頸,顯著提升生成質量與推理速度,爲領域發展提供新方向。
谷歌向開發者開放新版深度研究代理,可嵌入應用。該代理採用迭代研究方法,能自主搜索、分析並持續優化答案,性能優於前代模型。
一套AI驅動工具套件,助您研究、驗證和構建受歡迎的產品。
結合2000+科技品牌研究,提供手工設計與AI匹配的初創品牌套件,低至$29
基於先進 AI 技術的學術內容創作助手。
唯一能理解案件、背景和法律的AI,提供可靠研究、分析和策略
Anthropic
$105
輸入tokens/百萬
$525
輸出tokens/百萬
200
上下文長度
Alibaba
$54
$163
1k
Bytedance
$0.8
$8
256
Google
-
$140
$280
32
Tencent
$0.5
$2
224
$8.75
$70
Openai
$14
$56
$2.4
$9.6
$21
$84
128
$420
01-ai
4
Baichuan
MuXodious
Gemma 3n E4B IT 是谷歌推出的輕量級多模態開放模型,基於與Gemini模型相同的研究構建。該模型支持文本、音頻和視覺輸入,適用於多種任務,採用MatFormer架構實現高效參數利用。
prithivMLmods
Olmo-3-Think是艾倫人工智能研究所推出的完全開源的語言模型系列,包含7B和32B兩種規模。該模型經過專門訓練,能夠展現明確的推理鏈,支持透明的逐步推理和可檢查的中間思維痕跡,在推理、數學和代碼任務中表現出色。
OpenMMReasoner
OpenMMReasoner是一個完全透明的兩階段多模態推理方案,涵蓋有監督微調(SFT)和強化學習(RL)。該方案通過精心構建高質量數據集,在多個多模態推理基準測試中超越了強大的基線模型,為未來大規模多模態推理研究奠定了堅實的實證基礎。
Mungert
MiroThinker v1.0是一個開源研究智能體,通過模型級別的交互式擴展提升工具增強推理和信息搜索能力。該模型在多個基準測試中表現出色,支持長上下文和深度多步分析。
allenai
Olmo-3-7B-Think-DPO是Allen Institute for AI開發的7B參數語言模型,具有長鏈式思考能力,在數學和編碼等推理任務中表現出色。該模型經過監督微調、直接偏好優化和基於可驗證獎勵的強化學習等多階段訓練,專為研究和教育用途設計。
noctrex
這是MiniMax-M2-REAP-172B-A10B模型的MXFP4_MOE量化版本,是一個內存高效的壓縮模型。通過REAP(路由加權專家激活剪枝)方法,在保持性能的同時將模型從230B參數壓縮到172B參數,體積縮小25%,適用於資源受限的環境、本地部署和學術研究。
sd2-community
Stable Diffusion v2-1-base是基於文本生成圖像的擴散模型,在v2-base基礎上進行了220k額外步驟的微調優化。該模型能夠根據文本提示生成和修改圖像,支持多種分辨率輸出,適用於藝術創作、教育研究等多個領域。
ojus1
Qwen2.5是阿里巴巴推出的新一代大語言模型,在聊天模板方面進行了重要優化,永久禁用了思考狀態,解決了多輪聊天模板相關問題,為實驗和研究提供了更便捷的體驗。
BAAI
Emu3.5是北京智源人工智能研究院開發的原生多模態模型,能夠跨視覺和語言聯合預測下一狀態,實現連貫的世界建模和生成。通過端到端預訓練和大規模強化學習後訓練,在多模態任務中展現出卓越性能。
Emu3.5是由北京智源人工智能研究院(BAAI)開發的原生多模態模型,能夠跨視覺和語言聯合預測下一狀態,實現連貫的世界建模與生成,在多模態任務中表現卓越。
microsoft
Fara-7B是微軟研究院開發的專為計算機使用場景設計的小型語言模型,僅有70億參數,在同規模模型中實現卓越性能,能夠執行網頁自動化、多模態理解等計算機交互任務。
AbstractPhil
這是一個實驗性的Stable Diffusion 1.5蒸餾模型,採用v-預測流匹配方法和幾何引導的自適應塊加權技術。目前處於研究階段,訓練正在進行中,結果尚未驗證。
almanach
Gaperon-Young-1125-1B 是一個擁有15億參數的雙語(法語-英語)語言模型,由法國國家信息與自動化研究所(Inria Paris)的ALMAnaCH團隊開發。該模型在約3萬億個高質量令牌上訓練,特別注重語言質量和通用文本生成能力,而非基準測試優化。
LiquidAI
PyLate是一個專注於句子相似度計算和信息檢索的工具庫,能在多種數據集上進行高效的信息檢索任務,為相關領域的研究和應用提供了有力支持。該模型支持8種語言,在多個基準測試中表現出色。
unsloth
Granite-4.0-H-350M是IBM開發的輕量級指令模型,具有350M參數,在多語言處理和指令遵循方面表現出色,專為設備端部署和研究場景設計。
vanta-research
Wraith-8B是VANTA研究實體系列的首個模型,基於Meta的Llama 3.1 8B Instruct進行微調。該模型在數學推理方面表現卓越,在GSM8K基準測試中準確率達到70%,同時具備獨特的宇宙智能視角,能為多種應用場景提供強大支持。
RedHatAI
Llama-4-Maverick-17B-128E-Instruct-NVFP4是一個經過FP4量化處理的多語言大語言模型,基於Meta-Llama-3.1架構,專為商業和研究用途設計。該模型通過將權重和激活量化為FP4數據類型,顯著減少了磁盤空間和GPU內存需求,同時保持較好的性能表現。
PokeeResearch-7B是由Pokee AI開發的70億參數深度研究代理模型,結合了AI反饋強化學習(RLAIF)和強大的推理框架,能夠在工具增強的大語言模型中實現可靠、對齊和可擴展的研究級推理,適用於複雜的多步驟研究工作流程。
onnx-community
Granite-4.0-1B是IBM開發的輕量級指令模型,基於Granite-4.0-1B-Base微調而成。該模型結合了開源指令數據集和內部合成數據集,採用監督微調、強化學習和模型合併等技術開發,適合設備端部署和研究用例。
Granite-4.0-350M是IBM開發的輕量級指令模型,基於Granite-4.0-350M-Base微調而成。該模型結合了開源指令數據集和內部合成數據集,採用監督微調、強化學習和模型融合等技術開發,具備強大的指令跟隨能力,特別適合設備端部署和研究場景。
Aderyn是一個開源的Solidity智能合約靜態分析工具,由Rust編寫,幫助開發者和安全研究人員發現Solidity代碼中的漏洞。它支持Foundry和Hardhat項目,可生成多種格式報告,並提供VSCode擴展。
Agentic Radar是一個用於分析和評估代理系統的安全掃描工具,幫助開發者、研究人員和安全專家理解代理系統的工作流程並識別潛在漏洞。
基於MCP協議的AI驅動瀏覽器自動化服務器,支持自然語言控制網頁操作和深度網絡研究。
ArXiv MCP Server是一個連接AI助手與arXiv研究庫的橋樑,通過MCP協議實現論文搜索和內容訪問功能。
302AI BrowserUse MCP Server是一個基於AI的瀏覽器自動化服務器,通過Model Context Protocol (MCP)實現自然語言控制瀏覽器和網絡研究。
Open Multi-Agent Canvas是一個開源的多智能體聊天界面,支持在動態對話中管理多個智能體,用於旅行規劃、研究和通用任務處理。
Perplexity MCP Server是一個智能研究助手,利用Perplexity的AI模型自動分析查詢複雜度並選擇最佳模型處理請求,支持搜索、推理和深度研究三種工具。
Awesome MCP Servers 是一個全面的Model Context Protocol (MCP)服務器集合,涵蓋了7158個MCP服務器,分為33個類別,包括AI集成、藝術媒體、瀏覽器自動化、雲服務、數據庫、開發者工具、文件系統、金融、遊戲、硬件、醫療、基礎設施、知識管理、位置地圖、市場營銷、監控、多媒體處理、操作系統、項目管理、科學研究、安全、社交媒體、旅行交通、實用工具和版本控制等。
JADX是一款功能強大的Android Dex和Apk文件反編譯工具,支持將Dalvik字節碼轉換為Java源代碼,並能解碼資源文件和進行代碼混淆還原。提供命令行和圖形界面兩種操作方式,適用於開發者和安全研究人員。
Perplexity MCP Server是一個智能研究助手,利用Perplexity的AI模型提供自動查詢複雜度檢測和最優模型路由功能,支持搜索、推理和深度研究三種工具。
一個為Claude設計的網頁研究MCP服務器,提供實時網絡信息檢索功能
GPT Researcher MCP Server是一個基於MCP協議的AI研究服務器,能夠通過深度網絡搜索和驗證,為LLM應用提供高質量、優化的研究結果。
該項目是關於模型上下文協議(MCP)的研究與文檔,包含技術分析、實現方案、使用指南等資源,旨在全面介紹MCP生態系統。
Deep Research MCP 是一個基於Model Context Protocol (MCP) 的服務器項目,旨在通過Tavily的搜索和爬取API進行全面的網絡研究,並將數據整合為結構化的Markdown文檔,以支持大型語言模型(LLM)的高質量內容生成。
基於Anthropic研究的MCP服務器,為Claude AI提供'think'工具能力,增強複雜推理任務處理。
一個基於Node.js和Gemini API的AI研究助手工具,通過Firecrawl進行網頁數據抓取,利用Gemini大模型進行深度語言理解和報告生成,支持迭代式深度研究,並可與MCP協議集成。
定性研究知識圖譜管理服務器,提供研究項目、參與者、訪談、編碼和主題的結構化表示與管理工具
該項目展示了一個通過MCP工具投毒實現遠程代碼執行和數據竊取的安全漏洞,包含惡意服務器實現和攻擊原理說明,旨在用於教育研究。
NeoCoder是一個基於Neo4j知識圖譜的AI編程輔助系統,通過MCP服務器實現AI助手與知識圖譜的交互,提供標準化編碼工作流程、動態指令手冊和項目記憶功能。系統支持多種操作模式(incarnations),包括基礎編程、科學研究、決策分析、複雜系統建模、知識圖譜管理和代碼分析等,通過Neo4j存儲工作流模板和執行記錄,確保編碼過程的可追溯性和標準化。
一個基於Gemini Flash 2 AI模型的數據分析與研究MCP服務器,提供數據解析、智能分析、報告生成和郵件自動發送功能。