阿里巴巴通義千問團隊在NeurIPS 2025獲最佳論文獎,論文《Attention Gating Makes Better Foundation Models》提出“滑動門”機制,在標準注意力後添加可學習門控,動態篩選關鍵頭和token參與下游計算。實驗證明,1.7B稠密模型性能媲美15B MoE模型。本屆大會投稿2萬篇,錄取率僅25%,競爭激烈,該論文是四篇獲獎作品中唯一中國成果。
摩根士丹利研報顯示,谷歌計劃對外銷售TPU芯片,目標2027年出貨100萬顆,其中50萬顆預計爲雲業務帶來130億美元增量收入,佔雲收入11%,提升EPS約3%。消息推動Alphabet股價月漲近20%,跑贏納指。谷歌正從自用轉向對外銷售模式,Meta爲首批重點客戶。
《亞太治理展望2026》報告顯示,近半數亞洲企業將人工智能作爲2026年首要戰略重點,比例達48%,超過追求增長機會(45%)、網絡安全風險管理(39%)和應對地緣政治風險。這表明面對經濟與地緣政治不確定性,AI正成爲企業戰略核心。
谷歌限制Gemini 3 Pro和Nano Banana Pro免費用戶權限,因用戶激增致容量壓力。Gemini 3 Pro免費用戶每日提示詞上限從5條減少,以應對高需求。
nao是專為數據團隊設計的AI數據編輯器,連接倉庫,用AI高效處理數據。
Klariqo是企業AI助手,24/7處理電話與網站聊天,自動預約、篩選線索,有免費試用。
可無限對話創建和聊天AI角色,無過濾限制,保護隱私
AI驅動的企業名稱生成器,為創業者和企業提供獨特名稱創意。
xai
$21.6
輸入tokens/百萬
$108
輸出tokens/百萬
256k
上下文長度
openai
$144
$576
200k
google
$9
$72
1M
$14.4
$57.6
$7.92
$31.68
deepseek
$3.6
$15.48
128k
400k
$2.16
$18
anthropic
$540
chatglm
$0.43
$1.01
131.1k
$4.03
$7.99
minimax
-
alibaba
$0.72
$432
drbaph
Z-Image(造相)是一個擁有60億參數的高效圖像生成基礎模型,專門解決圖像生成領域的效率和質量問題。其蒸餾版本Z-Image-Turbo僅需8次函數評估就能達到或超越領先競品,在企業級H800 GPU上可實現亞秒級推理延遲,並能在16G VRAM的消費級設備上運行。
T5B
Z-Image-Turbo 是經過 FP8 E5M2 和 E4M3FN 格式量化的圖像處理模型,基於原始 Tongyi-MAI/Z-Image-Turbo 模型優化,在保持性能的同時顯著減少模型大小和推理資源需求。
Shawon16
這是一個基於VideoMAE-base架構微調的視頻理解模型,專門針對手語識別任務進行優化。模型在WLASL數據集上訓練了200個epoch,採用TimeSformer架構處理視頻序列。
這是一個基於VideoMAE-base架構微調的視頻理解模型,專門針對手語識別任務進行優化。模型在WLASL100數據集上訓練了200個epoch,具備視頻動作識別能力。
PrimeIntellect
INTELLECT-3是一個擁有1060億參數的混合專家(MoE)模型,通過大規模強化學習訓練而成。在數學、編碼和推理基準測試中展現出卓越性能,模型、訓練框架和環境均以寬鬆許可協議開源。
SerialKicked
這是Qwen3-VL-32B-Thinking-heretic的量化版本,採用新的消融方法進行量化,相比傳統方法對基礎模型的損害更小。提供多種量化精度版本,適合在24GB顯存設備上運行,支持圖文轉文本任務。
RinggAI
這是一個專為通話記錄分析打造的混合語言AI模型,能夠處理印地語、英語和混合印地英語的通話轉錄內容。模型基於Qwen2.5-1.5B-Instruct進行微調,具備強大的多語言理解和信息提取能力。
這是一個基於VideoMAE-base架構在未知數據集上微調的視頻理解模型,專門用於手語識別任務。模型在20個訓練週期後達到了18.64%的準確率。
city96
FLUX.2-dev是由black-forest-labs開發的圖像生成和編輯模型,已轉換為GGUF格式,專為圖像生成任務優化,採用擴散模型架構,支持在ComfyUI框架中使用。
gguf-org
flux2-dev-gguf 是一個基於 FLUX.2-dev 的圖像到圖像轉換模型,專門用於根據文本提示生成特定風格的圖像。該模型支持在 ComfyUI 環境中運行,能夠將文本描述轉換為風格化的視覺內容。
Clemylia
皮卡丘語言模型是Clemylia發起的一項獨特的實驗性語言項目,完全從零開始訓練,僅基於'皮卡丘'的聲音語料庫,展示了小型語言模型創造原生語言身份的能力。
silveroxides
基於 black-forest-labs/FLUX.2-dev 的優化版本圖像生成模型,支持圖像到圖像的生成和編輯任務,採用 fp8_scaled 量化技術提升推理速度,特別適合在低顯存 GPU 上使用。
ostris
這是一個基於LoRA技術的文本到圖像轉換模型,專門用於生成具有法國印象派畫家貝爾特·莫里索藝術風格的圖像。該模型在FLUX.2-dev基礎模型上訓練,能夠將普通圖像或文本描述轉換為莫里索風格的畫作。
Tongyi-MAI
Z-Image是一款功能強大且高效的圖像生成模型,擁有60億參數。它能有效解決圖像生成領域在效率、質量和功能多樣性方面的問題,為用戶提供高質量的圖像生成和編輯服務。
TomoroAI
TomoroAI/tomoro-colqwen3-embed-4b是一款先進的ColPali風格多模態嵌入模型,能夠將文本查詢、視覺文檔(如圖像、PDF)或短視頻映射為對齊的多向量嵌入。該模型結合了Qwen3-VL-4B-Instruct和Qwen3-Embedding-4B的優勢,在ViDoRe基準測試中表現出色,同時顯著減少了嵌入佔用空間。
optimum-internal-testing
這是一個Hugging Face Hub上的🤗 Transformers模型,具體信息待補充。模型卡片為自動生成,需要模型發佈者提供更多詳細信息。
Gjm1234
Wan2.2是基礎視頻模型的重大升級版本,專注於將有效MoE架構、高效訓練策略和多模態融合等創新技術融入視頻擴散模型,為視頻生成領域帶來更強大、更高效的解決方案。
這是一個基於VideoMAE架構的視頻理解模型,在Kinetics數據集預訓練的基礎上進行了微調,專門用於手語識別任務。模型在評估集上表現有待提升,準確率為0.0010。
bartowski
這是微軟Fara-7B模型的量化版本,使用llama.cpp的imatrix技術進行優化。該模型支持多種量化級別,從高精度的bf16到極低精度的IQ2_M,滿足不同硬件配置和性能需求。
Trilogix1
Fara-7B是微軟專門為計算機使用場景設計的高效小型語言模型,參數僅70億,在網頁操作等高級用戶任務中表現出色,能與更大型的代理系統競爭。
mcp-installer是一個用於安裝其他MCP服務器的服務工具,支持通過npm或PyPi安裝Node和Python服務器,簡化MCP服務器的部署流程。
MCP-Framework是一個基於TypeScript的框架,用於優雅地構建模型上下文協議(MCP)服務器。它提供開箱即用的架構,支持自動目錄發現工具、資源和提示,具有多種傳輸方式和類型安全特性。
mcp-proxy是一個實現服務器傳輸協議轉換的工具,支持在SSE和stdio兩種模式間進行代理轉換,便於不同客戶端與服務器間的通信適配。
虛幻引擎模型上下文協議(MCP)集成的文檔,幫助理解、設置和使用MCP系統。
Scrapling是一個自適應網頁抓取庫,能自動學習網站變化並重新定位元素,支持多種抓取方式和AI集成,提供高性能解析和開發者友好體驗。
codemcp是一個將Claude Desktop轉變為結對編程助手的工具,允許用戶直接讓Claude在本地代碼庫上實現功能、修復錯誤和重構代碼。
該項目為Notion API實現了一個MCP服務器,允許通過模型上下文協議訪問和操作Notion內容,支持搜索、評論、添加頁面等功能。
Aderyn是一個開源的Solidity智能合約靜態分析工具,由Rust編寫,幫助開發者和安全研究人員發現Solidity代碼中的漏洞。它支持Foundry和Hardhat項目,可生成多種格式報告,並提供VSCode擴展。
iMCP是一款macOS應用,通過AI連接用戶的數字生活,支持與Claude Desktop等客戶端通過Model Context Protocol (MCP)協議交互,提供日曆、聯繫人、位置、地圖、消息、提醒和天氣等多種功能。
XcodeBuild MCP是一個為AI助手和MCP客戶端提供Xcode相關工具集成的服務器,支持Xcode項目管理、模擬器控制和應用工具等功能,實現自動化開發流程。
Deebo是一個AI調試助手,能夠加速代碼錯誤的解決過程,通過自動化調查和多線程工作流提升開發效率。
Supabase MCP服務器是一個開源工具,允許IDE安全執行SQL、管理模式變更、調用Supabase管理API和使用Auth Admin SDK,內置安全控制。
MCP Go 是一個 Go 語言實現的模型上下文協議(MCP)服務端框架,用於連接 LLM 應用與外部數據源和工具。它提供了資源管理、工具調用、提示模板等核心功能,支持會話管理和中間件擴展。
MCP Unity是一個實現Model Context Protocol的Unity編輯器擴展,允許AI助手與Unity項目交互,提供Unity與Node.js服務器之間的橋樑。
該項目是一個集成Sonar API的MCP服務器實現,為Claude提供即時網絡搜索能力。包含系統架構、工具配置、Docker部署及多平臺集成指南。
Cognee是一個為AI代理提供記憶功能的開源項目,通過模塊化ECL管道構建動態知識圖譜,支持多種數據源和格式,減少幻覺並降低成本。
一個基於Playwright的MCP服務器,為LLM提供瀏覽器自動化能力
Repomix是一個將代碼庫打包為AI友好格式的工具,支持本地和遠程倉庫處理,提供代碼壓縮、安全檢查和多種輸出格式。
Refact Agent 是一個開源AI編程助手,支持多語言代碼生成、調試和優化,集成主流開發工具,可本地化部署並提供智能補全和代碼解釋功能。
Klavis AI是一個開源項目,提供在Slack、Discord和Web平臺上簡單易用的MCP(模型上下文協議)服務,包括報告生成、YouTube工具、文檔轉換等多種功能,支持非技術用戶和開發者使用AI工作流。