摩根士丹利研報顯示,谷歌計劃對外銷售TPU芯片,目標2027年出貨100萬顆,其中50萬顆預計爲雲業務帶來130億美元增量收入,佔雲收入11%,提升EPS約3%。消息推動Alphabet股價月漲近20%,跑贏納指。谷歌正從自用轉向對外銷售模式,Meta爲首批重點客戶。
《亞太治理展望2026》報告顯示,近半數亞洲企業將人工智能作爲2026年首要戰略重點,比例達48%,超過追求增長機會(45%)、網絡安全風險管理(39%)和應對地緣政治風險。這表明面對經濟與地緣政治不確定性,AI正成爲企業戰略核心。
快手發佈新一代多模態模型Keye-VL-671B-A37B並開源代碼。該模型具備“善看會想”特性,在視覺理解、視頻分析和數學推理等核心基準測試中表現優異,強化了視覺感知與跨模態對齊能力,展現快手在AI領域的技術實力。
OpenAI的數據中心合作伙伴正揹負鉅額債務,總額預計近1000億美元,而OpenAI自身卻無需承擔財務風險。軟銀、甲骨文等已舉債300億美元投資相關數據中心,基礎設施公司另靠訂單償還約280億美元貸款,新增債務達380億美元。
nao是專為數據團隊設計的AI數據編輯器,連接倉庫,用AI高效處理數據。
Klariqo是企業AI助手,24/7處理電話與網站聊天,自動預約、篩選線索,有免費試用。
可無限對話創建和聊天AI角色,無過濾限制,保護隱私
AI驅動的企業名稱生成器,為創業者和企業提供獨特名稱創意。
deepseek
$3.6
輸入tokens/百萬
$15.48
輸出tokens/百萬
128k
上下文長度
xai
$2.16
1M
google
$18
anthropic
$108
$540
200k
chatglm
$0.43
$1.01
131.1k
minimax
-
moonshotai
$4.1
$16.56
$21.6
mistral
upstage
64k
openai
$72
2M
RinggAI
這是一個專為通話記錄分析打造的混合語言AI模型,能夠處理印地語、英語和混合印地英語的通話轉錄內容。模型基於Qwen2.5-1.5B-Instruct進行微調,具備強大的多語言理解和信息提取能力。
prithivMLmods
Olmo-3-7B-Instruct-AIO-GGUF是基於Allen Institute for AI開發的Olmo-3-7B-Instruct模型的GGUF量化版本。這是一個70億參數的自迴歸語言模型,通過監督微調和直接偏好優化在Tulu 2和UltraFeedback等數據集上訓練,在問答和指令遵循方面表現出色。
bartowski
這是對ai-sage的GigaChat3-10B-A1.8B模型進行的量化處理版本,採用llama.cpp的imatrix量化技術,可在不同硬件條件下更高效地運行。模型支持俄語和英語,主要用於文本生成任務。
ubergarm
這是ai-sage/GigaChat3-10B-A1.8B-bf16模型的GGUF量化版本,提供了多種量化選項,從高精度的Q8_0到極度壓縮的smol-IQ1_KT,滿足不同硬件條件下的部署需求。該模型支持32K上下文長度,採用MLA架構,專為對話場景優化。
DevQuasar
這是 ai-sage/GigaChat3-702B-A36B-preview-bf16 模型的量化版本,旨在為大眾提供免費的知識獲取途徑。該模型是一個大型語言模型,專注於文本生成任務。
evilfreelancer
這是ai-sage/GigaChat3-10B-A1.8B模型的量化版本,採用GGUF格式,需要特定的llama.cpp分支支持。模型採用混合專家架構,總參數量約118億,其中激活參數量約18億。
VibeThinker-1.5B是微博AI推出的15億參數密集語言模型,基於Qwen2.5-Math-1.5B微調,專門針對數學和算法編碼問題設計。採用'頻譜到信號原理'框架訓練,在多個數學競賽測試中超越規模更大的模型,訓練成本約7800美元,支持最長約40k詞元的輸出。
ai-sage
GigaChat3-10B-A1.8B是GigaChat系列的對話模型,基於混合專家(MoE)架構,共有100億參數,其中18億為活躍參數。該模型採用多頭潛在注意力和多令牌預測技術,支持25.6萬令牌的長上下文,在多語言對話和推理任務中表現出色。
allenai
Olmo 3是由Allen Institute for AI開發的新一代語言模型家族,包含7B和32B的指令和思維變體。該模型在長鏈式思維方面表現出色,能顯著提升數學和編碼等推理任務的性能。所有代碼、檢查點和訓練細節都將公開,推動語言模型科學發展。
Olmo 3是由Allen Institute for AI開發的新一代語言模型系列,包含7B和32B兩種規模,有指令和思考兩種變體。該模型基於Dolma 3數據集進行預訓練,在Dolci數據集上進行後訓練,具備長鏈式思維能力,在數學和編碼等推理任務上表現優異。
GigaAM-v3是基於Conformer架構的俄語自動語音識別基礎模型,擁有2.2-2.4億參數。它是GigaAM系列的第三代模型,在70萬小時俄語語音數據上使用HuBERT-CTC目標進行預訓練,在廣泛的俄語ASR領域提供最先進的性能。
GigaChat3-10B-A1.8B-base是GigaChat系列的基礎預訓練模型,採用混合專家(MoE)架構,總參數100億,活躍參數18億。模型集成了多頭潛在注意力(MLA)和多令牌預測(MTP)技術,在推理時具備高吞吐量優勢。
XiaomiMiMo
米模具身模型(MiMo-Embodied)是一款強大的跨具身視覺語言模型,在自動駕駛和具身AI任務中均展現出了卓越的性能。它是首個將這兩個關鍵領域相結合的開源視覺語言模型,顯著提升了在動態物理環境中的理解和推理能力。
Olmo 3是由Allen Institute for AI開發的一系列語言模型,包含7B和32B兩種規模,具有指令式和思考式兩種變體。該模型在長鏈式思維方面表現出色,能有效提升數學和編碼等推理任務的性能。採用多階段訓練方式,包括有監督微調、直接偏好優化和可驗證獎勵的強化學習。
Olmo-3-7B-Think-DPO是Allen Institute for AI開發的7B參數語言模型,具有長鏈式思考能力,在數學和編碼等推理任務中表現出色。該模型經過監督微調、直接偏好優化和基於可驗證獎勵的強化學習等多階段訓練,專為研究和教育用途設計。
Olmo 3是由Allen Institute for AI (Ai2)開發的一系列語言模型,包含7B和32B兩種規格,有Instruct和Think兩種變體。該模型基於Transformer架構,具有長鏈思維能力,可有效提升數學和編碼等推理任務的表現。
Olmo 3是由Allen Institute for AI開發的開源語言模型系列,包含7B和32B兩種規格,分為指令(Instruct)和思考(Think)兩種變體。該模型具有出色的長鏈思維能力,能夠顯著提升數學和編碼等推理任務的表現。
Olmo 3是由Allen Institute for AI開發的全新語言模型家族,包含7B和32B兩種規模,有指令(Instruct)和思維(Think)兩種變體。該模型採用長鏈式思維提升數學和編碼等推理任務表現,旨在推動語言模型科學發展。
Olmo 3 7B RL-Zero Math是Allen AI開發的專為數學推理任務優化的70億參數語言模型,採用RL-Zero強化學習方法在數學數據集上進行訓練,能有效提升數學推理能力。
Olmo 3 7B RL-Zero Mix是Allen AI開發的7B參數規模的語言模型,屬於Olmo 3系列。該模型在Dolma 3數據集上進行預訓練,在Dolci數據集上進行後訓練,並通過強化學習優化數學、編碼和推理能力。
Scrapling是一個自適應網頁抓取庫,能自動學習網站變化並重新定位元素,支持多種抓取方式和AI集成,提供高性能解析和開發者友好體驗。
iMCP是一款macOS應用,通過AI連接用戶的數字生活,支持與Claude Desktop等客戶端通過Model Context Protocol (MCP)協議交互,提供日曆、聯繫人、位置、地圖、消息、提醒和天氣等多種功能。
XcodeBuild MCP是一個為AI助手和MCP客戶端提供Xcode相關工具集成的服務器,支持Xcode項目管理、模擬器控制和應用工具等功能,實現自動化開發流程。
Deebo是一個AI調試助手,能夠加速代碼錯誤的解決過程,通過自動化調查和多線程工作流提升開發效率。
MCP Unity是一個實現Model Context Protocol的Unity編輯器擴展,允許AI助手與Unity項目交互,提供Unity與Node.js服務器之間的橋樑。
Cognee是一個為AI代理提供記憶功能的開源項目,通過模塊化ECL管道構建動態知識圖譜,支持多種數據源和格式,減少幻覺並降低成本。
Repomix是一個將代碼庫打包為AI友好格式的工具,支持本地和遠程倉庫處理,提供代碼壓縮、安全檢查和多種輸出格式。
Refact Agent 是一個開源AI編程助手,支持多語言代碼生成、調試和優化,集成主流開發工具,可本地化部署並提供智能補全和代碼解釋功能。
Klavis AI是一個開源項目,提供在Slack、Discord和Web平臺上簡單易用的MCP(模型上下文協議)服務,包括報告生成、YouTube工具、文檔轉換等多種功能,支持非技術用戶和開發者使用AI工作流。
Solana Agent Kit是一個開源工具包,用於將AI代理連接到Solana協議,支持60多種區塊鏈操作。
Stripe Agent Toolkit是一個支持多種AI代理框架(如OpenAI、LangChain、CrewAI等)與Stripe API集成的工具包,提供Python和TypeScript支持,簡化支付相關操作。
MCP Unity是一個實現Model Context Protocol的Unity編輯器擴展,通過Node.js服務器橋接AI助手與Unity項目的交互,提供菜單執行、對象選擇、組件更新等功能。
微軟官方MCP服務器,為AI助手提供最新微軟技術文檔的搜索和獲取功能
Inbox Zero是一款開源AI郵件助手和客戶端,幫助用戶高效管理郵件,實現收件箱清零。
hyper-mcp是一個基於WebAssembly插件的高性能MCP服務器,支持通過容器註冊表分發插件,適用於多種AI應用場景。
Supermemory是一個AI驅動的記憶引擎,旨在通過整合個人數據為LLM提供上下文知識,實現信息的智能管理和檢索。
PG-MCP是一個為PostgreSQL數據庫設計的模型上下文協議服務器,提供AI代理發現、連接、查詢和理解數據庫的API,支持多數據庫連接、豐富的目錄信息和查詢解釋功能。
Browser MCP是一個MCP服務器+Chrome擴展,通過AI應用(如VS Code、Claude等)實現瀏覽器自動化操作,具有快速、隱私保護、保持登錄狀態和規避檢測等特點。
一個為AI工作流提供shadcn/ui組件集成的MCP服務器,支持React、Svelte和Vue框架,包含組件源碼、示例和元數據訪問功能。
HiveChat是一個專為中小團隊設計的AI聊天應用,支持多種大模型服務商,提供分組管理、Token限額、第三方登錄等功能。