30億參數模型MiroThinker1.5通過高效交互機制,性能比肩萬億參數模型,推理成本降至1/20,推動AI向“智能密度”轉型,爲開源社區帶來新動力。
理想汽車2025年第三季度財報顯示,總營收274億元,同比下滑36.2%;淨虧損6.244億元,去年同期爲盈利28億元。管理層在電話會議中強調,公司正加速自動駕駛和AI領域轉型,自研AI推理芯片M100取得關鍵進展,預示未來戰略調整。
小米重金挖角DeepSeek核心成員羅福莉,雷軍親自推動以加速AGI佈局。羅福莉將帶領團隊構建通用人工智能,其年薪達千萬元級,反映小米對AI人才的迫切需求。儘管小米4月已開源推理型大模型MiMo,但面對行業競爭仍通過引進高端人才強化戰略推進。
高通發佈兩款雲端AI推理芯片AI200和AI250,計劃2026和2027年商用,標誌着從終端芯片向全棧AI基礎設施轉型。消息推動股價單日飆升超20%,創2019年來最大漲幅。與英偉達全能路線不同,高通聚焦大模型推理市場,主打能效與成本優勢。
Anthropic
$7
輸入tokens/百萬
$35
輸出tokens/百萬
200
上下文長度
Google
$2.1
$17.5
1k
$21
$105
$0.7
$2.8
Alibaba
$6
$24
256
$4
$16
Baidu
-
128
$2
Bytedance
$0.8
32
Deepseek
$12
Tencent
$1
$54
$163
$1.6
Openai
$0.4
$15
$525
Huawei
nvidia
NVIDIA Qwen3-32B FP4模型是阿里雲Qwen3-32B模型的量化版本,使用優化的Transformer架構,通過將權重和激活量化為FP4數據類型實現高效推理。該模型支持商業和非商業用途,適用於各種AI應用場景。
NVIDIA Qwen3-14B FP4模型是阿里巴巴Qwen3-14B模型的量化版本,採用FP4數據類型進行優化,通過TensorRT-LLM進行高效推理。該模型專為NVIDIA GPU加速系統設計,適用於AI Agent系統、聊天機器人、RAG系統等多種AI應用場景,支持全球範圍內的商業和非商業使用。
一個基於量子場計算模型的Claude多實例協同推理服務器,通過場一致性優化實現增強型AI推理能力。
Sensei MCP是一個多角色工程導師系統,集成了64個專業AI角色,通過協作指導提供工程標準和建議。它能在Claude推理前注入相關工程規範,支持多種文件類型和上下文感知,並具備會話記憶和團隊協作功能。