騰訊調整大模型研發架構,新設AI Infra部、AI Data部及數據計算平臺部,以強化從算力到數據的全鏈路競爭力。Vincesyao出任首席AI科學家,直接向總裁劉熾平彙報。
AI模型在科學推理能力評估方面取得重要進展,已在國際數學和信息學奧林匹克競賽中表現優異。隨着GPT-5等先進模型的發展,AI正有效加速真實科學研究進程,展現出強大的假設提出、測試修正及跨領域綜合能力。
英偉達在NeurIPS大會上發佈自動駕駛AI模型Alpamayo-R1(AR1),這是全球首個行業級開放推理視覺語言行動模型。它能同時處理文本和圖像,將傳感器信息轉化爲自然語言描述,結合推理鏈AI和路徑規劃技術,以應對複雜駕駛場景,加速無人駕駛汽車發展。
OpenAI推出“懺悔”框架,訓練AI模型主動承認不當行爲或問題決策,旨在解決大語言模型因追求“符合預期”而可能產生虛假陳述的問題。該框架引導模型在給出主要答案後進行二次迴應,詳細說明其推理過程。
AI21 Jamba Large 1.6 是一款強大的混合 SSM-Transformer 架構基礎模型,擅長長文本處理和高效推理。
DeepSeek-V3/R1 推理系統是一個高性能的分佈式推理架構,專為大規模 AI 模型優化設計。
xAI推出的最新旗艦AI模型Grok 3,具備強大的推理和多模態處理能力。
Google
$0.49
輸入tokens/百萬
$2.1
輸出tokens/百萬
1k
上下文長度
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
$6
$24
$2
$20
$4
$16
Baidu
128
Bytedance
$1.2
$3.6
4
$3.9
$15.2
64
XiaomiMiMo
米模具身模型(MiMo-Embodied)是一款強大的跨具身視覺語言模型,在自動駕駛和具身AI任務中均展現出了卓越的性能。它是首個將這兩個關鍵領域相結合的開源視覺語言模型,顯著提升了在動態物理環境中的理解和推理能力。
moonshotai
Kimi K2 Thinking 是月之暗面(Moonshot AI)開發的最新一代開源思維模型,具有強大的深度推理能力和工具調用功能。該模型採用混合專家架構,支持原生INT4量化,擁有256k上下文窗口,在多個基準測試中表現出色。
unsloth
Qwen3-VL-2B-Instruct是Qwen系列中最強大的視覺語言模型,具備卓越的文本理解與生成能力、深入的視覺感知與推理能力、長上下文支持以及強大的空間和視頻動態理解能力。該模型採用2B參數規模,支持指令交互,適用於多模態AI應用。
Mungert
PokeeResearch-7B是由Pokee AI開發的70億參數深度研究代理模型,結合了AI反饋強化學習(RLAIF)和強大的推理框架,能夠在工具增強的大語言模型中實現可靠、對齊和可擴展的研究級推理,適用於複雜的多步驟研究工作流程。
LiquidAI
LFM2-VL-3B是Liquid AI開發的多模態視覺語言模型,基於LFM2骨幹架構構建,具備強大的視覺理解和推理能力,特別在細粒度感知任務上表現出色。該模型能夠高效處理文本和圖像輸入,支持高達512×512分辨率的原生圖像處理。
GLM-4.6是智譜AI開發的新一代大語言模型,相比GLM-4.5在上下文處理、編碼能力和推理性能方面有顯著提升。該模型支持200K上下文長度,在多個公開基準測試中表現出色,特別在代碼生成、推理和代理任務方面具有競爭優勢。
zai-org
GLM-4.6-FP8是智譜AI推出的新一代文本生成模型,相比GLM-4.5在多個關鍵方面有顯著改進。該模型具有更長的上下文窗口、卓越的編碼性能、高級推理能力和更強大的智能體功能,能夠處理更復雜的任務。
geoffmunn
這是Qwen/Qwen3-0.6B語言模型的GGUF量化版本,一個擁有6億參數的緊湊大語言模型,專為在低資源設備上進行超快速推理而設計。支持llama.cpp、LM Studio、OpenWebUI和GPT4All等框架,可在任何地方離線使用私有AI。
mlx-community
基於智譜AI GLM-4.5-Air模型轉換的3位深度量化權重(Deep Weight Quantization)版本,專為MLX框架優化,在保持較高性能的同時顯著減少模型大小和推理資源需求
cpatonn
GLM-4.5V-AWQ-4bit是基於智譜AI下一代旗艦文本基礎模型構建的量化版本多模態模型,通過AWQ-4bit量化技術優化,在保持優異性能的同時顯著降低計算資源需求。該模型在42個公開視覺語言基準測試中達到同規模模型的SOTA性能,具備強大的視覺推理能力。
nvidia
NVIDIA-Nemotron-Nano-9B-v2是NVIDIA從頭訓練的大語言模型,專為推理和非推理任務設計。採用Mamba2-Transformer混合架構,支持多語言處理,具備可控推理能力,允許用戶指定思考預算,在商業應用和AI代理系統中表現出色。
GLM-4.5-Air-6bit是基於智譜AI的GLM-4.5-Air模型轉換而來的6位量化版本,專為MLX框架優化,提供高效的大語言模型推理能力。
基於Meta Llama-3.3-70B-Instruct的大語言模型,經過多階段訓練優化,在推理、聊天等任務上表現出色,支持多種語言,適用於多種AI應用場景。採用神經架構搜索技術優化,能夠在單個H100-80GB GPU上高效運行。
Intelligent-Internet
II-Medical-8B是智能互聯網研發的新一代醫療大語言模型,專為增強AI醫療推理能力而設計,在醫療問答能力上實現重大突破。
NeuraLakeAi
神經湖iSA-03迷你3B是由神經湖科技研發的先進AI模型,融合了傳統大語言模型的直接響應能力與自動多步推理功能,支持256K token的超長上下文處理。
GLM-4-Z1-9B-0414是智譜AI推出的新一代90億參數開源大語言模型,具有強大的文本生成和推理能力。該模型在數學推理和通用任務方面表現出色,在資源受限場景下實現了效率與效果的出色平衡,支持友好的本地部署。
ModelCloud
DeepSeek-V3-0324是DeepSeek AI推出的BF16版本大語言模型,適用於不支持FP8的GPU進行量化和推理。
RUC-AIBOX
STILL-3-TOOL-32B是一個通過Python代碼輔助推理過程的大語言模型,在AIME 2024評估中達到81.70%準確率。
ai21labs
AI21 Jamba 1.5是一系列先進的基礎模型,具備強大的長上下文處理能力和高效的推理速度,適用於多種業務場景。
lucyknada
WizardLM-2 7B是微軟AI團隊開發的高效大語言模型,基於Mistral-7B架構,在多語言、推理和代理任務上表現優異。
GemForge是將Google的Gemini AI與MCP生態系統連接的企業級工具,提供即時網絡訪問、高級推理、代碼分析和多文件處理等功能,支持60多種文件格式,具備智能模型選擇和強大的錯誤處理機制。
GemForge是將谷歌Gemini AI與MCP生態系統連接的企業級工具,提供即時網絡訪問、高級推理、代碼分析和多文件處理等功能,支持60多種文件格式,具備智能模型選擇和強大的錯誤處理機制。