最好的AI推理大模型 AI工具模型_精選AI推理大模型資訊

AI資訊

騰訊大模型架構重磅升級:成立 AI Infra 與 Data 部門，構建大模型訓練推理全鏈路競爭力

騰訊調整大模型研發架構，新設AI Infra部、AI Data部及數據計算平臺部，以強化從算力到數據的全鏈路競爭力。Vincesyao出任首席AI科學家，直接向總裁劉熾平彙報。

8.1k 5 分鐘前

騰訊大模型架構重磅升級:成立 AI Infra 與 Data 部門，構建大模型訓練推理全鏈路競爭力

AI 科學研究新基準:FrontierScience 評估模型推理能力

AI模型在科學推理能力評估方面取得重要進展，已在國際數學和信息學奧林匹克競賽中表現優異。隨着GPT-5等先進模型的發展，AI正有效加速真實科學研究進程，展現出強大的假設提出、測試修正及跨領域綜合能力。

7.7k 23 分鐘前

英偉達發佈開放式推理 AI 助力自動駕駛技術邁向新臺階

英偉達在NeurIPS大會上發佈自動駕駛AI模型Alpamayo-R1（AR1），這是全球首個行業級開放推理視覺語言行動模型。它能同時處理文本和圖像，將傳感器信息轉化爲自然語言描述，結合推理鏈AI和路徑規劃技術，以應對複雜駕駛場景，加速無人駕駛汽車發展。

11.9k 6 小時前

OpenAI 推出 AI “懺悔”框架:旨在訓練模型承認不當行爲，提高誠實度

OpenAI推出“懺悔”框架，訓練AI模型主動承認不當行爲或問題決策，旨在解決大語言模型因追求“符合預期”而可能產生虛假陳述的問題。該框架引導模型在給出主要答案後進行二次迴應，詳細說明其推理過程。

8.7k 5 小時前

AI產品

AI21-Jamba-Large-1.6

AI21 Jamba Large 1.6 是一款強大的混合 SSM-Transformer 架構基礎模型，擅長長文本處理和高效推理。

模型訓練與部署

10.1k

DeepSeek-V3/R1 推理系統

DeepSeek-V3/R1 推理系統是一個高性能的分佈式推理架構，專為大規模 AI 模型優化設計。

模型訓練與部署

9.4k

Grok 3

xAI推出的最新旗艦AI模型Grok 3，具備強大的推理和多模態處理能力。

AI模型

27.4k

模型

Gemini 2.0 Flash-Lite

Google

$0.49

輸入tokens/百萬

$2.1

輸出tokens/百萬

上下文長度

GPT-4.1 mini

Openai

$2.8

輸入tokens/百萬

$11.2

輸出tokens/百萬

上下文長度

Grok 4 Fast

Xai

$1.4

輸入tokens/百萬

$3.5

輸出tokens/百萬

上下文長度

o3-mini

Openai

$7.7

輸入tokens/百萬

$30.8

輸出tokens/百萬

200

上下文長度

GPT-5 Codex

Openai

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Claude 3 Opus

Anthropic

$105

輸入tokens/百萬

$525

輸出tokens/百萬

200

上下文長度

Gemini 2.0 Flash

Google

$0.7

輸入tokens/百萬

$2.8

輸出tokens/百萬

上下文長度

Claude Haiku 4.5

Anthropic

輸入tokens/百萬

$35

輸出tokens/百萬

200

上下文長度

Gemini 2.5 Flash

Google

$2.1

輸入tokens/百萬

$17.5

輸出tokens/百萬

上下文長度

Claude Sonnet 4.5

Anthropic

$21

輸入tokens/百萬

$105

輸出tokens/百萬

200

上下文長度

Claude 3 Sonnet

Anthropic

$21

輸入tokens/百萬

$105

輸出tokens/百萬

200

上下文長度

Gemini 2.5 Flash-Lite

Google

$0.7

輸入tokens/百萬

$2.8

輸出tokens/百萬

上下文長度

qwen3-vl-plus

Alibaba

輸入tokens/百萬

$10

輸出tokens/百萬

256

上下文長度

qwen3-max

Alibaba

輸入tokens/百萬

$24

輸出tokens/百萬

256

上下文長度

qwen3-vl-235b-a22b-thinking

Alibaba

輸入tokens/百萬

$20

輸出tokens/百萬

上下文長度

qwen3-coder-plus

Alibaba

輸入tokens/百萬

$16

輸出tokens/百萬

上下文長度

Qianfan-Lightning

Baidu

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

Doubao-Seed-Translation

Bytedance

$1.2

輸入tokens/百萬

$3.6

輸出tokens/百萬

上下文長度

Qwen3-Next-80B-A3B-Instruct

Alibaba

輸入tokens/百萬

輸出tokens/百萬

256

上下文長度

qwen3-omni-flash-realtime

Alibaba

$3.9

輸入tokens/百萬

$15.2

輸出tokens/百萬

上下文長度

MCP

GemForge (Google Gemini)

已認證

GemForge是將Google的Gemini AI與MCP生態系統連接的企業級工具，提供即時網絡訪問、高級推理、代碼分析和多文件處理等功能，支持60多種文件格式，具備智能模型選擇和強大的錯誤處理機制。

typescript

5.2k

2.5分

GemForge MCP

GemForge是將谷歌Gemini AI與MCP生態系統連接的企業級工具，提供即時網絡訪問、高級推理、代碼分析和多文件處理等功能，支持60多種文件格式，具備智能模型選擇和強大的錯誤處理機制。

智啟未來，您的人工智能解決方案智庫

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商務合作網站地圖

AI資訊

騰訊大模型架構重磅升級:成立 AI Infra 與 Data 部門，構建大模型訓練推理全鏈路競爭力

AI 科學研究新基準:FrontierScience 評估模型推理能力

​英偉達發佈開放式推理 AI 助力自動駕駛技術邁向新臺階

OpenAI 推出 AI “懺悔”框架:旨在訓練模型承認不當行爲，提高誠實度

AI產品

AI21-Jamba-Large-1.6

DeepSeek-V3/R1 推理系統

Grok 3

模型

Gemini 2.0 Flash-Lite

GPT-4.1 mini

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen3-vl-plus

qwen3-max

qwen3-vl-235b-a22b-thinking

qwen3-coder-plus

Qianfan-Lightning

Doubao-Seed-Translation

Qwen3-Next-80B-A3B-Instruct

qwen3-omni-flash-realtime

MiMo Embodied 7B

Kimi K2 Thinking

Qwen3 VL 2B Instruct GGUF

Pokee_research_7b GGUF

LFM2 VL 3B

GLM 4.6 GGUF

GLM 4.6 FP8

Qwen3 0.6B

GLM 4.5 Air 3bit DWQ V2

GLM 4.5V AWQ 4bit

NVIDIA Nemotron Nano 9B V2

GLM 4.5 Air 6bit

Llama 3_3 Nemotron Super 49B V1_5 GGUF

II Medical 8B

ISA 03 Mini 3B Hybrid Preview

GLM Z1 9B 0414

DeepSeek V3 0324 BF16

STILL 3 TOOL 32B

AI21 Jamba Large 1.5

Microsoft_WizardLM 2 7B

MCP

GemForge (Google Gemini)

GemForge MCP

英偉達發佈開放式推理 AI 助力自動駕駛技術邁向新臺階