最好的Kimi-K2 AI工具模型_精選Kimi-K2資訊

AI資訊

Kimi K2 系列模型 API 下線，用戶請轉向新版本

月之暗面Kimi官方宣佈，Kimi K2系列模型API將於5月25日停止維護，用戶需遷移至最新模型kimi-k2.6，以獲得持續支持及更強多模態能力。K2系列包括多個版本，自去年7月發佈以來以萬億參數著稱，現已結束生命週期。

AMD 推出 vLLM-ATOM 插件，深度優化國產大模型推理表現

AMD發佈vLLM-ATOM插件，旨在不改變現有工作流的前提下，充分挖掘硬件潛力，爲DeepSeek-R1、Kimi-K2等主流大語言模型推理顯著提速。vLLM本身是優化高併發場景吞吐量與顯存利用率的開源框架，專注請求調度和緩存管理，ATOM插件則進一步強化了這一能力。

15k 17 小時前

加速國產大模型：AMD推出vLLM-ATOM插件大幅提升推理效率

AMD發佈vLLM-ATOM插件，專爲大語言模型部署優化，在不改變現有工作流下，顯著提升DeepSeek-R1、Kimi-K2等國產大模型在AMD硬件上的推理性能。該插件針對Instinct系列GPU定製，利用vLLM框架的高顯存利用率優勢，讓開發者以低學習成本實現技術遷移，獲得性能平滑升級。

22.6k 2 天前

火山引擎發佈業界首個Agent套餐包:整合多模態模型與聯網工具

火山引擎於5月11日發佈業界首個“Agent套餐包”——Agent Plan，推動AI應用從編程輔助向通用智能體跨越。該計劃整合字節跳動自研全模態模型（如Doubao-Seed、Doubao-Seedance）及GLM-5.1、Kimi-K2.6等第三方模型，並創新採用“Model與Harness”雙驅動技術架構。

20.8k 昨天

模型

Kimi-K2

Moonshot

輸入tokens/百萬

$16

輸出tokens/百萬

256

上下文長度

kimi-k2-0905-preview

Moonshot

輸入tokens/百萬

$16

輸出tokens/百萬

262

上下文長度

kimi-k2-turbo-preview

Moonshot

輸入tokens/百萬

$32

輸出tokens/百萬

262

上下文長度

kimi-k2-0711-preview

Moonshot

輸入tokens/百萬

$16

輸出tokens/百萬

131

上下文長度

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

商務合作網站地圖

AI資訊

Kimi K2 系列模型 API 下線，用戶請轉向新版本

AMD 推出 vLLM-ATOM 插件，深度優化國產大模型推理表現

加速國產大模型：AMD推出vLLM-ATOM插件大幅提升推理效率

火山引擎發佈業界首個Agent套餐包:整合多模態模型與聯網工具

模型

Kimi-K2

kimi-k2-0905-preview

kimi-k2-turbo-preview

kimi-k2-0711-preview

Kimi K2 Thinking MLX 3.825bit

Moonshotai.Kimi K2 Thinking GGUF

Kimi K2 Thinking MLX 4.25bit

Kimi K2 Thinking

Kimi K2 Thinking

Kimi K2 Instruct 0905 MLX 4bit

Kimi K2 Instruct 0905 Mlx 3Bit Gs32

Kimi K2 Instruct 0905 HQ4_K

Kimi K2 Instruct 0905 Mlx DQ3_K_M

Moonshotai.Kimi K2 Instruct 0905 GGUF

Kimi K2 Instruct 0905 MLX 3.824bit

Kimi K2 Instruct 0905 GGUF

Kimi K2 Instruct MLX 3.985bit

Kimi K2 Instruct

Kimi K2 Instruct 4bit

Kimi K2 Instruct

Kimi K2 Base

AI資訊

​Kimi K2 系列模型 API 下線，用戶請轉向新版本

AMD 推出 vLLM-ATOM 插件，深度優化國產大模型推理表現

加速國產大模型：AMD推出vLLM-ATOM插件大幅提升推理效率

火山引擎發佈業界首個Agent套餐包:整合多模態模型與聯網工具

模型

Kimi-K2

kimi-k2-0905-preview

kimi-k2-turbo-preview

kimi-k2-0711-preview

Kimi K2 Thinking MLX 3.825bit

Moonshotai.Kimi K2 Thinking GGUF

Kimi K2 Thinking MLX 4.25bit

Kimi K2 Thinking

Kimi K2 Thinking

Kimi K2 Instruct 0905 MLX 4bit

Kimi K2 Instruct 0905 Mlx 3Bit Gs32

Kimi K2 Instruct 0905 HQ4_K

Kimi K2 Instruct 0905 Mlx DQ3_K_M

Moonshotai.Kimi K2 Instruct 0905 GGUF

Kimi K2 Instruct 0905 MLX 3.824bit

Kimi K2 Instruct 0905 GGUF

Kimi K2 Instruct MLX 3.985bit

Kimi K2 Instruct

Kimi K2 Instruct 4bit

Kimi K2 Instruct

Kimi K2 Base

Kimi K2 系列模型 API 下線，用戶請轉向新版本