中國AI公司月之暗面完成超7億美元融資,估值達100-120億美元,由阿里、騰訊領投。其大模型Kimi帶動營收快速增長,展現強勁商業潛力。
2026年春節期間,國產AI大模型在全球開發者生態中表現突出。根據AIbase對OpenRouter平臺的數據統計,國產模型在前十名中的總token消耗量佔比高達61%,包攬前三名,顯示出強大的市場影響力。排名前三的模型分別是MiniMax M2.5、Kimi K2.5和智譜GLM-5,其中MiniMax M2.5以2.45萬億token的調用量位居榜首。
國產大模型月之暗面旗下Kimi K2.5發佈近20天累計收入已超2025年全年總額,吸金能力驚人。其業績神話主要得益於全球化佈局,尤其是海外付費用戶的爆發式增長成爲核心驅動力。
中國AI大模型在全球競爭中表現強勁,OpenRouter平臺數據顯示,前十名模型總Token量達8.7萬億,其中中國模型佔5.3萬億,市場份額高達61%。MiniMax M2.5以2.45萬億Token位居榜首,Kimi K2.5以1.21萬億Token緊隨其後,顯示中國AI技術正快速佔領全球開發者市場。
強大的開源Kimi K2聊天平臺,通過Kimi AI在編程和數學基準測試中超越GPT-4。企業級Kimi AI,成本降低95%。
開源編碼 LLM,專為軟件工程任務設計。
Kimi-Audio 是一個開源音頻基礎模型,擅長音頻理解與生成。
高效的開源專家混合視覺語言模型,具備多模態推理能力。
Moonshot
$4
輸入tokens/百萬
$16
輸出tokens/百萬
256
上下文長度
Minimax
-
$5
$20
32
$10
$30
131
$2
8
$200
$1
262
$8
$32
inferencerlabs
Kimi - K2 - Thinking 3.825bit MLX 是一款用於文本生成的量化模型,通過不同的量化方式在測試中取得不同的困惑度表現,其中q3.825bit量化能達到1.256的困惑度。
DevQuasar
本項目基於 moonshotai/Kimi-K2-Thinking 基礎模型,通過自定義反量化腳本將原始的INT4模型轉換為更高質量的文本生成模型,致力於讓知識為每個人所用。
基於MLX庫實現的文本生成模型,支持多種量化方式推理,具備分佈式計算能力,可在蘋果硬件環境下高效運行。
mlx-community
Kimi-K2-Thinking 是由 mlx-community 從 moonshotai 原版模型轉換而來的 MLX 格式大語言模型,採用 mlx-lm 0.28.4 版本進行轉換,保留了原模型的思維鏈推理能力。
moonshotai
Kimi K2 Thinking 是月之暗面(Moonshot AI)開發的最新一代開源思維模型,具有強大的深度推理能力和工具調用功能。該模型採用混合專家架構,支持原生INT4量化,擁有256k上下文窗口,在多個基準測試中表現出色。
這是一個基於 Kimi-Linear-48B-A3B-Instruct 模型轉換的 6 位量化版本,專為 Apple MLX 框架優化。該模型保留了原模型強大的指令跟隨能力,同時通過量化技術顯著降低了存儲和計算需求,適合在 Apple 硬件上高效運行。
這是基於moonshotai/Kimi-Linear-48B-A3B-Instruct模型轉換的4位量化版本,專為Apple MLX框架優化,提供高效的文本生成能力
Kimi Linear是一種混合線性注意力架構,在各種場景下包括短、長上下文以及強化學習擴展機制中,均優於傳統的全注意力方法。它能有效解決傳統注意力機制在長上下文任務中效率低下的問題,為自然語言處理等領域帶來更高效的解決方案。
Kimi Linear是一種高效混合線性注意力架構,在短上下文、長上下文和強化學習場景中均優於傳統全注意力方法。它通過Kimi Delta Attention (KDA)機制優化注意力計算,顯著提升性能和硬件效率,特別擅長處理長達100萬令牌的長上下文任務。
richardyoung
這是一個高性能的4位量化版本的Kimi K2 Instruct模型,專為使用MLX框架在Apple Silicon(M1/M2/M3/M4)Mac上運行而優化。該模型擁有6710億參數,支持128K上下文窗口,在質量和效率之間實現了出色的平衡,是大多數實際部署的理想選擇。
cs2764
本模型是基於moonshotai的Kimi-K2-Instruct-0905模型使用mlx-lm 0.28.0版本轉換的MLX格式版本,採用3位量化技術,分組大小為32,平均每個權重僅佔用4.002位,優化了模型在蘋果設備上的運行效率。
anikifoss
這是對Moonshot AI的Kimi-K2-Instruct-0905模型的高質量量化版本,採用HQ4_K量化方法,專門優化了推理性能,支持75000上下文長度,適用於文本生成任務。
這是 moonshotai/Kimi-K2-Instruct-0905 模型的 MLX 格式轉換版本,採用創新的 DQ3_K_M 動態 3 位量化技術,專門為 Apple Silicon Mac 設備優化,在保持接近 4 位量化性能的同時顯著減少內存佔用。
這是 moonshotai/Kimi-K2-Instruct-0905 模型的量化版本,致力於讓知識為每個人所用。該項目提供了優化後的模型權重,便於在各種硬件上部署和使用。
基於moonshotai/Kimi-K2-Instruct-0905基礎模型,使用改進版MLX 0.26進行動態量化的大語言模型。通過創新的動態量化策略,在保持出色性能的同時顯著降低硬件需求,可在單臺M3 Ultra設備上高效運行。
ubergarm
這是moonshotai/Kimi-K2-Instruct-0905模型的GGUF格式量化版本,使用ik_llama.cpp分支進行最優量化。該模型採用混合專家架構,支持中文對話和文本生成任務,經過多種量化方案優化,在保持高質量的同時顯著減少內存佔用。
ssweens
Kimi-VL-A3B-Thinking-2506是月之暗面開發的多模態視覺語言模型,支持圖像和文本的聯合理解與推理,具備思維鏈推理能力,能夠處理複雜的視覺語言任務。
AI-MO
Kimina-Prover-Distill-0.6B是由Project Numina和Kimi團隊開發的定理證明模型,專注於Lean 4中的競賽風格問題解決能力。它是Kimina-Prover-72B模型的蒸餾版本,在MiniF2F-test上達到了68.85%的準確率。
Kimi-K2 Dynamic MLX是基於moonshotai/Kimi-K2-Instruct模型構建的文本生成項目,採用優化後的MLX庫實現高效量化性能。該模型在單臺M3 Ultra 512GB RAM機器上運行,支持多種量化方式,在測試中展現出優秀的困惑度指標。
Kimi - K2 - Instruct 是一個基於 moonshotai/Kimi - K2 - Instruct 模型的量化版本,旨在讓知識更廣泛地惠及大眾。