月の暗面は2026年第1四半期に多モーダルモデルK2.1/K2.5をリリースする予定です。このモデルは、トレンドパラメータを持つオープンソースモデルKimi K2を基にしたアップグレード版で、多モーダル処理とエージェント機能の強化を目指しています。Kimi K2は2025年7月にリリースされてから、ミックス・オブ・エキスパートアーキテクチャによりコード生成などの分野で優れた性能を発揮しています。
月の暗面(Kimi)は5億ドルのCラウンド資金調達を完了し、IDGがリード投資を行い、アリババ、テンセントおよび既存の投資家が追加で出資しました。資金調達後の評価額は43億ドルに達し、約300億元相当です。この資金は技術開発に使われ、会社のさらなる発展が促進されます。
マイクロソフトは月の暗面と協力関係を深化させ、Kimiモデルの能力をオフィス製品に統合し、エージェント機能により事務自動化を実現しました。この取り組みは、外部のトップクラスのAIモデルを活用して競争力を高め、Agent365などのツールを通じてAIクラウドサービスを強化し、ローカルメーカーの挑戦に応えることを目的としています。
中国のオープンソースAI大規模モデルの実力が際立っており、DeepSeek、Qwen、Kimiが最新の評価で影響力が並んで第1位となった。ランキングはAI研究者によって発表され、35の機関をカバーしており、半数以上が中国のチームであり、中国のオープンソース分野の急速な発展を示し、米国の閉鎖型モードと対照をなしている。
強力なオープンソースのKimi K2チャットプラットフォームで、Kimi AIはプログラミングと数学のベンチマークテストでGPT-4を上回っています。エンタープライズレベルのKimi AIでコストを95%削減できます。
ソフトウェアエンジニアリングタスク専用のオープンソース コード LLM。
Kimi-Audioは、オーディオの理解と生成に長けたオープンソースのオーディオ基礎モデルです。
マルチモーダル推論機能を備えた、効率的なオープンソースの専門家混合型ビジョン言語モデルです。
Moonshot
$4
入力トークン/百万
$16
出力トークン/百万
256
コンテキスト長
Minimax
-
$2
$10
8
$5
$20
32
$30
131
$200
$1
262
$8
$32
inferencerlabs
Kimi - K2 - Thinking 3.825bit MLXは、テキスト生成に使用される量子化モデルで、異なる量子化方式を通じてテストで異なる困惑度の結果を得ています。そのうち、q3.825ビット量子化では1.256の困惑度を達成できます。
DevQuasar
このプロジェクトは moonshotai/Kimi-K2-Thinking ベースモデルに基づいて、カスタム逆量子化スクリプトを使用して元のINT4モデルをより高品質のテキスト生成モデルに変換し、知識をすべての人に利用可能にすることを目指しています。
MLXライブラリに基づいて実装されたテキスト生成モデルで、複数の量子化方式による推論をサポートし、分散計算能力を備え、Appleのハードウェア環境で効率的に動作します。
mlx-community
Kimi-K2-Thinkingは、mlx-communityによってmoonshotaiのオリジナルモデルからMLX形式に変換された大規模言語モデルです。mlx-lm 0.28.4バージョンを使用して変換され、元のモデルの思考過程推論能力が保持されています。
moonshotai
Kimi K2 Thinkingは月の暗面(Moonshot AI)が開発した最新世代のオープンソース思考モデルで、強力な深度推論能力とツール呼び出し機能を備えています。このモデルは混合専門家アーキテクチャを採用し、ネイティブINT4量子化をサポートし、256kのコンテキストウィンドウを持ち、複数のベンチマークテストで優れた性能を発揮します。
これはKimi-Linear-48B-A3B-Instructモデルを変換した6ビット量子化バージョンで、Apple MLXフレームワーク用に最適化されています。このモデルは元のモデルの強力な指令追従能力を保持しながら、量子化技術により格納と計算の要件を大幅に削減し、Appleハードウェアで効率的に動作するのに適しています。
これはmoonshotai/Kimi-Linear-48B-A3B-Instructモデルを変換した4ビット量子化バージョンで、Apple MLXフレームワーク用に最適化され、効率的なテキスト生成能力を提供します。
Kimi Linearは混合線形アテンションアーキテクチャで、短文脈、長文脈、および強化学習拡張メカニズムを含むさまざまなシナリオで、従来の全アテンション方法よりも優れています。従来のアテンションメカニズムが長文脈タスクで抱える効率低下の問題を効果的に解決し、自然言語処理などの分野により効率的な解決策をもたらします。
Kimi Linearは、短い文脈、長い文脈、強化学習のシナリオのすべてで、従来の全アテンション方式を上回る高効率な混合線形アテンションアーキテクチャです。Kimi Delta Attention (KDA)メカニズムによりアテンション計算を最適化し、性能とハードウェア効率を大幅に向上させ、特に100万トークンに達する長文脈タスクの処理に優れています。
richardyoung
これは高性能の4ビット量子化版のKimi K2 Instructモデルで、MLXフレームワークを使用してApple Silicon(M1/M2/M3/M4)Mac上で実行するように最適化されています。このモデルは6710億のパラメータを持ち、128Kのコンテキストウィンドウをサポートし、品質と効率の間で優れたバランスを実現しており、ほとんどの実際のデプロイに理想的な選択肢です。
cs2764
このモデルは、moonshotaiのKimi-K2-Instruct-0905モデルをmlx-lm 0.28.0バージョンで変換したMLX形式のバージョンです。3ビット量子化技術を採用し、グループサイズは32で、平均して各重みは4.002ビットしか占めず、Appleデバイスでのモデルの実行効率を最適化しています。
anikifoss
これはMoonshot AIのKimi-K2-Instruct-0905モデルの高品質量子化バージョンで、HQ4_K量子化方法を採用し、推論性能を特別に最適化し、75000のコンテキスト長をサポートし、テキスト生成タスクに適しています。
これはmoonshotai/Kimi-K2-Instruct-0905モデルのMLX形式変換バージョンで、革新的なDQ3_K_M動的3ビット量子化技術を採用し、Apple Silicon Macデバイス用に特別に最適化されており、4ビット量子化に近い性能を維持しながら、メモリ使用量を大幅に削減します。
これは moonshotai/Kimi-K2-Instruct-0905 モデルの量子化バージョンで、知識を誰もが利用できるようにすることを目指しています。このプロジェクトでは、最適化されたモデルの重みを提供し、さまざまなハードウェアでのデプロイと使用を容易にします。
moonshotai/Kimi-K2-Instruct-0905基礎モデルに基づき、改良版MLX 0.26を使用して動的量子化を行った大規模言語モデルです。革新的な動的量子化戦略により、優れた性能を維持しながらハードウェア要件を大幅に削減し、単一のM3 Ultraデバイスで効率的に実行できます。
ubergarm
これはmoonshotai/Kimi-K2-Instruct-0905モデルのGGUF形式の量子化バージョンで、ik_llama.cppブランチを使用して最適量子化を行っています。このモデルは混合エキスパートアーキテクチャを採用し、中国語対話とテキスト生成タスクをサポートし、さまざまな量子化方案で最適化されており、高品質を維持しながらメモリ使用量を大幅に削減しています。
ssweens
Kimi-VL-A3B-Thinking-2506は月の暗面が開発したマルチモーダル視覚言語モデルで、画像とテキストの統合的な理解と推論をサポートし、思考連鎖推論能力を備え、複雑な視覚言語タスクを処理できます。
AI-MO
Kimina-Prover-Distill-0.6Bは、Project NuminaとKimiチームによって開発された定理証明モデルで、Lean 4における競技スタイルの問題解決能力に特化しています。これはKimina-Prover-72Bモデルの蒸留バージョンで、MiniF2F-testで68.85%の正解率を達成しています。
Kimi-K2 Dynamic MLXはmoonshotai/Kimi-K2-Instructモデルに基づいて構築されたテキスト生成プロジェクトで、最適化されたMLXライブラリを用いて高効率な量子化性能を実現しています。このモデルは単一のM3 Ultra 512GB RAMマシン上で動作し、複数の量子化方式をサポートし、テストで優れた困惑度指標を示しまし。
Kimi - K2 - Instructは、moonshotai/Kimi - K2 - Instructモデルに基づく量子化バージョンであり、知識をより広く大衆に普及させることを目的としています。