最近、月の裏側が提供するKimiスマートアシスタントは、最初のエージェント製品である「Kimi-Researcher(深層研究)」を正式に小規模なグレイステスト(限定公開テスト)を開始しました。このエンドツーエンドの自己強化学習(end-to-end agentic RL)技術に基づいて訓練された次世代エージェントモデルは、ユーザーに効率的で深い深層研究サービスを提供することを目指しています。
Kimi-Researcherは問題に直面した際、強力な自己計画と実行能力を発揮します。単に質問を明確にするだけでなく、深く考え、検索キーワードを自動的に計画し、高品質な情報を選別することができます。タスク処理時には、平均して23ステップの推論を行い、74個のキーワードを計画し、206個のURLを見つけ、最終的に情報の質が高い上位3.2%の内容のみを残します。このプロセスにより、研究成果の詳細さと追跡可能性が保証されます。
情報検索や選別能力に加え、Kimi-Researcherはブラウザやコードなどのツールを自動的に呼び出して原始データを処理し、自動的に分析結果を生成することができます。その提供する成果物には、情報が詳しく、追跡可能な深層研究レポートと、インタラクティブで共有可能な動的な視覚化レポートが含まれます。これらのレポートは通常万字以上に達し、平均して26個の高品質な信頼できる出典を引用しており、オンラインでリンクを作成して共有することが可能です。これにより、ユーザーのプレゼンテーションや共同作業のニーズが大幅に満たされます。
さらに、Kimi-Researcherの実力を確認するために、月の裏側は難易度の高い「Humanity’s Last Exam(HLE)」という「試験」を用意しました。この専門AI向けの高難易度ベンチマークは、数学、物理学、医学から政治、歴史まで百以上の専門分野をカバーし、複雑な知識タスクでの解決能力を総合的に評価します。Kimi-Researcherは複雑な構造や事前設定のない状況下で、Pass@1正確率26.9%、Pass@4正確率40.17%という優れた成績を収め、多くの有名なAIモデルを上回り、既知の最高水準の一つに達しました。
現実のシーンでも、Kimi-Researcherは素晴らしいパフォーマンスを示しました。アルゴリズム担当者が高価値のベンチマークを探したり、運営担当者が業界内の企業の発展を研究したり、法務担当者が各国のデータプライバシー規制を迅速に理解したりする場合、Kimi-Researcherは短時間で構造が整い、情報が充実したレポートを生成し、ユーザーに強力なサポートを提供できます。
月の裏側は、Kimi-Researcherがエンドツーエンドの強化学習を通じて訓練されたエージェントモデルであり、ゼロ構造、自己適応の特徴を持っていると述べました。複雑なプロンプトや事前のプロセス設計はなく、モデル自身の試行錯誤と学習により複雑なタスクに対応します。この設計により、Kimi-Researcherは情報の矛盾、ツールの切り替え、環境変化に対して強い適応力と汎化能力を発揮します。
現在、Kimi-Researcherは小規模なグレイステスト段階にあります。ユーザーはkimi.comにアクセスして内測資格を申請でき、権限を得た後、「深層研究」ボタンをKimiダイアログの下部でクリックすることで利用を開始できます。