最近、西湖大学は「DeepScientist」というAI科学者をリリースしました。このシステムはわずか2週間で人間の科学者が3年かけて達成した研究成果を完了させました。DeepScientistは5000を超える科学的アイデアを自主的に生成し、そのうち1100個を検証しました。さらに、3つの先端的なAIタスクにおいて、人間の最新記録を打ち破り、強力な研究能力を示しました。
AI研究の歴史において、多くのツールやシステムが登場していますが、それらは多くが補助的なツールであり、独立して研究を行うことはできません。初期のAIシステムであるPaperBenchやAgent Laboratoryは、科学者が論文を再現したり、特定の機械学習問題を解決するのを手伝うものでした。一方、AlphaTensorは大量の試行錯誤を通じてコードパフォーマンスを最適化しました。しかし、これらのツールはしばしば既存の研究モデルに疑問を投げかけることができませんでした。
技術の進歩に伴い、AI Scientistなどの完全自動のAI科学者システムが登場しました。これらはAIが一連の研究サイクルを遂行できることを証明し、新しい科学的成果を発見しましたが、明確な科学的目標や方向性を欠いていました。これに対して、DeepScientistは閉ループで反復するプロセスを通じて、目標意識と洞察力を示しています。このシステムはまず既存の研究方法を分析し、その欠点を特定します。その後、新しく且つ科学的に意味のあるアイデアを提示します。
DeepScientistの作業フローは3段階のループとして設計されています。最初は新しいアイデアを生成する段階で、この段階では膨大なメモリーコレクションから情報を抽出し、新しいアイデアにスコアを付与します。次に、「Upper Confidence Bound(UCB)」アルゴリズムを使用して、どのアイデアを検証するかを決定し、スコアの高いアイデアを実験します。最後に、成功した検証に基づいて詳細な研究報告書を作成し、閉ループを形成します。
具体的なタスクにおいて、DeepScientistは代理失敗原因分析、LLM推論加速、AIテキスト検出という3つの先端的なAI研究分野を選択しました。これらのタスクにおいて、DeepScientistはA2P、ACRA、PA-Detectなどの新しい方法を提案し、既存のSOTA(State Of The Art)記録を上回りました。また、優れた自律的な学習能力和創造性を示しました。
この画期的な研究成果は、AI科学者が研究分野における潜在能力をさらに検証することを示しており、今後はより広範囲な科学探索で重要な役割を果たす可能性があります。
プロジェクト: https://github.com/ResearAI/DeepScientist
ポイント:
- 🚀 DeepScientistは2週間で人間の科学者が3年間行った研究を完了し、強力な研究能力を示しました。
- 💡 このシステムは閉ループで反復するプロセスにより、独自の科学的アイデアを生成・検証し、完結した研究サイクルを形成できます。
- 🧠 DeepScientistは複数の先端的なタスクにおいて、人間の最新の研究記録を打ち破り、研究分野におけるAIの大きな潜在能力を示しました。