高校生が『マインクラフト』でAIモデル評価サイトを構築 全民参加でモデルの優劣を判定
人工知能技術の急速な発展に伴い、様々な生成系AIモデルの実力を効果的に評価・比較する方法が重要な課題となっています。従来のAIベンチマークテスト手法は限界を露呈しつつあり、より革新的な評価方法を模索する動きが活発化しています。この度、Minecraft Benchmark(略称:MC-Bench)というウェブサイトが登場しました。その最大の特徴は、マイクロソフト製のサンドボックス型建築ゲーム『マインクラフト』(Minecraft)を利用している点です。