AI2、オープンソースのTülu3モデルを発表、GPT-4o miniと同等の性能
人工知能分野において、後訓練技術はモデル性能向上のための重要な手段になりつつあります。先日、アレン人工知能研究所(AI2)は、Tülu3シリーズモデルを発表しました。これは、GPT-4o-miniなどのクローズドソースモデルに匹敵する性能を持つ、完全にオープンソースの高度な言語モデルです。Tülu3には、モデルデータ、コード、トレーニングレシピに加え、評価フレームワークも含まれており、オープンソースモデルの後訓練技術の発展を促進することを目的としています。従来、事前学習のみのモデルは、実際的な用途のニーズを効果的に満たせないことが多く、問題となる可能性がありました。