バイトダンス傘下の豆包(Doubao)大規模言語モデルが本日、2024年度技術進捗報告を発表し、最新バージョンDoubao-pro-1215が総合性能においてGPT-4に完全に匹敵し、一部の専門分野ではさらに優れた能力を示していることを明らかにしました。この進歩は、中国の大規模言語モデル技術が正式に世界トップレベルに仲間入りしたことを意味します。
今年5月の初公開以来、豆包大規模言語モデルはわずか7ヶ月で32%の能力向上を実現しました。公式の説明によると、大量データ処理の最適化と革新的なモデルアーキテクチャ(モデルのスパース性の向上や強化学習の導入など)により、理解精度と生成品質の両面で著しい進歩を遂げました。特に数学や専門知識など複雑な場面では、GPT-4を上回る性能を示し、価格はGPT-4の8分の1です。
注目すべきは、豆包が初めて300万文字の超長文処理能力を公開したことでしょう。これは、「数百編」の学術論文に相当する内容量を同時に処理できることを意味します。STRINGなどのコンテキスト関連データアルゴリズムと最適化されたスパース化および分散化ソリューションを採用することで、豆包は100万トークンの処理遅延を15秒以内に抑え、大量の外部知識処理効率を大幅に向上させました。
この技術的ブレークスルーは、中国のAI技術の急速な発展を示すだけでなく、より優れたコストパフォーマンスによって大規模言語モデルの普及が加速する可能性を示唆しています。