中国電信がオープンソースで国内の1兆パラメータのMoE大規模モデルTeleChat3を公開!全スタック自社開発 15T tokensの訓練 支援思考モードで国際的トップレベルと対等
中国電信人工知能研究院が星の言語大規模モデルTeleChat3シリーズをオープンソースとして公開しました。このシリーズには1兆パラメータのMoEモデルと密な構造モデルが含まれています。このシリーズは完全に国内の万カード計算力プールに基づいてトレーニングされ、データ規模は1.5兆トークンに達し、全スタックの国内製品化を実現しました。これは、中国が超大規模AIモデルの自主制御において重要な突破を遂げたことを示しています。