大規模言語モデルYi-34Bをめぐる論争
大規模言語モデルYi-34BはLLaMAアーキテクチャを使用しているものの、テンソル名の変更が論争を呼んでいます。モデルの性能には、20万トークンを超えるコンテキストウィンドウサイズ、一度に40万文字を処理できる能力、Hugging Faceのグローバルオープンソースモデルランキングでの実績などが含まれます。しかし、Yi-34Bはコードの本質的な変更と虚偽広告、ライセンス違反を指摘する声があり、コミュニティから疑問が呈されています。零一万物社は、GPT構造に基づいており、トレーニングの必要性からコードの名称変更が行われたと回答しています。論争の中心は、モデルがオープンソースライセンスに違反しているか、および性能パラメータとコード変更の透明性にあります。