アリババ・テンスフォースが新規のテキストから画像生成モデルQwen-Imageをオープンソース化
テンスフォースシリーズ初のオープンソースモデルとして、20億パラメータを持つマルチモーダルディフュージョントランスフォーマー(MMDiT)ベース画像生成モデルであるQwen-Imageをリリースしました。この革新的な成果は、複雑なテキストレンダリングや正確な画像編集において画期的な進展を遂げ、複数の公開ベンチマークテストにおいて優れた性能を示し、画像生成と編集分野で注目を集めています。Qwen-Imageは強力なテキストレンダリング能力を備えており、複数行のレイアウト、段落レベルのテキスト生成、細かい細部の表現をサポートしています。英語だけでなく中国語においても対応可能です。