ディズニーの研究部門は最近、データ転送レートを低く保ちながら、よりリアルな画像効果を生み出す革新的な画像圧縮技術を発表しました。
この新しいコーデック技術は、従来のJPEGやAV1などのコーデックよりも複雑性が高いものの、画質と処理効率において顕著な優位性を示しています。研究チームは、量子化誤差と画像処理におけるノイズ処理を組み合わせることで、目標ビットレートで画像の詳細をより適切に復元できることを発見しました。
ディズニーの圧縮方法と従来の方法の比較。詳細の復元効果が向上し、数十万ドルのトレーニングを必要としないモデルを提供し、最も近い同等の競合方法よりも高速に動作すると主張しています。
研究者によると、新技術は処理プロセスの10%未満しか実行する必要がなく、システムアーキテクチャの大幅な変更も必要ありません。実際のテストでは、他の圧縮方法が2倍のビットレートを使用している場合でも、この技術で復元された画像の質は最終ユーザーにより高く評価されました。
しかし、この技術にはいくつかの限界もあります。特定の状況では、復元された画像にわずかな不正確さ、例えば直線がわずかに曲がったり、小さな物体の境界がわずかに歪んだりすることがあります。これらの問題は主に、システム特性次元の制限に起因しています。
実際の応用テストでは、研究チームはKodak、CLIC2022、COCO30kなど複数のデータセットを使用して評価を行いました。評価指標には、ピーク信号対雑音比(PSNR)、知覚学習類似性指標(LPIPS)、多尺度構造類似性指数(MS-SSIM)、フレシェ距離(FID)など、複数の次元が含まれています。
ディズニーの新手法(緑で強調表示)と他の手法の更なる比較。
ユーザー調査では、チェス選手権のようなEloレーティングシステムを使用して評価する強制選択方法を採用しました。その結果、競合他社が2倍のデータ量を使用した場合でも、ディズニーの新技術は明らかに高いユーザー評価を得ました。
処理速度に関しては、新技術は主要な競合他社と比べて大幅に改善され、処理時間は6.87秒から3.49秒に短縮されました。この効率の向上と優れた圧縮効果により、この技術は画像の保存と転送分野で重要な応用価値を持ちます。
注目すべきは、画像圧縮技術の発展は、世界的なデータ保存、ストリーミング転送、エネルギー消費などの問題解決に重要な意味を持つということです。最適な技術ソリューションが常に最も広く市場で認められるとは限りませんが、ディズニーのこの革新は、効率と性能のバランスをうまく取れたソリューションを業界に提供しています。