大切なビデオの顔がぼやけて悩んでいませんか?心配しないでください!テクノロジー界の寵児、KEEP技術が登場です!この魔法の「美顔師」は、ビデオの人間の顔の鮮明さを劇的に向上させるだけでなく、あらゆる表情を生き生きと再現します。

例えば、何年も前に撮影した家族ビデオを見返したら、画面がぼやけてピクセルしか見えない状態だったとします。今なら、KEEP技術を使えば、これらの貴重な思い出が瞬時に鮮明になります。まるでビデオにスーパー眼鏡をかけたように、細部までくっきりと見えます。

1.png

KEEP技術の中核は、革新的な「カルマンフィルタに基づく特徴伝播」フレームワークにあります。KEEP技術は時間的に安定した顔の事前情報を維持し、カルマンフィルタの原理を利用することで、以前復元されたフレームの情報が現在のフレームの復元プロセスを導き、ビデオフレーム間の顔の細部の整合性を捉える点で優れた性能を発揮します。

この高度な名前で驚かないでください。簡単に言うと、これは非常に賢い探偵のようなもので、以前のビデオフレームから手がかりを集め、それらの手がかりを使って現在のフレームがどのように見えるべきかを推論します。

この技術は、ビデオの鮮明さを大幅に向上させるだけでなく、特に目、鼻、口などの顔の細部の復元において、自然で鮮明な効果を発揮します。

実験結果によると、ビデオの品質が著しく低下した場合でも、KEEP方法は顔の細部を効果的に復元し、他の方法でよくあるぼやけや歪みの問題を回避します。

KEEPフレームワークは、エンコーダー、デコーダー、カルマンフィルタネットワーク、フレーム間アテンション(CFA)メカニズムの4つのモジュールで構成されています。エンコーダーとデコーダーは、効率的なVQGAN生成モデルを構築し、カルマンフィルタネットワークは時間情報の伝播を促進し、安定した潜在コード事前情報を維持します。これら4つの部分は、まるで息の合ったチームのように、ビデオの画質をかつてない高さに引き上げます。

フレーム間アテンション層は、局所的な時間的一貫性をさらに促進し、情報の伝播を正規化します。これらの設計の組み合わせにより、KEEP技術は証拠の蓄積とビデオの顔の超解像度における時間的一貫性の強化において顕著な利点を持っています。

プロジェクトアドレス:https://top.aibase.com/tool/keep

論文アドレス:https://arxiv.org/pdf/2408.05205