中国研究チーム、VideoChat-Flashを発表 長尺動画処理速度を100倍向上
従来の動画理解モデルは、長尺動画の処理において、複雑なコンテキスト理解など多くの課題に直面していました。動画理解能力の向上を目指した研究は数多くありますが、訓練と推論の効率の低さを効果的に克服することは困難でした。本研究チームはこれらの問題に対し、HiCo技術を用いて動画情報の冗長部分を圧縮することで、計算需要を大幅に削減しつつ、重要な情報を保持することに成功しました。具体的には、HiCoは動画を階層的に圧縮し、長尺動画を短いセグメントに分割することで、処理を削減します