象を転ばす！Googleの革新的技術ReCapture：ワンクリックでマルチアングルビデオが作成可能

AIbase基地

公開日AIニュース · 1 分で読めます · Nov 8, 2024

393

Google Researchは最近、ReCaptureという新しい技術を発表しました。この技術を使えば、自分の動画を全く新しい視点から体験することができます。ReCaptureは、ユーザーが提供した動画から、独自のカメラ軌跡を持つ新しいバージョンの動画を生成します。つまり、元の動画にはなかった視点から動画を見ることができ、人物や背景の動きはそのまま維持されます。

ReCaptureはまるで魔法の編集者のようなもので、提供された動画から全く新しい視点の動画を生成します。例えば、犬が遊んでいる動画をスマホで撮影した場合、ReCaptureは犬の視点から撮影した動画を生成することができます。驚くべきではありませんか？

では、ReCaptureはどのようにこの「魔法」を実現しているのでしょうか？実は、その原理は複雑ではありません。まず、多視点拡散モデルまたは点群レンダリング技術を利用して、ユーザーが希望する新しい視点に基づいて、動画の粗稿を生成します。この粗稿は、未研磨の原石のようなもので、映像が不完全で、時間が不連続で、酔っ払っているかのように揺れ動くかもしれません。

次に、ReCaptureは秘密兵器である「マスクビデオ微調整」技術を使って、この粗稿を「精密に加工」します。この技術は、熟練の職人のようなもので、空間LoRAと時間LoRAという2つの特別なツールを使って、動画を修復し最適化します。空間LoRAは「美容師」のようなもので、元の動画の人物や背景情報を学習し、映像をより鮮明で美しくします。一方、時間LoRAは「リズムマスター」のようなもので、新しい視点でのシーンの動きを学習し、動画の再生をよりスムーズで自然なものにします。

この2人の「マスター」によって作り上げられた粗稿は、鮮明で、連続性があり、ダイナミックな新しい動画へと変身します。さらに、動画の効果をより完璧にするために、ReCaptureはSDEdit技術を使って最終的な調整を行い、まるでメイクアップのように、動画をより繊細で美しく仕上げます。

Googleの研究者によると、ReCaptureは大量のトレーニングデータがなくても、様々なタイプの動画や視点変換に対応できるということです。つまり、普通の動画愛好家でも、ReCaptureを使って簡単にプロレベルの「マルチカメラ」動画を作成することができます。

プロジェクトアドレス：https://generative-video-camera-controls.github.io/

ReCapture ビデオ編集 Google Research

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

アリババグループがdInferを発表：拡散言語モデルの推論速度を10倍高速化！

アリババグループは業界初の高性能な拡散言語モデル推論フレームワークであるdInferをオープンソースで公開し、推論速度を著しく向上させました。ベンチマーキングテストによると、これはNVIDIAのFast-dLLMよりも10.7倍高速で、HumanEvalコード生成タスクにおいて単一の推論で1秒間に1011トークンを処理でき、技術の実用化を前進させています。

Oct 13, 2025

シリコンベースのフローアクセスプラットフォームにアリババのQwen3-VLモデルが正式リリースされ、視覚認識能力が大幅に向上

シリコンベースのフローアクセスプラットフォームにアリババのQwen3-VLオープンソースモデルがリリースされました。このモデルは視覚的理解、時系列分析、マルチモーダル推論において顕著な進歩を遂げています。画像のぼけや動画の複雑さなどの課題に対処することができ、視覚認識能力を向上させ、32言語のOCR機能をサポートし、弱い視覚情報の正確な処理が可能となり、ユーザーが複雑な視覚タスクを簡単に処理できるようにします。

Oct 13, 2025

拡散モデルの新進展：Radical Numericsが30BパラメータのRND1 AIをオープンソース化、自己進化への重要な一歩を遂げる

Radical Numericsは30Bパラメータのオープンソース拡散言語モデルRND1-Baseをリリースし、スパースエキスパート混合アーキテクチャを採用しており、3Bパラメータのみがアクティブ化されている。このモデルは並列生成の利点を持ち、ベンチマークテストでのパフォーマンスが優れている。また、完全な重みとトレーニングプロセスを公開し、拡散モデル技術の発展を推進している。

Oct 13, 2025

マレーシアにAIの新時代が到来、ChatGPT Goがデジタルトランスフォーメーションを支援

OpenAIはマレーシアでChatGPT Goのサブスクリプションサービスを提供し、月額は約9.25ドルであり、AIの利用ハードルを大幅に低下させます。このサービスにはGPT-5モデルや画像生成、ファイルアップロード、記憶機能などの豊富な機能が含まれており、ユーザー体験を向上させます。この取り組みは、當地で急速に増加する中堅層ユーザーおよび学生層を引きつけることを目的としています。

Oct 13, 2025

最初の自己回帰モデルを上回る！アリババグループが業界初の高性能拡散言語モデル推論フレームワークdInferをオープンソース化

10月13日、アリグループが高性能拡散言語モデル推論フレームワークdInferをオープンソース化。NVIDIA Fast-dLLMより10.7倍高速で、HumanEvalタスクでは1011Tokens/秒を達成。拡散モデルが自己回帰モデルを初めて上回った。....

Oct 13, 2025

オープンAIとマイクロソフトが重要な取引を発表：株式構造が再変化し、投資家は希薄化リスクに直面

オープンAIの最近の取引により株式構造が複雑化し、投資家はリターンへの懸念を抱えています。企業の評価額は5000億ドルに達し、世界で最も価値のある非上場企業となっています。主な要因はNVIDIAやAMDとの数十億ドル規模のチップ契約であり、資金は1京ドル規模の計算力展開目標に向けて使用される予定です。

Oct 13, 2025

マッシュルカーリンクがAIの商業化を加速し、元ディップ上級副社長のフー・キアンがCEOに就任

マッシュルカーリンクは、元ディップの上級副社長であるフー・キアンを新たにCEOに任命し、AIビジネス戦略の実施と商業化を全面的に担当する。フー・キアンは10年以上のスマートモビリティ経験を持ち、ディップで複数の重要な役職を務め、満邦グループのChief Operating Officerを務めた経験がある。

Oct 13, 2025

AIデイリーニュース：LiblibAI 2.0が正式リリース；通義千問、豆包で記憶機能が開始；SoraがGoogle Playに登場

LiblibAI 2.0が正式リリース。複数のトップモデルを内蔵し、期間限定で無料計算リソースを提供。単一ツールから創作エコシステムへ進化し、開発者向けに専門的なAI創作体験を提供。....

Oct 13, 2025

マスカーがNVIDIAのコアチームを引き抜き、xAIが世界モデルの開発を加速

マスク氏のxAI社はAGI開発のため「世界モデル」を加速中。NVIDIAからOmniverse開発の核心研究者2名を引き抜き、技術力を強化。....

Oct 13, 2025

2025年グローバルで注目される10の大技術成就が発表：DeepSeekが選出

2025年世界十大工学成果が発表され、中国工程院の「Engineering」が主催。過去5年間の世界的な影響力を持つ革新的な工学プロジェクトを表彰。選考は国際的なノミネート、専門家推薦、一般アンケート、委員会審議を経て決定。....

Oct 13, 2025

AIニュース

AIニュース日報

AIツールを探す

AI製品ランキング

AIプロダクト登録

AIツールディレクトリ

AIモデルファインダー

LLMランキング

LLMプロバイダー

AIモデル登録

LLM比較選定

LLMコスト計算機

LLMアリーナ

MCPサーバー

MCPクライアント

MCPケースチュートリアル

MCPランキング

MCPサービス提出

MCP実験場

MCPインスペクター

GEO順位最適化サービス

GEOランキング照会ツール

AIモデル互換性チェッカー

AIデータセット

インテリジェント文書認識

象を転ばす！Googleの革新的技術ReCapture：ワンクリックでマルチアングルビデオが作成可能

AIbase基地

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

アリババグループがdInferを発表：拡散言語モデルの推論速度を10倍高速化！

シリコンベースのフローアクセスプラットフォームにアリババのQwen3-VLモデルが正式リリースされ、視覚認識能力が大幅に向上

拡散モデルの新進展：Radical Numericsが30BパラメータのRND1 AIをオープンソース化、自己進化への重要な一歩を遂げる

マレーシアにAIの新時代が到来、ChatGPT Goがデジタルトランスフォーメーションを支援

最初の自己回帰モデルを上回る！アリババグループが業界初の高性能拡散言語モデル推論フレームワークdInferをオープンソース化

オープンAIとマイクロソフトが重要な取引を発表：株式構造が再変化し、投資家は希薄化リスクに直面

マッシュルカーリンクがAIの商業化を加速し、元ディップ上級副社長のフー・キアンがCEOに就任

AIデイリーニュース：LiblibAI 2.0が正式リリース；通義千問、豆包で記憶機能が開始；SoraがGoogle Playに登場

マスカーがNVIDIAのコアチームを引き抜き、xAIが世界モデルの開発を加速

2025年グローバルで注目される10の大技術成就が発表：DeepSeekが選出