AI日報：国家广播电视总局、AI「魔改」動画の乱象を是正；Hailuo AIがAI音声クローン機能をリリース；OpenAIが新たなSoraを発表

【AI日報】へようこそ！ここは、人工知能の世界を探求するあなたのための毎日ガイドです。毎日、AI分野のホットな話題をお届けし、開発者を重視し、技術トレンドの洞察と革新的なAI製品の応用に関する情報を提供します。

最新のAI製品詳細はこちら:https://top.aibase.com/

1、国家広播電影電視総局、「AI魔改」現象の取り締まりに関する管理指示を発表、名作映画が改変される

国家広播電影電視総局は、AIによる動画の「魔改」（不正な改変）現象に対処するため、管理指示を発表し、古典文化の保護を強調しました。最近、多くの名作映画やドラマが改変され、大衆の伝統文化への関心が再燃しています。指示では、各省局に対し、短編動画プラットフォームで関連コンテンツを削除し、生成AIコンテンツの審査を徹底し、誤解や著作権侵害を防ぐよう求めています。

【AiBase要約:】
🚫 国家広播電影電視総局が指示を発表し、AIによる動画の「魔改」現象の取り締まり、古典文化の保護を求めています。
🎥 多くの名作映画やドラマが改変され、大衆の伝統文化への認識と価値観に影響を与えています。
🔍 プラットフォームは生成AIコンテンツを厳格に審査し、誤解や著作権侵害を避ける必要があります。

2、海螺AI海外版、超強力AI音声クローン機能をリリース

海螺AIは最近、海外版の音声クローンモジュールをリリースしました。ユーザーは10～60秒の音声サンプルだけで、自分の声を完璧に複製できます。この技術的ブレークスルーは、中国語の音声クローン分野で大きな注目を集め、多くのユーザーがその優れた音声クローン効果に驚いています。このシステムは操作が簡単で、複数の言語と感情を選択できるため、ユーザーのニーズを十分に満たしています。

【AiBase要約:】
🌟 わずか10～60秒の音声で、海螺AIはユーザーの声を完璧に複製し、中国語の音声クローンにおけるボトルネックを突破しました。
🎤 システムは12種類の言語に対応し、ユーザーは様々な感情を選択して、音声表現を豊かにすることができます。
💻 現在、海螺AIの音声機能は無料で利用でき、ユーザーは簡単に複数の音声モデルを作成できます。
詳細リンク:https://www.hailuo.ai/audio

3、Runway Act Oneアップデート：あなたの演技と声をシームレスに動画キャラクターに融合

Runway Act Oneの最新アップデートは、動画制作に革命的な変化をもたらし、ユーザーは自分の演技と声を他の動画キャラクターに直接適用し、完璧な同期を実現できます。この技術的ブレークスルーは、創作のハードルを下げるだけでなく、映画制作に前例のない柔軟性をもたらし、クリエイターはいつでもどこでもオーディションや演技の転換を行うことができます。

【AiBase要約:】
🎭 多次元演技転換：動作、音声、表情をあらゆるキャラクターにシームレスに移植できます。
📱 簡単オーディション：俳優はいつでもスマートフォンで撮影し、演技を簡単にターゲットキャラクターに移植できます。
🖥️ AIとの連携：Midjourneyなどのツールを使用することで、クリエイターは短編動画を完全な演技に拡張できます。
詳細リンク:https://top.aibase.com/tool/runway

4、OpenAI、新たなSora動画ジェネレーターを間もなくリリース、様々な生成方法に対応

OpenAIは最近、ロンドンで開催されたC21Mediaカンファレンスで、更新版のSora動画ジェネレーターを間もなくリリースすると発表しました。このバージョンは、テキスト、画像、動画など、様々な生成方法に対応し、ユーザーの動画制作体験を大幅に向上させます。新バージョンは効率と速度が大幅に向上しており、12月の冬季プロモーションイベントで正式にリリースされる予定です。同時に、GPT-4.5などの新機能もリリースされる可能性があります。

【AiBase要約:】
🌟 更新版Sora動画ジェネレーターは、テキスト、画像、動画からの動画生成に対応し、創作の柔軟性を高めます。
🚀 新バージョンは速度と効率が大幅に向上し、ユーザーエクスペリエンスが向上します。
📅 12月の冬季プロモーションイベントでリリースされる予定で、GPT-4.5などの新機能も同時にリリースされる可能性があります。

5、超高画質動画修復ツールVISION XL、ぼやけた動画をワンクリックで鮮明に

技術の進歩に伴い、VISION XLは動画修復と超解像度ツールとして、その卓越した性能と使いやすさで注目を集めています。動画の欠損部分の修復やぼやけの除去だけでなく、動画の鮮明さを大幅に向上させ、最大4倍の超解像度を実現できます。潜在的拡散モデルに基づいた処理フレームワークを採用することで、追加の事前トレーニングモジュールの依存性を減らし、高解像度動画の処理効率を大幅に向上させています。

【AiBase要約:】
✨ VISION XLは、動画の欠損部分の修復、ぼやけの除去、鮮明度の向上を実現し、最大4倍の超解像度を実現します。
⚙️ 潜在的拡散モデルに基づいた処理フレームワークを採用し、追加の事前トレーニングモジュールの依存性を減らし、処理効率を向上させています。
🚀 わずか13GBのVRAMで25フレームの動画を処理でき、処理時間は2.5分以内と、迅速なアプリケーションに適しています。
詳細リンク:https://vision-xl.github.io/

6、マスク氏率いるソーシャルネットワークプラットフォームX、画像ジェネレーターAuroraをリリース

イーロン・マスク氏のソーシャルネットワークXは最近、写真のようなリアルな画像を作成することを目的とした新しい画像ジェネレーターAuroraをリリースしました。リリース後すぐに一部のユーザーが機能にアクセスできなくなりましたが、Auroraは依然としてミッキーマウスを含む公共および著作権のある人物の画像を制限なく生成できます。静物や風景画像の生成には優れていますが、物体の融合が不自然であったり、人物画像で指が欠けていたりするなど、いくつかの欠点もあります。

【AiBase要約:】
🌟 新しい画像ジェネレーターAuroraがリリースされ、ユーザーは様々な画像を生成できます。
🚫 リリース後数時間以内に、一部のユーザーが機能にアクセスできなくなりました。
💰 Xソーシャルプラットフォームは、Grok機能を全ユーザーに開放します。

7、Googleが新たに発表したGemini-Exp-1206モデルがライバルを圧倒、ChatGPTを凌駕してAIの新王者に

Googleが最近発表したGemini-Exp-1206モデルは、生成AI分野で大きな注目を集めており、LMArenaランキングで1379点の高得点を獲得し、ChatGPT-4.0の1366点を上回り、その卓越した総合能力を示しました。Gemini-Exp-1206は多くの評価項目で優れた成績を収めていますが、投票数ではChatGPT-4.0を下回っており、後者の信頼性の高さを示しています。

【AiBase要約:】
🌟 Gemini-Exp-1206はLMArenaランキングで1379点を獲得し、ChatGPT-4.0の1366点を上回りました。
🗳️ ChatGPT-4.0は21,929票を獲得し、Gemini-Exp-1206の5052票を大きく上回り、その信頼性を示しています。
🔍 Gemini実験モデルは開発者に前例のないAI体験の機会を提供しますが、まだテスト段階であり、本番環境での使用には適していません。
詳細リンク:https://ai.google.dev/gemini-api/docs/models/experimental-models?hl=zh-cn

8、NegToMeが画像生成を再定義：著作権リスクの軽減、多様性の向上、視覚効果の改善

NegToMeは画期的な画像生成技術であり、画像駆動型敵対的指導法を利用して従来のネガティブプロンプトの限界を突破し、生成画像の多様性と品質を大幅に向上させます。生成コンテンツと著作権のある作品との類似性を低減することで、著作権保護の問題を解決し、クロスドメインアプリケーションでも優れた性能を発揮し、クリエイターにより大きな創造の自由を提供します。

【AiBase要約:】
🎨 NegToMeは画像駆動型敵対的指導法により、生成画像の多様性を大幅に向上させ、特に人種と性別の処理において顕著な成果を上げています。
🔒 この技術は生成コンテンツと著作権のある作品との類似性を低減し、テストでは類似性が34.57％低下し、著作権保護の問題を効果的に解決しています。
⚙️ NegToMeは統合が容易で、開発者は少量のコードで適用でき、推論時間はほとんど影響を受けず、様々な拡散モデルと互換性があります。
詳細リンク:https://github.com/1jsingh/negtome

9、Xが全ユーザーにGrok AIを開放、一般ユーザーも画像生成を無料で利用可能に

xAIは最近、チャットボットGrokを世界中のユーザーに開放し、低コストでAI体験できる機会を提供すると発表しました。無料版では、毎日の画像作成数や情報送信数などに制限があります。この取り組みは、より多くのユーザーにAI技術を知ってもらうだけでなく、xAIのプロモーション戦略も反映しています。

【AiBase要約:】
🖼️ Grokでは、ユーザーは1日に最大3枚の画像を作成または分析できます。
💬 ユーザーは2時間以内に10件の情報しか送信できず、使用頻度を制御します。
📈 xAIはGrokを無料で開放することでユーザーを獲得し、将来的には有料機能を導入する可能性があります。

10、Googleフォト、2024年度写真レビュー機能をリリース：AIによるスマート生成、あなたの素晴らしい瞬間を記録

デジタル技術の発展に伴い、Googleフォトは2024年度写真レビュー機能をリリースし、AI技術を活用してユーザーにパーソナライズされた体験を提供します。Gemini AIにより、ユーザーはスマートに生成された写真の注釈を取得し、重要な瞬間や撮影データを振り返ることができます。この機能はユーザーに素晴らしい思い出を共有する機会を提供しますが、不快な思い出を呼び覚ます可能性もあります。

【AiBase要約:】
🤖 AI技術によりパーソナライズされた写真の注釈を生成し、年間の重要な瞬間を強調表示します。
📊 詳細な撮影データ統計を提供し、ユーザーが個人指標を共有しやすくなります。
😢 不快な思い出を呼び覚ます可能性があり、AIはまだユーザーの感情ニーズを完全に理解していません。

11、OpenAI、軍事請負業者との提携を決定、内部従業員が反対の声を上げる！

OpenAIとアンドゥリル社の提携は、従業員から強い反発を招き、多くの人が軍事技術への応用に懸念を示し、より高い透明性を求めています。経営陣は提携が防衛システムのみに限定されると強調していますが、従業員はこうした制限に疑問を呈しています。

【AiBase要約:】
🌐 OpenAIとアンドゥリル社の提携は、従業員からAIの軍事利用への懸念を招いています。
🛡️ 経営陣は提携が防衛システムのみに限定されると強調していますが、従業員は技術利用の制限に疑問を呈しています。
📉 方針転換は、OpenAIが軍事分野における技術の利用を受け入れ始めたことを示しています。

12、AI専門家：ChatGPTの1回のクエリで、0.5リットルの水の無駄遣いに相当

生成AIの急速な発展は、特にエネルギーと水資源の消費という環境問題を引き起こしています。ケイト・クロフォード教授は講演で、持続可能な対策を取らない場合、生成AIのエネルギー消費量は1年以内に日本のレベルに達する可能性があると指摘しました。

【AiBase要約:】
🌍 ChatGPTの1回のクエリで0.5リットルの水が無駄になることから、人工知能の水資源への影響に注目するよう促しています。
⚡ 生成AIのエネルギー消費量は1年以内に日本のレベルに達する可能性があり、持続可能な開発計画を策定する必要があります。
🤝 持続可能性は、競争順位ではなく、人工知能業界の最優先事項となるべきです。