Metaの最新モデルFairyが動画合成分野でブレークスルーを達成しました。毎秒14秒で120フレームの高解像度動画を生成し、特撮業界に革命を起こす可能性があります。コスト削減、期間短縮を実現し、ハリウッドなどの業界にも影響を与えるでしょう。Fairyの「アンカーポイント式クロスフレームアテンション」技術は、従来モデルのメモリと速度の制限を解決し、時間的一貫性を改善することで、動画合成に新たな可能性をもたらしました。
関連AIニュースの推奨

ChatGPTの音声モードがリリース!ワンタップで会議を転記し、計画を生成。AIが効率を飛躍的に向上させます!
OpenAIがChatGPT Plusユーザー向けにmacOSデスクトップアプリの録音機能を全面開放。120分間のリアルタイム録音が可能で、構造化メモやタスク、コード枠を自動生成。プライバシー保護を重視し、処理後はオリジナル音声を削除。現在はmacOS限定だが、他プラットフォームにも拡張予定。会議やブレインストーミングの効率化に貢献するAI生産性ツールの画期的な進化。....

Aニュース:KimiオープンプラットフォームにKimi Playgroundが登場;OpenAIがChatGPT Agentを発表;Sunoがボーカル置換機能をリリース
【AIニュース速報】本日のAI分野では複数の進展がありました。1) 月の暗面がKimiオープンプラットフォームにPlaygroundをリリースし、AIを対話アシスタントからスマートアシスタントへとアップグレードしました。2) OpenAIがタスクを自動的に実行できるChatGPT Agentを発表しました。3) Suno v4.5+がボーカル置換などの革新的な音楽機能を導入しました。4) グーグルがVeo3動画生成モデルのAPIを公開しましたが、コストは高めです。5) 最初のリアルタイムビデオ変換AIモデルMirageLSDが登場しました。6) VSC

LTX-Video 13Bがリリース!30倍速で高精細動画を生成 オープンソースAIで創作に境界なし!
Lightricksがオープンソースのビデオ生成モデルLTX-Video13Bを発表。130億パラメータとマルチスケールレンダリング技術により、同類モデル比30倍の生成速度を実現。消費級GPUで1216×704解像度のリアルタイム生成が可能で、テキスト/画像/動画から動画への多様な創作モードを提供。....

テンセントヤオヨンがQQミュージックに統合:曖昧検索、シーン別BGM、スライド再生をサポート
QQ音楽と連携したTencent元宝アプリがバージョン2.30でリリース。AIを使った曖昧検索や類似曲推薦が可能に。歌詞認識で自動再生する新機能も追加され、エンタメシーンでのAI活用が進展。....

アップルがエヌビディアに譲歩し、MLXフレームワークがCUDAをサポート!AI分野の競争が激化
AppleのMLXフレームワークがCUDAサポートを追加し、NVIDIA生態系への歩み寄りを示した。AI市場での優位性確保のため、開発者がNVIDIA GPUで訓練したモデルをAppleデバイスに展開可能に。500万人の開発者を抱えるCUDA生態系への戦略転換。....

テスラのDojo 2チップが量産へ 性能はインテルに迫る マスク氏はゲームのルールを変えると語る
テスラは新世代のDojo2チップを発表しました。性能は初代の10倍に向上し、演算能力はインテルB200に近づきました。このチップは台湾積電によって製造され、高度なパッケージング技術を採用しており、消費電力などの問題を解決しています。Dojo2はテスラのFSD自動運転システムのトレーニングをサポートし、毎日1600億フレームのビデオデータを処理し、技術の自給自足を実現します。マスク氏は来年にはさらに強力なDojo3を発表すると明らかにし、ドジョー2は1秒間に10億フレームで『Crysis』を動作させられると冗談を言いました。この突破により、テスラがインテルへの依存を減らし、外部にも提供する可能性があります。

LightricksがLTXVモデルのアップデートを発表:60秒を超える画像から動画生成への進展

スウェーデンのスタートアップ企業ロvableは8か月で2億ドルを調達し、ユニコーン企業に認定された!
スウェーデンのAIコーディングプラットフォームLovableがAラウンドで2億ドル調達、バリュエーション18億ドル。自然言語でウェブ/アプリ作成可能で230万ユーザー(有料18万)、年収7500万ドル。Accel主導で出資。非技術者に人気、1000万プロジェクト以上作成。....

AIを基盤とした最初のマルウェア「LameHug」が登場、Windowsデバイスのデータを盗む
新たなマルウェア「LameHug」はアリババのQwen2.5大規模モデルを利用してWindowsシステムを攻撃し、メール添付ファイルを通じて広がっています。このソフトウェアは動的に盗難指令を生成することができ、システム情報と機密ファイルを収集します。多数の亜種が現れていることから、専門家はこれこそが公開された最初のAIを応用したマルウェアであると警告しており、ユーザーに対し注意喚起とセキュリティ対策の更新を推奨しています。

ビットテックのビジュアル大規模モデル責任者である楊建朝が一時的に休暇を取得し、周暢が後任に就任する動きが注目されている
ビットテックのビジュアル大規模モデルチームの責任者である楊建朝は家庭上の理由により一時的に休暇を取得すると発表した。これに代わって、元アリババ・トーンキスワン技術責任者の周暢が後任となった。この人事異動はビットテックのAI部門の調整期と重なっており、技術路線の安定性に向けた外部からの関心を高めている。楊建朝の業務資料は依然として内部システムに保存されており、周暢は世界中に分散するSeedチームを率いてビジュアルマルチモーダル生成などの研究を続けていく。会社側は基礎研究への継続的な投資を強調しており、新責任者から新たなイノベーションの活力を期待している。この人的変動は、技術業界における急速な発展の中で仕事と健康のバランスがどのほど重要かを浮き彫りにしている。