【AIニュース】へようこそ!ここは毎日人工知能の世界を探索するためのガイドです。毎日、AI分野のホットな情報をご提供し、開発者に焦点を当て、技術のトレンドを理解し、革新的なAI製品の応用を紹介します。

新鮮なAI製品:クリックして詳細を確認https://top.aibase.com/

1. ビーチューティーEX-4Dが公開:単眼動画から自由視点の4D映像へ一瞬で変換

EX-4DはビーチューティーPICO-MRチームが開発した4D動画生成フレームワークで、単眼動画から高品質で多視点の4D動画シーケンスを作成できます。この技術は、深層密閉メッシュ(DW-Mesh)と軽量なアダプテーションアーキテクチャを使用し、従来の動画生成技術における多視点生成の課題を解決し、性能指標において全面的に優れています。

image.png

【AiBase要約:】

💡 EX-4Dは深層密閉メッシュ(DW-Mesh)を使って、単眼動画から多視点の高品質な生成を実現しています。

🔍 レンダリングマスクとトラッキングマスクの戦略を通じて、多視点データの不足問題を解決しています。

🚀 FID、FVD、VBenchなどの指標で既存のオープンソース方法を全面的に上回り、性能が優れています。

詳細リンク:https://github.com/tau-yihouxiang/EX-4D

2. Bilibiliがアニメーション動画生成モデルAniSora V3版をオープンソース化、1クリックでさまざまなスタイルのアニメーション動画シーンを生成

Bilibiliはそのオープンソースアニメーション動画生成モデルAniSora V3バージョンが大きなアップデートを受け、生成品質、動作の滑らかさ、スタイルの多様性が大幅に向上しました。このバージョンはCogVideoX-5BおよびWan2.1-14Bモデルに基づいており、強化学習と人間のフィードバック(RLHF)フレームワークを組み合わせ、さまざまなアニメーションスタイルの動画生成をサポートし、クリエイターにより強力なツールを提供しています。

image.png

【AiBase要約:】

✨ AniSora V3は時空間マスクモジュールの最適化により、アニメーションタスクのコントロール能力が向上しています。

🚀 多タスク処理をサポートし、単フレーム画像から動画生成、キーフレーム補間、唇同期などの機能が可能です。

📦 オープンソースエコシステムによりコミュニティ協力を促進し、開発者はGitHubからコードとデータセットを取得できます。

詳細リンク:https://t.co/I3HPKPvsBV

3. DeepSWEオープンソースAIエージェントシステムが登場、Qwen3-32Bを基盤に

DeepSWEはQwen3-32Bモデルを基盤としたオープンソースAIエージェントシステムであり、強化学習によって訓練され、SWE-Bench-Verifiedテストで優れたパフォーマンスを示しました。このシステムはrLLMフレームワークと改良されたGRPO++アルゴリズムを採用しており、ソフトウェアエンジニアリングタスクにおいて強い学習能力と応用可能性を示しています。

image.png

【AiBase要約:】

🧠 DeepSWEはQwen3-32Bモデルを基盤として、完全に強化学習によって訓練されており、オープンソース情報がすべて公開されています。

🏆 SWE-Bench-Verifiedテストにおいて優れたパフォーマンスを示し、Pass@1の正確度が59%に達し、すべてのオープンソースエージェントの中でトップクラスです。

💡 rLLMフレームワークと改良されたGRPO++アルゴリズムを採用しており、実際にソフトウェアエンジニアリングタスクにおいて強い学習能力と応用可能性を示しています。

詳細リンク:https://huggingface.co/agentica-org/DeepSWE-Preview

4. ビーチューティーがVINCIE-3Bという新しいモデルをオープンソース化:3億パラメータ、文脈連続画像編集をサポート

ビーチューティーは文脈連続画像編集をサポートするVINCIE-3Bモデルをオープンソース化しました。このモデルはMM-DiTアーキテクチャに基づいて開発され、動画から学習し効率的な画像編集を実現できます。技術的特長には動画駆動トレーニング、ブロック因果拡散トランスフォーマー、および三重代理タスクトレーニングが含まれており、画像編集の品質と効率を大幅に向上させました。

image.png

【AiBase要約:】

🎥 動画駆動トレーニング:VINCIE-3Bは動画の連続フレームを利用して、テキスト説明と画像シーケンスを自動的に抽出し、マルチモーダルトレーニングデータを構築します。

🧠 ブロック因果拡散トランスフォーマー:モデルはブロック因果アテンション機構を採用し、テキストと画像ブロック間で因果アテンションを行い、ブロック内では双方向アテンションを行います。

🔄 三重代理タスクトレーニング:次のフレーム予測、現在のフレームセグメンテーション予測、次のフレームセグメンテーション予測の3つのタスクを通じてトレーニングし、動的シーンや物体関係の理解能力を向上させます。

詳細リンク:https://huggingface.co/ByteDance-Seed/VINCIE-3B

5. Stability AIがStable Audio Open Smallをオープンソース化、スマートフォンが音声創作の神器に

Stability AIはArmと提携し、モバイルデバイス向けに最適化された軽量なテキストから音声生成モデルStable Audio Open Smallをリリースしました。このモデルはモバイル端末でローカルで動作し、オフライン処理をサポートし、効率的で低遅延、高品質な出力を備え、AI音声生成技術がエッジコンピューティングとモバイルデバイスへの移行を推進します。

image.png

【AiBase要約:】

📱 軽量設計:パラメータ数が341Mまで圧縮され、モバイルデバイスで動作可能です。

🔊 高品質な音声生成:ステレオ音声生成をサポートし、クラウド処理を必要としません。

🌐 オープンソースによる開発者支援:コミュニティライセンスに準拠し、技術の障壁を下げ、創造的な応用を奨励します。

詳細リンク:https://huggingface.co/stabilityai/stable-audio-open-small

6. グーグルがGemini for Educationを発表!無料AIツールが世界中の教育を席巻

グーグルは新たなAIツールキットであるGemini for Educationをリリースしました。これは最新のGemini2.5ProモデルとLearnLM学習型大規模モデルを基盤としており、世界中の教師と生徒に無料で強力で効率的な学習と授業支援を提供します。このツールは30以上の機能をカバーし、40以上の言語をサポートし、AI技術を通じて教育者と生徒を支援し、より個人的で効率的な学習体験を構築することを目的としています。

image.png

【AiBase要約:】

🌍 全球的な教育支援:40以上の言語をサポートし、230以上の国と地域をカバーします。

📚 無料開放:Google Workspace for Educationユーザー全員に無料で提供され、教育の公平性を推進します。

🔒 安全とプライバシー:プライバシーポリシーを厳守し、ユーザーのデータの安全を確保します。

7. Topview Avatar 2が衝撃的にリリース!AIデジタル人間がEC販売を革新、モデル時代の終焉?

Topview Avatar 2は革新的な機能と非常にリアルな効果により、海外ECやコンテンツクリエイターにとって革命的な体験をもたらします。この独自のAIデジタル人間技術により、製品とデジタル人の自然な相互作用が可能になり、ビデオ制作の効率と内容の質を大きく向上させます。

image.png

【AiBase要約:】

🌍 世界初のAIデジタル人間による「製品装着」、よりリアルな相互作用効果を実現。

⚙️ 1クリックでカスタマイズされたビデオを生成し、複数言語の口形同期をサポートし、マーケティングの柔軟性を向上。

🚀 従来のUGCビデオ形式を革新し、EC撮影のハードルを低下させ、ブランドのグローバル化を支援。

詳細リンク:https://www.topview.ai/ai-product-avatar

8. PerplexityがMaxサブスクリプションプランを発表:月額200ドルで無制限のAI生産性を解禁

Perplexityは高級サブスクリプションプランであるMaxを発表しました。価格は月額200ドルまたは年額2000ドルで、頻繁に使用するユーザーおよび専門家向けです。このプランではLabsの無制限アクセス、新機能の優先体験、最新の前線モデルのサポートが提供され、AI生産性ツール分野でのさらなる掘り下げを示しています。

image.png

【AiBase要約:】

🧠 無制限Labsクエリ:専門ユーザーの深い研究や複雑なプロジェクトのニーズに対応。

🚀 最新モデルの優先アクセス:ユーザーが常に技術の最前線に立つことを確保。

🔒 優先サポート:専用インフラストラクチャと速いカスタマーサポート時間を提供。

9. Cursorが大胆に人材を引き抜く!Claude Codeの中心人物が競合企業に移籍

CursorはAnthropicの2人の中心人物を引き抜き、AIプログラミング市場の競争が激化していることを示しています。Anthropicは人材流出に直面していますが、ビジネスは依然として強力で、収益と評価が大幅に増加しています。Anysphereはこれらの人物を通じてさらに製品の競争力を高めています。

image.png

【AiBase要約:】

🧠 Cursorは成功裏にAnthropicの中心人物を引き抜き、技術力が向上。

💼 Boris ChernyとCat WuがAnysphereに加入し、製品の革新を推進。

📈 Anthropicのビジネス成長が著しく、収益と評価が大幅に上昇。

10. OpenAI声明:Robinhoodがリリースした「OpenAIトークン」は我々とは関係ありません

記事では、RobinhoodがヨーロッパでOpenAIとSpaceXのトークン化株式をリリースしたが、OpenAIはこれらが自社の株式ではなく、Robinhoodとは協力関係がないことを明確に述べました。Robinhoodは限定的なプロモーションでユーザーを惹きつけましたが、米国のユーザーは参加できません。この出来事は市場で熱烈な反響を呼び、Robinhoodの株価は一時的に急騰しました。

image.png

【AiBase要約:】

💰 OpenAIは「OpenAIトークン」が自社の株式ではないこと、Robinhoodとの協力関係がないことを強調しています。

⚠️ Robinhoodはトークン化株式を通じて投資家を引きつけますが、米国のユーザーは参加できません。

📈 このニュースによりRobinhoodの株価が上昇し、歴史的新高を記録しました。