【AI日報】へようこそ!ここは毎日人工知能の世界を探索するためのガイドです。毎日、AI分野の注目ニュースをお届けし、開発者に焦点を当て、技術トレンドや革新的なAI製品の応用を理解するお手伝いをします。

新鮮なAI製品クリックして詳細を確認https://app.aibase.com/zh

1. 生数科技がVidu Q2をリリース:微細な表情生成でAIの演技がよりリアルに!

生数科技がリリースしたVidu Q2モデルは、画像から動画を作成する分野で大きな進展を遂げました。特に、微細な表情の生成において優れた性能を発揮し、AIによる表現がより自然で生き生きとした視覚体験を提供します。

image.png

【AiBase要約:】

🎭 Vidu Q2は微細な表情の変化を正確に捉え、動画生成の自然さと感情表現を向上させます。

🎥 多様な動画モードを選択可能で、画像から動画、最初と最後のフレームからの動画、および調整可能な長さのオプションを備えています。

💡 生数科技はAI技術を通じてクリエイティブ産業を推進し、ユーザーにより高品質な映像制作体験を提供しています。

2. 火山エンジンが炉米 Lumi プラットフォームをリリース:視覚モデルのLora微調整をサポート

火山エンジンがリリースした炉米 Lumi プラットフォームは、豆包や即夢などの同様の視覚モデルに対してLora微調整機能を初めてサポートしました。このプラットフォームは、企業が独自のビジュアルスタイルを効率的にカスタマイズし、市場ニーズに応えることを目的としています。

image.png

【AiBase要約:】

🧠 炉米 Lumi プラットフォームは視覚モデルのLora微調整をサポートし、企業が独自のビジュアルスタイルをカスタマイズできます。

🚀 このプラットフォームは、画像生成から動画生成までのフルプロセスを提供し、企業のAIGCニーズに対応しています。

💡 炉米 Lumi プラットフォームは企業が効率的にカスタマイズされたAIGC生产能力を構築するのを支援し、ユーザー体験を向上させます。

3. アリ云CTOが明らかに:通義千問が300以上のモデルをオープンソース化、ダウンロード数が6億を突破

アリ云は2025年の雲栖大会で、通義千問プロジェクトの顕著な成果を紹介しました。これは、300を超えるモデルをオープンソース化し、ダウンロード数が6億を突破したことを示しています。これはアリ云がAI分野での強力な影響力と技術力を示すものであり、オープンソースモデルを通じて技術革新と実用化を推進しています。

image.png

【AiBase要約:】

🚀 通義千問プロジェクトでは300以上のモデルがオープンソース化され、強い技術力を示しています。

📊 ダウンロード総数が6億を突破し、ユーザーがアリ雲のAI技術を高く評価していることを示しています。

🖼️ 通義万象は3億9000万枚以上の画像と7000万本以上の動画を生成しており、デジタルコンテンツ生成能力を示しています。

4. バイドゥがQianfan-VLをオープンソース公開、昆崙芯がマルチモーダルAIの新発見をサポート

バイドゥは最新の視覚理解モデルであるQianfan-VLを正式にオープンソースで公開しました。このモデルには3B、8B、70Bの3つのバージョンがあり、さまざまなシナリオに適用可能です。このモデルは強力なマルチモーダル能力を持ち、特にOCRや教育分野でのパフォーマンスが突出しています。また、訓練には自社開発の昆崙芯P800チップが使用されています。

image.png

【AiBase要約:】

🧠 Qianfan-VLは画像とテキスト情報を同時に処理できる強力なマルチモーダル大規模モデルです。

💡 昆崙芯 P800チップはモデルの訓練をサポートし、低消費電力かつ高い効率性で大規模計算性能を最適化しています。

🚀 Qianfan-VLシリーズはGitHubとHugging Faceでオープンソース化されており、開発者は自由に利用できます。

詳細リンク:https://github.com/baidubce/Qianfan-VL

5. マイクロソフトがAnthropic AIモデルを導入、Copilot Assistantの機能拡張

マイクロソフトは、CopilotアシスタントにAnthropicのAIモデルを導入することを発表しました。これは、生成型AI分野における多様化戦略の一歩として重要な意味を持っています。OpenAIとの協力関係は依然として密接ですが、マイクロソフトはAnthropicの技術を徐々に導入し、ビジネス顧客のニーズに応えています。企業ユーザーはAnthropicのモデルを使ってAIエージェントを構築でき、これらのモデルはAmazonやGoogle Cloudで動作します。

image.png

【AiBase要約:】

🤖 マイクロソフトはCopilotアシスタントにAnthropicのAIモデルを導入し、製品の多様化を推進しています。

🔄 MicrosoftはOpenAIとの関係が依然として密接ですが、Anthropicの技術を徐々に導入しています。

🚀 企業ユーザーはAnthropicのモデルを使ってAIエージェントを構築でき、管理者が有効化後、使用できます。

6. OpenAIがアメリカで5つの新規データセンターを建設、Stargateプロジェクトの急速な発展を推進

OpenAIは、Stargateプロジェクトの計算能力を向上させるために、アメリカで5つの新しいデータセンターを建設することを発表しました。このプロジェクトは複数の企業によって共同で開始され、総投資額は5000億ドルに達し、生成型AIの発展を目的としています。

image.png

【AiBase要約:】

🌐 OpenAIはアメリカで5つの新しいデータセンターを建設し、Stargateプロジェクトの総計算能力は約7GWになります。

💼 Oracleは3つの新しいデータセンターの建設を担当し、アビリンデータセンターは拡張され、600MWの計算能力が追加されます。

🚀 OpenAIは今後週に1GWのAIインフラを追加する予定で、AI技術のさらなる発展を推進します。

7. エンボイドがAudio2Faceモデルをオープンソース化、AIがリアルタイムの顔面アニメーション生成を支援

エンボイドは、生成型AIの顔面アニメーションモデルであるAudio2Faceをオープンソース化しました。このモデルはSDKとトレーニングフレームワークを提供し、オフラインおよびリアルタイム処理をサポートし、ゲームや映画など様々な分野に適用可能です。この技術は多くのゲーム開発者によって採用されており、キャラクターのリアルさと没入感を向上させています。

image.png

【AiBase要約:】

🔊 エンボイドはAudio2Faceモデルをオープンソース化し、仮想キャラクターの顔面アニメーション生成技術を向上させます。

🎮 オフラインレンダリングとリアルタイムストリーミング処理をサポートし、多様なシナリオに対応しています。

🌟 複数のゲーム開発者によって採用され、制作プロセスを簡素化し、キャラクターのリアルさを向上させています。

詳細リンク:https://build.nvidia.com/nvidia/audio2face-3d

8. MetaがコードワールドモデルCWMを発表:32BのAIでサンドボックス推論能力を持つ

MetaがリリースしたCode World Model (CWM)は、32Bパラメータを持つAIシステムであり、コードのシミュレーションと推論をサンドボックス環境で行うことができます。これにより、エラーを減らし、デバッグ効率を向上させます。このモデルはハードウェアに非常に高い要求があり、2つのH100 GPUとRDMA技術が必要です。

image.png

【AiBase要約:】

🧠 CWMはコードを生成する前にサンドボックスでシミュレーションを行い、コードの実行結果を予測します。

🔍 コードのエラーを迅速に特定し、デバッグ効率を向上させます。

🚨 コマンドの実行前に潜在的なリスクを警告し、セキュリティを強化します。

詳細リンク:https://github.com/facebookresearch/cwm