【AI日報】へようこそ!ここは毎日人工知能の世界を探索するためのガイドです。毎日、AI分野の注目ニュースをお届けし、開発者に焦点を当て、技術トレンドや革新的なAI製品の応用を理解するお手伝いをします。
新鮮なAI製品クリックして詳細を確認:https://app.aibase.com/zh
1. 生数科技がVidu Q2をリリース:微細な表情生成でAIの演技がよりリアルに!
生数科技がリリースしたVidu Q2モデルは、画像から動画を作成する分野で大きな進展を遂げました。特に、微細な表情の生成において優れた性能を発揮し、AIによる表現がより自然で生き生きとした視覚体験を提供します。
【AiBase要約:】
🎭 Vidu Q2は微細な表情の変化を正確に捉え、動画生成の自然さと感情表現を向上させます。
🎥 多様な動画モードを選択可能で、画像から動画、最初と最後のフレームからの動画、および調整可能な長さのオプションを備えています。
💡 生数科技はAI技術を通じてクリエイティブ産業を推進し、ユーザーにより高品質な映像制作体験を提供しています。
2. 火山エンジンが炉米 Lumi プラットフォームをリリース:視覚モデルのLora微調整をサポート
火山エンジンがリリースした炉米 Lumi プラットフォームは、豆包や即夢などの同様の視覚モデルに対してLora微調整機能を初めてサポートしました。このプラットフォームは、企業が独自のビジュアルスタイルを効率的にカスタマイズし、市場ニーズに応えることを目的としています。
【AiBase要約:】
🧠 炉米 Lumi プラットフォームは視覚モデルのLora微調整をサポートし、企業が独自のビジュアルスタイルをカスタマイズできます。
🚀 このプラットフォームは、画像生成から動画生成までのフルプロセスを提供し、企業のAIGCニーズに対応しています。
💡 炉米 Lumi プラットフォームは企業が効率的にカスタマイズされたAIGC生产能力を構築するのを支援し、ユーザー体験を向上させます。
3. アリ云CTOが明らかに:通義千問が300以上のモデルをオープンソース化、ダウンロード数が6億を突破
アリ云は2025年の雲栖大会で、通義千問プロジェクトの顕著な成果を紹介しました。これは、300を超えるモデルをオープンソース化し、ダウンロード数が6億を突破したことを示しています。これはアリ云がAI分野での強力な影響力と技術力を示すものであり、オープンソースモデルを通じて技術革新と実用化を推進しています。
【AiBase要約:】
🚀 通義千問プロジェクトでは300以上のモデルがオープンソース化され、強い技術力を示しています。
📊 ダウンロード総数が6億を突破し、ユーザーがアリ雲のAI技術を高く評価していることを示しています。
🖼️ 通義万象は3億9000万枚以上の画像と7000万本以上の動画を生成しており、デジタルコンテンツ生成能力を示しています。
4. バイドゥがQianfan-VLをオープンソース公開、昆崙芯がマルチモーダルAIの新発見をサポート
バイドゥは最新の視覚理解モデルであるQianfan-VLを正式にオープンソースで公開しました。このモデルには3B、8B、70Bの3つのバージョンがあり、さまざまなシナリオに適用可能です。このモデルは強力なマルチモーダル能力を持ち、特にOCRや教育分野でのパフォーマンスが突出しています。また、訓練には自社開発の昆崙芯P800チップが使用されています。
【AiBase要約:】
🧠 Qianfan-VLは画像とテキスト情報を同時に処理できる強力なマルチモーダル大規模モデルです。
💡 昆崙芯 P800チップはモデルの訓練をサポートし、低消費電力かつ高い効率性で大規模計算性能を最適化しています。
🚀 Qianfan-VLシリーズはGitHubとHugging Faceでオープンソース化されており、開発者は自由に利用できます。
詳細リンク:https://github.com/baidubce/Qianfan-VL
5. マイクロソフトがAnthropic AIモデルを導入、Copilot Assistantの機能拡張
マイクロソフトは、CopilotアシスタントにAnthropicのAIモデルを導入することを発表しました。これは、生成型AI分野における多様化戦略の一歩として重要な意味を持っています。OpenAIとの協力関係は依然として密接ですが、マイクロソフトはAnthropicの技術を徐々に導入し、ビジネス顧客のニーズに応えています。企業ユーザーはAnthropicのモデルを使ってAIエージェントを構築でき、これらのモデルはAmazonやGoogle Cloudで動作します。
【AiBase要約:】
🤖 マイクロソフトはCopilotアシスタントにAnthropicのAIモデルを導入し、製品の多様化を推進しています。
🔄 MicrosoftはOpenAIとの関係が依然として密接ですが、Anthropicの技術を徐々に導入しています。
🚀 企業ユーザーはAnthropicのモデルを使ってAIエージェントを構築でき、管理者が有効化後、使用できます。
6. OpenAIがアメリカで5つの新規データセンターを建設、Stargateプロジェクトの急速な発展を推進
OpenAIは、Stargateプロジェクトの計算能力を向上させるために、アメリカで5つの新しいデータセンターを建設することを発表しました。このプロジェクトは複数の企業によって共同で開始され、総投資額は5000億ドルに達し、生成型AIの発展を目的としています。
【AiBase要約:】
🌐 OpenAIはアメリカで5つの新しいデータセンターを建設し、Stargateプロジェクトの総計算能力は約7GWになります。
💼 Oracleは3つの新しいデータセンターの建設を担当し、アビリンデータセンターは拡張され、600MWの計算能力が追加されます。
🚀 OpenAIは今後週に1GWのAIインフラを追加する予定で、AI技術のさらなる発展を推進します。
7. エンボイドがAudio2Faceモデルをオープンソース化、AIがリアルタイムの顔面アニメーション生成を支援
エンボイドは、生成型AIの顔面アニメーションモデルであるAudio2Faceをオープンソース化しました。このモデルはSDKとトレーニングフレームワークを提供し、オフラインおよびリアルタイム処理をサポートし、ゲームや映画など様々な分野に適用可能です。この技術は多くのゲーム開発者によって採用されており、キャラクターのリアルさと没入感を向上させています。
【AiBase要約:】
🔊 エンボイドはAudio2Faceモデルをオープンソース化し、仮想キャラクターの顔面アニメーション生成技術を向上させます。
🎮 オフラインレンダリングとリアルタイムストリーミング処理をサポートし、多様なシナリオに対応しています。
🌟 複数のゲーム開発者によって採用され、制作プロセスを簡素化し、キャラクターのリアルさを向上させています。
詳細リンク:https://build.nvidia.com/nvidia/audio2face-3d
8. MetaがコードワールドモデルCWMを発表:32BのAIでサンドボックス推論能力を持つ
MetaがリリースしたCode World Model (CWM)は、32Bパラメータを持つAIシステムであり、コードのシミュレーションと推論をサンドボックス環境で行うことができます。これにより、エラーを減らし、デバッグ効率を向上させます。このモデルはハードウェアに非常に高い要求があり、2つのH100 GPUとRDMA技術が必要です。
【AiBase要約:】
🧠 CWMはコードを生成する前にサンドボックスでシミュレーションを行い、コードの実行結果を予測します。
🔍 コードのエラーを迅速に特定し、デバッグ効率を向上させます。
🚨 コマンドの実行前に潜在的なリスクを警告し、セキュリティを強化します。
詳細リンク:https://github.com/facebookresearch/cwm