ようこそ【AI Daily】コーナーへ!ここはあなたが毎日人工知能の世界を探索するためのガイドです。毎日、AI分野のホットなトピックをお届けし、開発者をフォーカスして技術トレンドや革新的なAI製品の応用についてお伝えします。
新しいAI製品はこちらをクリックしてチェック:https://top.aibase.com/
1. 阿里通義万相Wan2.1-VACEがオープンソース化 ビデオエディタの統合モデルとして最初のものとされる
通義万相はVACEをオープンソース化し、さまざまな解像度とタスクに対応可能にし、ビデオ作成のワンストップ体験を提供します。マルチモーダル入力メカニズムにより、効率的で柔軟なビデオ編集を実現します。
【AiBase要約:】
✨ 文からビデオ生成、画像リファレンス生成、局所編集、ビデオ拡張など、多岐にわたるタスクに対応し、クリエイティブな生産性を向上させます。
🌟 人間のポーズや運動のフローやその他の制御に基づいた高度な再描画能力を持ち、主体や背景のリファレンスもサポートしています。
🔧 ビデオ条件ユニット(VCU)を提案し、マルチモーダル入力を統一することで、複数のタスクを自由に組み合わせて編集できます。
詳細リンク:https://github.com/Wan-Video/Wan2.1
2. OpenAI、ChatGPTをアップデート:GPT-4.1を正式導入 コード能力が強化
OpenAIはGPT-4.1とその軽量版であるGPT-4.1miniをリリースし、コード能力とインストラクション実行体験を大幅に強化しました。また、ユーザー体験の最適化とマルチモーダルサポートを改善し、AI分野でのリーダーシップをさらに確固たるものにしました。
【AiBase要約:】
🚀 GPT-4.1は強力なコード能力を備え、複雑なプログラミングニーズにもより効果的に対応し、処理速度も速くなります。開発者やインストラクション処理シナリオに最適です。
🌐 GPT-4.1miniは軽量かつ効率的で、リソースが制限されたデバイスでも快適に動作します。無料ユーザーと有料ユーザーの双方に広範なアクセスを提供します。
🌟 ChatGPTでは長押しによるコピー機能や表のコピー機能、ストリーム転送機能が追加され、インターフェースの最適化でユーザーエクスペリエンスが大きく向上しました。
3. Stability AI、341Mパラメーターの軽量テキストto音声モデルをオープンソース化 モバイル端末でローカル動作可能、音声生成に8秒しかかかりません!
Stability AIは「ARC後処理による高速テキストto音声生成」という軽量テキストto音声モデルを公開しました。パラメーターはわずか341Mですが、H100 GPUでは75ミリ秒で12秒の音声を生成し、モバイルCPUでは7秒で同じタスクを完了できます。そのパフォーマンスは非常に優れています。
【AiBase要約:】
⚡ ARC後処理法は蒸留を使用していないため、モデルの生成速度と品質が向上しました。
📱 モデルは軽量化されており、モバイル端末上で動作可能で、モバイルクリエイティブアプリケーションの体験を大幅に向上させます。
💫 音声変換機能によりスタイル変換が可能になり、さらに多くのクリエイティブアイデアを刺激します。
詳細リンク:https://arxiv.org/pdf/2505.08175
4. Poeレポート:可靈大規模モデルのビデオ生成量が30%のシェアを占める、Runwayをリード
最近発表された2025年春のAIモデル使用トレンドレポートによると、中国Kuaishouの可靈ビデオ生成モデル群が文生成ビデオ分野で目覚ましい成果を収めています。全体市場シェアの30%を占めており、その中で可靈2.0モデルは発売後わずか3週間で21%の使用率を達成しました。昨年6月のリリース以来、グローバルユーザー数は2200万人を超え、アクティブユーザー数は25倍に増加し、生成されたビデオや画像の数も顕著に増えています。
【AiBase要約:】
🌟 可靈大規模モデルは文生成ビデオ分野で30%の市場シェアを占め、競合他社をリードしています。
📈 可靈2.0モデルは4月のリリース後わずか3週間でビデオ生成市場の21%を占めました。
👥 可靈AIのグローバルユーザー数は2200万人を超え、アクティブユーザー数は25倍に増加し、生成されたビデオや画像の数も大幅に増えています。
5. MicrosoftのWizardLMチームが全員 Tencentに移籍、既に「混元」大規模モデル開発チームに吸収
Microsoftの人工知能研究チームWizardLMが全体的にTencent AI Labの「混元」チームに加入し、Tencentは大規模モデル分野でさらなる力を発揮することになりました。このチームは複数の技術的なブレークスルーをもたらし、オープンソースモデルを通じてその開発力を示しています。
【AiBase要約:】
✨ 元々Microsoftに所属していたWizardLMチームがTencentの混元チームに完全に合流し、Tencentの大規模モデル分野における競争力を強化しました。
🚀 Hunyuan-TurboS0416モデルは初めて「混元」の名称を使用し、チームとTencentの統合の象徴です。
💼 TencentはAIへの投資を大幅に増やし、グローバルAI競争においてより主導的な地位を目指しています。
6. Tencent、混元画像2.0が5月16日に新バージョンとしてリリースされる
Tencentの混元大規模モデルチームは、混元画像2.0が5月16日にリリースされることを発表しました。これはTencentがAI視覚分野で重要な進展を遂げたことを示すものです。「よりスマート、よりオープン、より中国」が核心理念です。
【AiBase要約:】
🌟 混元画像2.0が5月16日にリリースされ、TencentがAI視覚分野で新たなステップを踏むことを示します。
🌐 新ツールは「よりスマート、よりオープン、より中国」を強調し、クリエイターと企業がAI駆動の視覚生産の新しい時代へ進む手助けをします。
🚀 去年の混元大規模モデルアップデートに続き、TencentはAI分野での持続的な革新力を再び証明しました。
7. 上海、人工知能識別エコシステム連盟を発足 REDBOOKとMiniMaxなどが初参加
本記事では上海市が設立した人工知能識別エコシステム連盟について説明しています。この連盟は人工知能分野における識別技術の発展を推進し、生成コンテンツの透明性と安全性を高めることを目的としています。また、政策解説や企業との協力を通じて、信頼できる人工知能環境の構築に向けた基礎を築いています。
【AiBase要約:】
🌟 聯盟は上海市委網信办の指導のもとに設立され、多数の有名企業が参加しており、AI生成コンテンツの透明性と安全性を向上させることが目標です。
🔍 国際インターネット緊急対応センターと中国電子技術標準化研究院が関連政策を解説し、国際規則と中国の特徴的な要素を組み合わせることを強調しています。
🤝 REDBOOK、MiniMaxなどの企業が識別作業に参加し、多種多様なコンテンツの識別案を検討し、管理経験を積んでいます。
8. Lightricks、LTX-Video-13B精錬モデルをリリース!10秒で高品質AIビデオ生成、速度と質が両方向上!
イスラエルのテクノロジーカンパニーLightricksがリリースしたオープンソースAIビデオ生成モデルLTX-Video-13B精錬モデルは、130億パラメーターを基盤に、マルチスケールレンダリング技術と効率的な量子化最適化を組み合わせ、ビデオ生成速度を10秒以下にまで向上させつつ、高品質の出力を保っています。
【AiBase要約:】
🚀 マルチスケールレンダリング技術を採用し、10秒以内で高品質のビデオ生成を行い、速度は5倍以上向上しました。
🌍 オープンソースモデルで、低メモリデバイスでの動作をサポートし、AIビデオ制作コストを削減します。
🌟 生成速度は30倍向上し、プロフェッショナルな映像作品と並び立ち、コンテンツ制作エコシステムを再定義します。
詳細リンク:https://github.com/Lightricks/LTX-Video
9. Google、AlphaEvolveをリリース!Gemini自進化AIが数学問題を解決、チップとデータセンタを最適化、トレーニング速度が32.5%向上
Google DeepMindが発表したAlphaEvolveは、Gemini大言語モデルと進化アルゴリズムを組み合わせたAIコーディングエージェントであり、データセンタのスケジューリング、チップ設計、AIトレーニング、数学研究などの分野で強力な自己最適化能力を発揮しています。
【AiBase要約:】
🌟 Geminiと進化アルゴリズムを組み合わせ、チップの最適化や数学問題の解決など複雑な課題に対応します。
🚀 AlphaEvolveはデータセンタのスケジューリングを最適化し、世界の電力消費の0.7%を回収し、運営コストを削減します。
🔍 AIトレーニングの効率を高め、Geminiモデルのトレーニング速度は32.5%向上し、強力な自己最適化能力を示します。
10. Tencent、元宝ブラウザプラグインベータ版がChromeに登場
Tencent元宝ブラウザプラグインベータ版がChromeプラットフォームに登場し、フローティングボタン、常駐サイドバー、選択ツールバーなどの機能を提供し、ウェブ閲覧と情報処理の効率を向上させます。
【AiBase要約:】
✨ フローティングボタン機能により、ウェブページの翻訳や要約がワンクリックで可能になり、言語障壁を簡単に乗り越え、読書時間を節約できます。
💬 常駐サイドバーは効率的に質問に答え、スクリーンショットによる質問もサポートし、情報取得の効率を大幅に向上させます。
🔍 選択ツールバーは選択したテキストに対して即時の検索や翻訳を行うことができ、情報処理をスムーズにします。
詳細リンク:https://yuanbao.tencent.com/download