【AIニュース】コーナーへようこそ!ここでは、あなたが毎日人工知能の世界を探究するためのガイドです。日々、AI分野のホットなトピックをお届けし、開発者向けに技術トレンドや革新的なAI製品の活用についてお伝えします。

新しいAI製品をチェック:https://top.aibase.com/

1. BilibiliチームがAniSoraオープンソースアニメーションビデオ生成モデルをリリース!多様なスタイルのアニメーションをワンクリックで作成可能!

Bilibiliチームは、AniSoraオープンソースアニメーションビデオ生成モデルをリリースし、アニメーションビデオ生成分野での技術的な空白を埋めました。多様なアニメスタイルに対応したビデオクリエイションをサポートしています。

image.png

【AiBaseまとめ:】

😊 AniSoraはワンクリックで多様なアニメスタイルのビデオを生成でき、シリーズやオリジナル中国アニメなどさまざまなタイプをカバーしています。

🌟 時空間マスクモジュールを導入し、画像からビデオ生成、フレーム補完、局所的な画像誘導などの機能をサポートし、生成品質を向上させます。

🏆 厳格なテストを通じて、キャラクターと動きの一貫性が現在の最高基準(SOTA)に達しており、優れたパフォーマンスを示しました。

2. OpenAIが新しいプログラミングインテリジェンスエージェントCodexを発表

私は開発者として、OpenAIがリリースしたCodexに非常に興奮しています。Codexは開発時間を大幅に短縮し、GitHubとシームレスに統合され、生産性を飛躍的に向上させます。強化学習を通じて人間の好みに沿ったコードを生成し、自己指図能力を有しています。

image.png

【AiBaseまとめ:】

🚀 CodexはOpenAIによって開発され、複雑な開発タスクをわずか30分以内に完了できます。

🔗 CodexはGitHubとシームレスに統合され、マルチタスク並列処理をサポートし、開発者の効率を大幅に向上させます。

🤖 Codexは強化学習で訓練され、生成されたコードが人間の開発者の好みに一致することを保証します。

3. Google検索がAIモード実験を開始、新しいインテリジェントな質問応答体験を提供

Googleは「AIモード」という実験的な機能をリリースし、テキスト、音声、画像による質問に対するインテリジェントな質問応答体験を提供し、ユーザーのフィードバックに基づいてサービスを継続的に最適化しています。

image.png

【AiBaseまとめ:】

🌟 テキスト、音声、画像による質問をサポートし、よりスマートな質問応答体験を提供します。

🔍 続きの質問でさらに詳細な情報を深掘りでき、関連するウェブリンクも取得可能です。

🔒 ユーザーのプライバシーを重視し、データセキュリティを保護し、ユーザーからのフィードバックを奨励しています。

詳細はこちら:https://support.google.com/websearch/answer/16011537?visit_id=638832352895396136-3267382421&p=aimodeavailability&rd=1#aimodeavailability

4. ChatGPTがMCPプロトコルを統合、企業の多様なAIサービスへの接続を支援

ChatGPTはMCPプロトコルをサポートし始めます。このプロトコルにより、ChatGPTはサードパーティのAIサービスとシームレスに連携し、よりパーソナライズされたユーザーエクスペリエンスを提供します。企業はこのプロトコルを使用して業務プロセスを最適化し、効率と意思決定の質を向上させることができます。

image.png

【AiBaseまとめ:】

🌟 MCPプロトコルは大規模言語モデルと外部システムのインタラクション方法を標準化しており、AIアプリケーションの「USB-Cポート」のようなものです。

⚙️ ユーザーはツールをカスタマイズでき、名前、URL、説明を入力することで、ChatGPTと個人のアプリケーションを統合できます。

💼 MCPは企業にデータのオンデマンド共有能力を提供し、業務プロセスを最適化し、意思決定の進化を推進します。

5. Alibaba Tongyi LabがZeroSearchを発表:大規模モデルがAPIなしで「検索」を行う

ZeroSearchは新しいフレームワークであり、強化学習と少量のラベル付きデータを使用して、大規模言語モデルが検索エンジンをシミュレートし、検索と推論能力を向上させる一方で、実際の検索エンジンへの依存を減らし、トレーニングコストを削減します。

image.png

【AiBaseまとめ:】

✨ ZeroSearchは強化学習と少量のラベル付きデータを使用し、大規模モデルがリアルタイム検索エンジンに依存せずに高品質な文書を生成し、推論能力を強化します。

📚 フレームワークは段階的な学習法を採用し、質が高い文書から低いものまで順次学習することで、複雑な検索タスクへの適応力を向上させます。

🌟 QAデータセットでのテストにおいて、ZeroSearchは従来の方法を上回る結果を出し、単一およびマルチジャンプQAタスクで顕著な優位性を示しました。

6. Stability AIとArmがモバイル級の音声生成AIを発表:7秒で11秒のステレオ音声を生成

Stability AIとArmは、高品質のステレオ音声を7秒で生成する安定した音声生成オープン小型モデルを発表しました。このモデルはモバイルデバイス上でスムーズに動作し、対抗的相対比較技術によりパラメータ数を大幅に減少させ、消費者向けハードウェアに適応させています。

image.png

【AiBaseまとめ:】

革命的な技術により、音声生成はわずか7秒で可能になり、ほぼリアルタイムの音声合成能力を実現しました。

モデルアーキテクチャは3つの部分に分割され、モバイル端末に適応し、多様な音声生成タスクをサポートします。

トレーニングデータは厳密に選定され、合法かつ規制に準拠していますが、現在は主に英語のプロンプトに適応しています。

7. Qwenが新しいプレファレンスモデリングモデルシリーズWorldPMをリリース

QwenチームはWorldPMシリーズモデル、WorldPM-72Bおよびその派生版をリリースしました。大規模なトレーニングによりプレファレンスモデリングの突破を達成し、開発者に効率的な最適化パスを提供します。

image.png

【AiBaseまとめ:】

🌍 WorldPMは1500万件のプレファレンスデータでトレーニングされ、プレファレンスモデリングがスケーリングの法則に従うことを確認し、監督学習でのパフォーマンスを向上させました。

🌐 モデルシリーズはオープンソースでリリースされ、技術的な障壁を低くし、グローバルな開発者がモデル最適化の効率を向上させられるようにします。

🌟 スタイルのニュートラル性を強化し、主観的なバイアスを克服し、コーディングや数学などのタスクで顕著な利点を示しました。

詳細はこちら:https://huggingface.co/Qwen/WorldPM-72B

8. OpenAIがGPT-5の秘密を公開:複数の製品を一体化

Jerry Tworek氏はRedditでGPT-5の最新情報を共有し、Codex、Operator、Deep Research、Memoryを統合することでユーザーの操作フローを簡素化すると述べました。Codexのプログラミング効率は3倍向上し、OpenAIはこのツールを初心者開発者向けに利用しやすくする計画を立てています。

image.png

【AiBaseまとめ:】

🌟 GPT-5はCodex、Operator、Deep Research、Memoryを統合し、ツール間の切り替えの煩わしさを軽減します。

💻 Codexはプログラミング効率を3倍に向上させ、煩雑なタスクを簡単にこなす開発者に最適です。

👨‍💻 OpenAIはCodexを通じて初心者開発者にプログラミングを迅速に学ばせ、人類開発者の全体的な能力を強化する計画を立てています。

9. ListenHub: AI生成ツールでポッドキャスト体験を革新

ListenHubはAI技術を使ったポッドキャスト生成ツールで、中国語と英語に対応し、個別のポッドキャスト体験を提供します。その高速な生成スピードと使いやすいインターフェースにより人気があり、一般ユーザーからコンテンツクリエイターまで幅広く受け入れられています。無料会員とプレミアム会員の両方を提供し、モバイル体験にも注力しています。

image.png

【AiBaseまとめ:】

🌟 AI技術を使ってユーザーの興味に関連するコンテンツを高速生成し、テクノロジー、歴史、社会などの話題を取り上げます。

⚡️ 高速で1-5分でポッドキャストを作成でき、忙しい人々やコンテンツクリエイターに最適です。

📱 多プラットフォームとモバイル対応で、多様なニーズに対応します。

詳細はこちら:https://listenhub.ai/zh

10. QQブラウザがAIブラウザにアップデート:QBotを導入し5つの新しいAI機能を追加

QQブラウザがAIブラウザにアップデートされ、QBotが搭載され、より知的なブラウジング体験を提供します。検索、読解、翻訳、執筆、仕事のアシスタントなどの機能が含まれています。

image.png

【AiBaseまとめ:】

🚀 QBotはマルチモーダルな質問をサポートし、さまざまな質問に正確に答え、24時間体制で知的な伴侶として機能します。

📚 AI読解ツールはウェブページの内容を要約したり、思考ツリーを生成したりして情報処理の効率を向上させます。

💼 オフィスシーンでは、QBotは文書編集、翻訳、執筆など多岐にわたるツールを提供し、効率的な働き方をサポートします。

11. 数学モデリング専門AIアシスタントMathModelAgent

MathModelAgentは数学モデリング専用の知的ツールで、問題の分析からモデル構築、コードの作成、論文の執筆までの全工程を自動で行い、AIが学術と技術の分野で深い潜在可能性を示しています。

image.png

【AiBaseまとめ:】

問題分析とモデリング:モデリング担当者は数学問題を迅速に解析し、論理的な数学モデルを作成できます。

コード生成とデバッグ:コード担当は内部リフレクションモジュールを持ち、高品質なコードを生成し、ローカルインタプリタで即座にデバッグできます。

論文自動作成:論文担当はモデリングと計算結果に基づいて形式的に整った学術論文を自動生成します。

12. GenSparkが世界初のAgentic AIダウンロードエージェントをリリース:ファイル管理体験を革新