【AIニュース】へようこそ!ここは毎日人工知能の世界を探索するためのガイドです。毎日、AI分野の注目コンテンツをお届けし、開発者に焦点を当て、技術トレンドや革新的なAI製品・応用を理解するお手伝いをします。

新鮮なAI製品:クリックして詳細を確認https://app.aibase.com/zh

1. 鈴鈴(DingTalk)が10周年記念で8.0バージョンをリリースし、AIオフィスの新形態「DingTalk ONE」を発表

鈴鈴は10周年記念に8.0バージョンをリリースし、次世代のAIオフィスアプリケーションの形である「DingTalk ONE」を導入しました。この製品は自然言語による対話で人間とAIとのインタラクションを実現し、複雑な業務プロセスを簡略化し、利用のハードルを下げます。同時に、鈴鈴は企業組織数、課金組織数、およびAIアプリケーション数などのデータを通じて市場での地位とユーザーからの認知度を示しています。

image.png

【AiBaseの要約:】

✨ 鈴鈴が8.0バージョンをリリースし、AIオフィスの新形態「DingTalk ONE」を発表。

🤖 「DingTalk ONE」は自然言語による対話で人間とAIのインタラクションを実現し、業務プロセスを簡素化。

📊 鈴鈴は企業組織数やAIアプリケーション数などのデータを通じて市場での地位とユーザーからの認知度を示す。

2. アリがMobile-Agent 3を開源:強力なGUIエージェントファミリー

X-PLUGチームがMobile-Agent-v3をリリースしました。これはクロスプラットフォーム多エージェントフレームワークであり、GUI自動化タスクに適した強力な機能と最適化されたパフォーマンスを持っています。

image.png

【AiBaseの要約:】

🧠 Mobile-Agent-v3はGUI-Owlに基づいており、強力な計画能力、進捗管理、反省、記憶能力を持つ。

⚙️ 異常処理と反省能力が最適化され、干渉下でも効率的に動作する。

📚 技術報告書、デモ動画、コードベースが提供され、開発者がその潜在力を探求するのに役立ちます。

詳細リンク: https://github.com/X-PLUG/MobileAgent

3. ワイチャットがAIポッドキャストを登場させた!二人の会話でニュースを配信、伝統的なアシスタントは失業するのか?

ワイチャットは現在、AIポッドキャストという機能をテスト中で、ニュースを二人の会話形式で配信することで、ユーザーに没入感のある情報体験を提供しています。この機能はニュース記事を基にし、AI技術を使ってテキストを自然で滑らかな会話形式に変換し、従来のニュース消費方法を変革しています。

image.png

【AiBaseの要約:】

✨ ワイチャットがAIポッドキャスト機能をリリースし、二人の会話形式でニュースを配信し、ユーザー体験を向上。

💡 AIポッドキャストは権威あるメディアや地方政府情報に基づき、情報の正確性と信頼性を確保。

🚀 今後、長文朗読やチャット履歴の再確認などの場面にも拡張される可能性があり、情報取得方法を再定義する。

4. 鈴鈴が初のAIハードウェアを発表:AI録音製品DingTalk A1

鈴鈴CEOの陳航氏は10周年記念イベントで初のAIハードウェア製品であるDingTalk A1を発表しました。この薄さ3.8mmの機器は、ユーザーが明確に音声を録音し、高精度の文字起こしサービスを提供します。また、36種類の作業および生活用エージェントテンプレートが内蔵されており、会議記録や業務まとめの効率を向上させています。

image.png

【AiBaseの要約:】

🔋 DingTalk A1は厚さわずか3.8mmのAIハードウェアで、携帯に便利。

🎙️ 8メートル以内の明瞭な収音が可能で、10,000分の無料文字起こしサービスを提供し、精度は97%。

🤖 内蔵の36種類の作業および生活用エージェントテンプレートにより、効率を向上。

5. アップルのSiriにグーグルのGemini大規模モデルが搭載される見込み、AI能力を強化

アップル社はグーグルと協力することを検討しており、2026年にリリース予定のSiriアップグレード版にカスタム版のGemini大規模モデルを導入する予定です。これにより、音声アシスタントのAI能力を向上させ、ユーザーによりスマートで効率的なインタラクティブ体験を提供しようとします。この動きは、アップルがAI分野で直面している競争圧力を反映しており、Siriの機能不足を補うためにグーグルとの協力を通じて、ユーザーにさらに優れたサービスを提供しようとしています。

image.png

【AiBaseの要約:】

🍎 アップルはグーグルと協力し、SiriにGemini大規模モデルを導入する予定。

🤖 より強力なAI能力を備え、ユーザーのインタラクティブ体験を強化。

📈 この協力はAIアシスタント市場の構図に深く影響を与える可能性がある。

6. アップルがSlowFast-LLaVAモデルの適合版をリリース:長動画の理解性能が大規模モデルを上回る

アップル研究チームがリリースしたSlowFast-LLaVAモデルの適合版は、長動画分析タスクにおいて優れた性能を発揮し、パラメータ数が多いモデルよりも性能が良い場合があります。このモデルは二流構造を採用し、従来のフレームごとの処理方式における情報の冗長性や文脈窓の溢れ問題を効果的に解決し、長動画コンテンツの分析に対して効率的な新しい解決策を提供します。

image.png

【AiBaseの要約:】

🍎 核心的な利点は二流構造で、動画処理効率を最適化。

📈 LongVideoBenchベンチマークテストで優れた成績を収め、10億パラメータバージョンで56.6点を獲得。

🔧 公開データセットで訓練され、オープンソース化されており、AIコミュニティに新たなアイデアを提供。

7. メタがMidjourneyのライセンスを獲得!ザッカーバーグのAI軍備競争がさらに一歩前進

メタはMidjourneyと技術ライセンス契約を締結し、AI画像生成分野での競争力をさらに強化しました。今回の提携は、メタがAI分野で展開する重要な一歩であり、現在のAI業界における激しい競争を反映しています。

image.png

【AiBaseの要約:】

🔥 メタがMidjourneyと技術ライセンス契約を締結し、AI画像生成能力を強化。

💡 ザッカーバーグは高額給与と投資戦略を通じて、AI人材とリソースの獲得を加速。

⚖️ Midjourneyは法的課題に直面していますが、依然として独立運営を維持。

8. グーグルDriveの動画編集が大幅アップデート!Vids AIツールが一発アクセス、動画制作の門檻がさらに低下

グーグルはGoogle DriveにVids動画編集の高速ボタンを追加し、ユーザーがより簡単に動画編集を行うことができるようになりました。この機能は操作フローを簡素化し、動画制作の門檻を下げ、Workspaceユーザーの体験を向上させました。

image.png

【AiBaseの要約:】

🚀 グーグルはGoogle DriveにVids動画編集の高速ボタンを追加し、動画処理効率を向上。

💡 VidsはAI駆動の機能を備えており、自動脚本作成やスマートなスニペットの再構成など、動画制作を簡素化。

🌐 グーグルは日常業務にAIツールを統合し、生産性ツールの革新を推進。

9. 夸克が健康大規模モデルの技術報告書を公開、AI「主任医師」の技術細節を明らかに

誇克の健康大規模モデルは中国の12科目の主任医師試験に合格し、国内で最初にこの挑戦を達成した大規模モデルとなりました。このモデルは複雑な医学推論タスクにおいて優れた性能を発揮し、高品質な医療データと強化学習技術を用いて性能を向上させました。

image.png

【AiBaseの要約:】

✨ 誇克の健康大規模モデルは主任医師試験に合格し、高い専門能力を示す。

🧠 三つの医療データで訓練され、モデルの正確性と推論能力を向上。

🚀 強化学習段階を導入し、モデル出力の質とコンプライアンスを最適化。

詳細リンク: https://arxiv.org/pdf/2508.11894 https://github.com/Quark-Medical/QuarkMed/blob/main/report/QuarkMed_Technical_Report.pdf

10. 全世界で魚を描くブームが起きた!百万人のネットユーザーがこのAIゲームに夢中になり、シンプルな絵が生きている魚に変わる

記事では、Draw A FishというAIゲームが極めてシンプルなデザインとソーシャルインタラクティブメカニズムによって、世界中で爆発的な人気を博した理由について考察しています。このゲームはAI技術と人間の創造力の融合の魅力を示しています。

image.png

【AiBaseの要約:】

🐟 AI技術を活用して、単純なスケッチから動的な仮想の小魚に変換し、独自の創作体験を提供。

🎮 操作が簡単で、登録不要で参加できるため、多くのユーザーを引きつけ、没頭させている。

🌐 ソーシャルインタラクティブメカニズムが全世界のプレイヤーの創作熱を刺激し、クリエイティブな展示空間を形成。