【AI日報】へようこそ!ここは、人工知能の世界を探求する皆様のための毎日ガイドです。毎日、AI分野のホットな話題、開発者への注目情報、技術トレンドの洞察、革新的なAI製品の応用情報を皆様にお届けします。

最新のAI製品はこちらで確認できます:https://top.aibase.com/

1、李彦宏氏:百度、来年初に文心Ernieモデルの新バージョンをリリース予定

百度は最新の決算報告書で、基礎モデル分野におけるリーダーシップを強化するため、来年初めに文心Ernieモデルの新バージョンをリリースする計画であることを明らかにしました。李彦宏氏は、モデルの開発は実際の市場ニーズを満たす必要があり、ビジョン基礎モデルを自動運転分野に応用すると強調しました。百度は、モデルの「幻覚」を減らし、正確性を高め、モデルの応用価値を高めることに取り組んでいます。

【AiBase要約:】

📉 百度の第3四半期の総売上高は336億元で、前年同期比3%減。

🚀 李彦宏氏は、来年初めに文心Ernieモデルの新バージョンをリリースし、基礎モデルの能力をさらに向上させる計画を発表。

🤝 百度は、市場のニーズを満たし、推論コストを削減することを目指して、アプリケーション指向のモデル開発に取り組んでいます。

2、Sogou入力法がアップデート!全く新しいAI検索体験を提供、入力するだけで検索

Sogou入力法12.0バージョンでは、テンセントのHunYuan大規模モデルとの連携により、入力と同時に検索できるAI検索機能を実現するなど、多くの新機能が導入されました。ユーザーの検索効率を向上させます。さらに、AIクイック検索、AIコンパニオン、マジックジェスチャーなどの機能も追加され、入力法のインタラクティブ性と利便性が向上しました。

image.png

【AiBase要約:】

🌟 新バージョンのSogou入力法では、AI検索とAIクイック検索機能が導入され、「入力するだけで検索」が可能になりました。

💡 ユーザーはキーワードを入力するだけで、迅速に情報を入手でき、学習や仕事の効率が向上します。

🌍 AIクイック検索機能は40以上の生活シーンをカバーし、ユーザーの日常的な検索ニーズを完全に無料で満たします。

3、OpenAI、独自ブラウザのリリースを計画、Googleの覇権に挑戦

OpenAIは、AIチャットボットをベースとした独自ブラウザをリリースすることで、Googleの検索市場に正面から挑戦する計画です。この動きは、OpenAIの検索分野における野心を示すとともに、エコシステムの拡大に向けた重要な一歩でもあります。

【AiBase要約:】

🤖 OpenAIは複数のプラットフォームと連携し、旅行、飲食、不動産、小売など様々な分野でAI駆動の検索サービスを提供する計画です。

📱 OpenAIはSamsungデバイスへのAI機能提供も検討しており、ハードウェア分野における影響力の拡大を目指しています。

📰 OpenAIは多くのニュース出版社と提携し、コンテンツリソースを強化することで、検索市場における競争力を高めています。

4、ライティング能力が大幅向上!OpenAI、GPT-4oを大幅アップデート、最高のAIモデルの座を奪還

OpenAIは、主力モデルGPT-4oを大幅にアップデートし、推論能力、クロスメディア能力、対話能力を向上させたと発表しました。「Chatbot Arena」評価プラットフォームで最高の成績を収め、他の競合モデルを凌駕しました。ユーザーはChatGPT Plusのサブスクリプションで、より高品質なサービスを利用できます。

image.png

【AiBase要約:】

🌟 最新のアップデートでGPT-4oは推論能力、クロスメディア能力、対話能力が向上し、より強力なAIモデルになりました。

🏆 「Chatbot Arena」評価プラットフォームでは、他のモデルとの比較でGPT-4oが1位を獲得しました。

💼 ChatGPT Plusユーザーは、無制限アクセスや追加機能など、より高品質な利用体験を楽しむことができます。

5、Googleの新Gemini試験版がAI競技のトップに返り咲き、GPT-4oは1日だけの王者に

最近、GoogleとOpenAIの競争が激化しています。Googleが新たに発表したGemini-Exp-1121モデルは、複数の分野で優れた性能を示し、OpenAIのGPT-4oを迅速に凌駕し、AI競技のトップに返り咲きました。同時に、OpenAIも新機能の開発を進めており、将来的にはAIとのコミュニケーション方法を変える可能性があります。

image.png

【AiBase要約:】

📈 Googleの新モデルGemini-Exp-1121は、GPT-4oがトップに立った後、迅速にそれを上回り、AI競技のトップに返り咲きました。

🔍 Gemini-Exp-1121は、コード、推論、画像認識能力において向上しており、優れた性能を示しています。

🎥 OpenAIは「リアルタイムカメラ」機能を開発中で、将来的にはAIとのコミュニケーション方法を変える可能性があります。

6、ブラックフォレストラボ、新しいFLUX.1Toolsツールキットを発表 初心者でも画像編集のプロに

ブラックフォレストラボは、FLUX.1モデルの制御性と操作性を向上させ、ユーザーが画像を正確に修正できるようにするFLUX.1Toolsツールキットを発表しました。このツールキットには、FLUX.1Fill、FLUX.1Depth、FLUX.1Canny、FLUX.1Reduxが含まれており、それぞれ画像修復、深度変更、エッジ検出、画像バリエーション生成などの機能を提供します。このツールキットはオープンソース版とAPI版があり、複数の提携企業と協力してリリースされています。

【AiBase要約:】

🛠️ FLUX.1Fillは、高度な画像修復ツールであり、既存のソリューションを凌駕し、テキストの説明とマスクに基づいてシームレスな編集をサポートします。

🌌 FLUX.1DepthとFLUX.1Cannyは、構造情報を使用して画像生成をガイドし、元の構造を維持しながら、より高い出力の多様性と一貫性を提供します。

🎨 FLUX.1Reduxは、画像バリエーションの生成に使用され、テキストの説明に基づいてスタイルを再設計でき、FLUX1.1[pro] Ultraモデルに統合されています。

詳細はこちら:https://huggingface.co/black-forest-labs/FLUX.1-Redux-dev

7、次世代ビジュアル追跡モデルSAMURAI:複雑なシーンでも主体を追跡可能に

SAMURAIモデルの登場は、特に複雑なシーンにおける応用において、ビジュアル追跡技術の大きな進歩を示しています。運動知覚メカニズムの導入により、SAMURAIは追跡の精度を向上させるだけでなく、ゼロショット条件下での強力な性能も示しています。この革新は、将来のスマートデバイスにより強力なビジュアル認識能力を提供し、ビジュアル追跡分野の発展を促進します。

image.png

【AiBase要約:】

🔍 SAMURAIはSAM2モデルの革新的な改良版であり、複雑なシーンにおけるビジュアルオブジェクトの追跡能力の向上を目指しています。

⚙️ 運動知覚メモリメカニズムの導入により、SAMURAIは物体の動きを正確に予測し、マスクの選択を最適化することで、誤差の伝播を防ぎます。

📈 複数のベンチマークデータセットにおいて、SAMURAIは強力なゼロショット性能を示し、追跡の成功率と精度を大幅に向上させています。

詳細はこちら:https://yangchris11.github.io/samurai/

8、アップル、より対話的なSiri音声アシスタントを開発中 2026年発売予定

アップルは、より自然な会話体験を提供するために、高度な大規模言語モデル技術を採用した全く新しいSiri音声アシスタントを開発中で、2026年春に発売する予定です。アップルは、この革新を通じてユーザーのインタラクション体験を向上させ、音声アシスタントへの増大する期待に応えたいと考えています。

【AiBase要約:】

🌟 アップルは、2026年春に発売予定の全く新しいSiri音声アシスタントを開発中です。

🤖 新しいSiriは、大規模言語モデル技術を採用し、より自然な会話体験を実現します。

🔗 新バージョンのリリースまでは、OpenAIのChatGPTなど、サードパーティのAI機能に依存します。

9、2025年までにデータ品質がAI成功の鍵となる

人工知能技術の急速な発展に伴い、データ品質とガバナンスの重要性がますます高まっています。専門家は、企業は今後、高品質でリアルタイムなデータに重点を置くことで、AIの成功を促進する必要があると指摘しています。オープンソースプラットフォームの利用は、データのシームレスな統合を促進し、AIのイノベーション能力を確保します。

【AiBase要約:】

🌟 データ品質とガバナンスがAIの成功を左右し、生成技術ではありません。

📈 2025年、独自のビジネスデータがAIの効率性と競争力の向上を促進する中心となります。

🔄 オープンソースプラットフォームと関連のないシステムが、AIのイノベーションとデータのシームレスな統合を促進します。

10、画期的な進歩!YouTube ShortsにAIビデオ背景生成機能が登場

YouTubeは、Shorts機能にDream Screenを導入し、Google DeepMindのVeoモデルを統合することで、AIによる1080pビデオ背景生成をサポートしました。クリエイターはシーンの説明を入力すると、システムが複数の動的な背景を選択できるように生成します。

image.png

【AiBase要約:】

🌟 Google DeepMindのVeoモデルを統合することで、YouTube Shortsは1080p AIビデオ背景生成をサポートし、制作品質が向上しました。

🎨 クリエイターはシーンを簡単に説明するだけで、システムが様々な動的な背景を生成し、短編動画の制作をよりクリエイティブなものにします。

🚀 この機能は現在、多くの国で利用可能であり、YouTubeの短編動画分野における技術的優位性を示し、世界中のクリエイターをさらに惹きつけています。

11、Samsung、新しいGauss2AIモデルを発表 次のGalaxyブレインになる可能性も

Samsungは開発者会議でGauss 2 AIモデルを発表しました。性能と効率が向上し、スマートフォンや家電などのデバイスに適しています。Gauss 2はマルチモーダル機能を備え、画像、テキスト、コードの処理をサポートし、前世代モデルよりも1.5〜3倍高速で動作し、様々なニーズに対応する3つのバージョンを提供します。

【AiBase要約:】

🚀 Gauss2は性能と効率が大幅に向上し、マルチモーダル処理をサポートし、様々なスマートデバイスに適しています。

📱 3つのバージョン(Compact、Balanced、Supreme)が様々な使用シーンに対応し、ユーザーエクスペリエンスを向上させます。

🌍 前世代モデルより1.5〜3倍高速で動作し、最大14言語をサポートし、デバイスのインテリジェンス化を促進します。

12. 大幅アップデート!Brave検索がAI対話機能を搭載、検索エンジンの新体験を提供

Brave検索エンジンは最近、AI対話機能を搭載し、「Answer with AI」機能の連続質問能力を強化することで、ユーザーが検索テーマについて深く掘り下げて議論できるようにしました。この機能は情報を提供する一方で、ユーザーのプライバシーを保護し、検索履歴を保存しません。Braveは、検索エンジンとAIチャットボットの長所を組み合わせることで、検索体験の一貫性と深さを向上させています。

image.png

【AiBase要約:】

✨ 新しい会話モードにより、ユーザーは最初の検索後に質問を続けることができます。

🔍 Braveはユーザーのプライバシー保護を約束し、検索履歴を保存しません。

🤖 この機能は、従来の検索とAIチャットの長所を組み合わせ、検索効率を向上させています。