AIデイリーニュース：Google Geminiが5つの新機能を発表；Baiduが文言AIデジタルヒューマンソーシャルアプリをリリース；OpenAIのストロベリー計画の詳細；AmazonがRufus AIショッピングアシスタントをローンチ

【AI日報】へようこそ！ここは、あなたの人工知能の世界を探求するための毎日のガイドです。毎日、AI分野のホットなトピックを紹介し、開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品の応用に関する情報を提供します。

最新のAI製品詳細はこちら：https://top.aibase.com/

1、Google Geminiが5つの新機能を発表：Imagen3、カスタムGPTなど

Googleはまもなく、Imagen3やGeminiカスタムGPTなど、Gemini製品シリーズの新機能をリリースする予定です。これらの新機能は、ユーザーによりパーソナライズされ、便利な体験を提供し、Googleの人工知能分野における継続的な革新と発展を示しています。

【AiBase要約:】
🔍 Google Geminiは、Imagen3、GeminiカスタムGPTなど、ユーザーによりパーソナライズされ、便利な体験を提供する新機能を発表予定です。
🔍 Geminiは、パーソナライズされたレスポンス、予約プロンプト、録音、Googleフォトとの統合などの機能も追加され、ユーザー体験がさらに豊かになる予定です。
🔍 Googleは、GeminiのiOS版ベータテスターの募集を強化しており、iOSアップデートが間近に迫っていることを示唆しています。

2、百度がAIデジタルヒューマンソーシャルアプリ「文小言」を発表

百度は最近、「文小言」というAIデジタルヒューマンソーシャルアプリを発表しました。高度な文心大模型技術を利用し、ユーザーはリアルなデジタルヒューマンとリアルタイムでコミュニケーションやインタラクションを行い、感情的なつながりを築き、よりリアルで自然なインタラクション体験を実現できます。アプリでは、好きなデジタルヒューマンのチャット相手を見つけ、その情報を確認し、様々な方法でインタラクションできます。

【AiBase要約:】
🤖 ユーザーはAI仮想キャラクターとリアルタイムでコミュニケーションやインタラクションを行い、感情的なつながりを築き、インタラクション体験を向上させることができます。
📱 各AIデジタルヒューマンは独自のチャットサービスを提供し、ユーザーの百科事典、生活アシスタント、さらにはメンターとしての役割を果たすことができます。
💬 デジタルヒューマンは、音声とテキストで返信し、ボディランゲージでリアリティを高めます。

3、OpenAIの「イチゴ計画」解明：Q*推論能力が大幅に向上、未来はもうすぐ！

OpenAIの「イチゴ計画」に興奮と好奇心を抱いています。このプロジェクトは、イチゴを名乗り、AIがタスクを事前に計画し、自主的にインターネットで情報を収集し、さらには深い調査を行うことができるようになるというものです。イチゴモデルの設計理念は非常に革新的で、AIに前例のない推論能力を与えます。OpenAIの秘密裏に進められた開発と高度な機密性により、将来の成果への期待が高まっています。

【AiBase要約:】
🍓 イチゴ計画により、AIはタスクを事前に計画し、自主的にインターネットで情報を収集し、深い調査を行うことができます。
🔍 STaR技術は、少数の推論例と大量の非推論データを使用することで、AIの自己改善を可能にします。
🚀 OpenAIは、イチゴが長時間タスクを実行し、AIモデルの推論能力を高めることを期待しています。
論文アドレス:https://arxiv.org/pdf/2203.14465

4、Magic Insert：ワンクリックで人物を新しい背景に完璧に融合

デジタル創作の魔法の世界では、Magic Insert技術の魅力は、主題を一枚の画像から別の全く異なるスタイルの背景画像に簡単にドラッグアンドドロップして、完璧に融合させることができる点にあります。この技術は、スタイル認識パーソナライゼーションとオブジェクト挿入を組み合わせ、柔軟性と多様性を示し、画像生成分野に新たな課題をもたらします。

【AiBase要約:】
🔮 Magic Insert技術は、スタイル認識パーソナライゼーションとオブジェクト挿入を組み合わせ、異なる背景での主題の完璧な融合を実現します。
🌟 技術のハイライトには、LoRAとテキストマーキングによるモデルの微調整、ブートストラップドドメイン適応技術によるリアルオブジェクトの挿入、スタイル化の程度と主題の詳細の忠実度の柔軟な選択が含まれます。
💡 研究者たちは、Magic Insertを様々なスタイルの主題と背景で実験し、その有効性とユーザーの嗜好性を証明しました。
詳細リンク:https://magicinsert.github.io/demo.html

5、快看漫画：二次元分野に特化した垂直大規模モデルのトレーニング中

快看漫画は、オープンソースの大規模モデルを微調整し、二次元分野に特化した垂直大規模モデルをトレーニングすることに取り組んでおり、作品検索のコンバージョン率と活性を向上させ、漫画業界の革新的な発展を促進しています。大規模言語モデル（LLM）と検索強化生成技術（RAG）を適用することで、内部ナレッジベースを構築し、微調整された大規模モデル+RAG強化戦略を採用することで、検索応答速度とランキング指標を向上させています。

【AiBase要約:】
🔍 大規模モデルを微調整し、作品検索のコンバージョン率と活性を向上させる
🤖 大規模言語モデル（LLM）と検索強化生成技術（RAG）を適用し、内部ナレッジベースを構築する
🎨 漫画業界の革新的な発展を促進し、ユーザーエクスペリエンスとコンテンツ生産性を向上させる

6、パーソナライズされたサービスが向上！Amazonが密かにRufus AIショッピングアシスタントをリリース

Amazonが新しくリリースしたRufus AIショッピングアシスタントは、ユーザーにパーソナライズされたショッピング体験を提供し、スマートなQ＆Aサービスを通じて、ユーザーの時間節約と賢明な選択を支援し、優れたショッピング問題解決能力を示しています。

【AiBase要約:】
🛒 Rufus AIショッピングアシスタントがリリースされ、パーソナライズされたショッピング体験とユーザーの時間節約を提供します。
🤖 スマートなQ＆Aサービスにより、製品に関する様々な質問（推奨、比較、注文追跡など）に詳細に回答します。
🌟 RufusはAmazonのスマートショッピング分野におけるエースとなり、小売業界の革新をリードする可能性を秘めています。

7、Google Eureka AIモデルが早期公開、優れたテキストライティング能力が注目を集める

Googleはまもなく、「Eureka」という新しいAIモデルを発表する予定です。Eurekaは自然言語生成において優れたパフォーマンスを示しており、GoogleのAI分野における大きなブレークスルーと見なされています。7月15日に最初の発表、7月18日に正式発表される予定です。Eurekaに加えて、GoogleはGoogle Geminiなどの他の新しいツールも開発しており、業界の大きな関心を集めています。

【AiBase要約:】
✨ Eurekaモデルは自然言語生成において優れたパフォーマンスを示し、他のモデルを凌駕しています。
🔑 Eurekaは、改善された指示遵守能力を示し、ユーザー定義のパラメータに異常なほど従順です。
💡 Eurekaは、幅広いAI駆動タスクにおいてパフォーマンス向上への可能性を秘めています。

8、3Dビジュアル再構築技術DUSt3R：2D画像から簡単に3Dモデルを生成

DUSt3Rは、カメラ情報なしで3Dモデルを作成できる革新的な技術であり、2D画像から3Dモデルへの変換プロセスを大幅に簡素化します。スマートな処理方法を採用し、効率的な再構築タスク処理を提供し、優れたパフォーマンスを発揮し、様々なビジュアルタスクで最高の結果を達成しています。

【AiBase要約:】
🌟 革新的な技術：DUSt3Rは、カメラ情報なしで3Dモデルを作成でき、複雑なカメラパラメータの必要性を簡素化します。
📷 高効率処理：DUSt3Rは複数の画像の再構築タスクを統一的に処理し、スマートで効率的です。
🚀 優れたパフォーマンス：DUSt3Rは様々なビジュアルタスクで優れたパフォーマンスを発揮し、最高の結果を達成しています。
詳細リンク:https://top.aibase.com/tool/dust3r

9、OpenDiLoCo：分散型AIトレーニングのオープンソースソリューション、低通信コスト、グローバルカバレッジ！

AIブームの時代において、OpenDiLoCoオープンソースフレームワークはDiLoCoトレーニング方法を実現し、低通信コストでグローバルな分散型トレーニングを実現し、高い計算利用率を維持しています。

【AiBase要約:】
🌐 グローバル分散型トレーニング：OpenDiLoCoは、2大陸3ヶ国にわたるグローバルなモデルトレーニングを実現し、高い計算利用率を維持しています。
⚙️ 動的リソース管理：トレーニング中に計算リソースを動的に調整でき、新しいデバイスをいつでもトレーニングに追加または削除できます。
🔗 フォールトトレランスとピアツーピア通信：Hivemindライブラリを使用してフォールトトレラントトレーニングを実現し、ピアツーピア通信方式でトレーニングを行い、効率と安定性を向上させます。
詳細リンク:https://arxiv.org/pdf/2407.07852

10、MicrosoftとMITが推論の新時代を開拓：6700万パラメータモデルがGPT-4と競合

この論文では、研究者たちは画期的な機械学習トレーニング戦略を紹介しています。論理推論能力の向上と因果関係を利用したトレーニングセットの構築により、GPT-4に匹敵する小型Transformerモデルのトレーニングに成功しました。この研究は、AIが因果推論を学習するための新たな可能性を開き、AIが世界をより良く理解し、説明することを可能にします。

【AiBase要約:】
🔍 独自のトレーニング方法：革新的なトレーニング方法を採用し、大規模モデルの論理推論能力を向上させる。
🧠 論理推論の改善：モデルの論理推論能力を大幅に向上させ、以前の課題を解決する。
🔗 因果関係を利用したトレーニングセットの構築：因果関係モデルを利用してトレーニングデータセットを構築し、モデルがデータの背後にある因果関係を理解するのに役立てる。
詳細リンク:https://arxiv.org/pdf/2407.07612v1

11、米国の金融規制当局がOpenAIの秘密保持契約の問題を調査するよう要請

この記事では、告発者がOpenAI社の秘密保持契約に問題があると暴露し、米国の金融規制当局に調査を求めていることを報じています。告発者は、OpenAIが従業員の告発権を制限している可能性があると主張し、公衆の懸念を引き起こしています。グラスリー議員は、OpenAIのポリシーが告発者の権利を制限していると述べ、SECによる不正行為の調査を呼びかけています。

【AiBase要約:】
⭐️ 告発者がOpenAI社の秘密保持契約の問題を暴露し、SECによる調査を求める
⭐️ OpenAIはSECの規定に違反し、従業員の告発権を剥奪しているとされる
⭐️ 告発状によると、OpenAIはすべての秘密保持契約を作成し、従業員の権利侵害を避けるよう求められており、告発者はSECによるOpenAIの不正行為の調査を求めている