【AI日報】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、AI分野のホットな話題をお届けし、開発者に焦点を当て、技術トレンドの把握や革新的なAI製品の応用に関する理解を深めるお手伝いをします。

最新のAI製品詳細はこちらhttps://top.aibase.com/

1.元百度幹部景鲲氏、AI検索スタートアップ「MainFunc」設立、評価額18億円、初製品「Genspark」発表

元百度幹部の景鲲氏が設立した新会社MainFuncは、AI技術を用いた高品質な検索体験を提供することを目指す初製品「Genspark」を発表しました。同社はシードラウンドで6000万ドルの資金調達を行い、評価額は2億6000万ドルに達し、大きな市場可能性を示しています。卓越した経歴を持つ景鲲氏がAI検索分野を再びリードしており、今後の更なるイノベーションに期待が高まります。

image.png

【AiBase要約:】

🚀 MainFuncは景鲲氏と元小度CTO朱凱華氏によって設立されたAIイノベーション製品会社で、AIエージェント検索製品「Genspark」を発表しました。

💰 シードラウンドで6000万ドルの資金調達を行い、評価額は2億6000万ドルに達し、市場可能性は巨大です。

🔍 GensparkはAIエージェントエンジンとして位置付けられ、検索サービスに特化。AI技術を用いて「Sparkpages」と呼ばれるカスタマイズされたページを生成し、ユーザーの時間を節約し、信頼できる情報を提供します。

公式ウェブサイト:https://mainfunc.ai/

検索製品入口:https://top.aibase.com/tool/sparkpage

2.Kimiオープンソースプラットフォーム、コンテキストキャッシング(Context Caching)機能のクローズドベータテスト開始

Kimiオープンソースプラットフォームは、近日中に待望のコンテキストキャッシング機能のクローズドベータテストを開始すると発表しました。この革新的な機能は、長文の大規模言語モデルをサポートし、効率的なコンテキストキャッシングメカニズムを通じて、かつてないユーザー体験を提供します。コンテキストキャッシングは、重複するトークンの内容をキャッシュすることで、同じ内容をリクエストする際のユーザーのコストを大幅に削減する最先端技術です。

微信截图_20240620091624.png

【AiBase要約:】

🔑 コンテキストキャッシング機能は長文の大規模言語モデルをサポートし、効率的なコンテキストキャッシングメカニズムを通じてかつてないユーザー体験を提供します。

🚀 コンテキストキャッシングは、既に処理済みのテキストセグメントをインテリジェントに識別して保存することで、APIインターフェースの応答速度を大幅に向上させます。

💡 規模が大きく、重複度が高いプロンプトシナリオに適しており、既にキャッシュされたコンテンツを再利用することで、処理効率を向上させ、コストを削減します。

3.TikTok、AI統合ツール「Symphony」を発表 脚本作成、動画編集、デジタルアバターまで網羅

TikTokが発表したAIコンテンツツールスイート「Symphony」は、コンテンツ作成と共有の方法を根本的に変え、誰もがクリエイティブな才能を発揮できるようにします。「Symphony Assistant」は、トレンドの発見、クリエイティブなガイダンスの提供、インスピレーションの喚起、脚本の作成、最適化の提案など、細やかなサポートを提供します。「Symphony Creative Studio」は60秒以内に様々なTikTok動画プレビューを生成し、多言語翻訳と動画編集をサポートします。「Symphony Digital Avatars」は、ブランドがクリエイティブ戦略を拡大するのに役立ち、リアルな人物のアバターを提供します。

【AiBase要約:】

🚀 Symphony Assistantは、トレンドの発見から脚本の作成まで、創作プロセス全体をサポートし、よりシンプルで効率的なものにします。

💡 Symphony Creative Studioは、多様なTikTok動画プレビューを迅速に生成し、多言語翻訳と動画編集機能により、コンテンツの魅力を高めます。

👤 Symphony Digital Avatarsは、生成AIを用いてリアルな人物のアバターを作成し、ブランドのグローバルなクリエイティブ戦略の拡大を支援します。

詳細リンク:https://www.tiktok.com/business/en-US/blog/tiktok-symphony-ai-creative-suite

4.百度文库、AI製品「橙篇」が10万字の長文生成に対応

百度文库が新たに発表したAI製品「橙篇」は、長文生成とマルチモーダル編集において大きな進歩を遂げ、ユーザーに包括的な創作と編集機能を提供します。強力なAI技術を基盤とするこの製品により、ユーザーは専門的な学術リソースに容易にアクセスし、超長文の図表入りコンテンツを作成し、ワンストップでマルチフォーマットの編集と調整を行うことができます。

image.png

【AiBase要約:】

🚀 「橙篇」は10万字の長文生成とマルチモーダル編集機能をサポートし、ユーザーの専門分野における全工程のニーズを満たします。

💡 学術リソースへのアクセス障壁を取り払い、ユーザーは世界の専門的な学術サイトの資料や文献資料に容易にアクセスできます。

✨ 超長文の図表入りコンテンツの理解と生成をサポートし、様々なフォーマットのファイルを一度にアップロードして、迅速な要約、Q&A、創作を実現します。

詳細リンク:https://top.aibase.com/tool/chengpianai

5.初のAI高考評価結果発表 GPT-4oが2位を獲得

このユニークなAI高考評価では、複数のAIモデルが国語、数学、英語の総合的な能力テストを受け、学術分野における可能性と限界を示しました。国語と英語では良好な成績でしたが、数学的推論能力については向上させる余地があります。技術の進歩に伴い、AIはより賢くなり、人類社会により良い貢献をするでしょう。

【AiBase要約:】

🧠 AIモデルが総合的な能力テストを受け、学術的な可能性と限界を示しました。

📚 国語と英語では良好な成績でしたが、数学的推論能力については向上させる余地があります。

🚀 技術の進歩により、AIはより賢くなり、人類社会により良い貢献をするでしょう。

6.Flash Diffusion、あらゆる拡散モデルに対応、数ステップで画像生成を実現

Flash Diffusion手法は、画像生成技術に革命的なブレークスルーをもたらし、事前学習済み拡散モデルの生成プロセスを高速化し、優れた性能と多様な才能を示しています。研究者たちは、調整可能な分布と敵対的目標などの革新的な手法を採用し、予測モデルの位置特定と計算効率を向上させました。この手法は様々なバックボーンネットワークに対応し、サンプリングステップを大幅に削減しながら、高品質な生成を維持します。Flash Diffusionは新たな活力を注入し、画像生成の効率と多機能性を向上させ、様々な分野に大きな影響を与える可能性を秘めています。

image.png

【AiBase要約:】

⚡ 事前学習済み拡散モデルの生成プロセスを高速化し、優れた性能と多様な才能を示しています。

🔍 調整可能な分布と敵対的目標などの革新的な手法を採用し、予測モデルの位置特定と計算効率を向上させました。

🌟 様々なバックボーンネットワークに対応し、サンプリングステップを大幅に削減しながら、高品質な生成を維持します。

詳細リンク:https://top.aibase.com/tool/flash-diffusion

7.AIによる画像生成が「オーダーメイド」に!華為と清華大学が共同でパーソナライズされた生成技術PMGを発表

パーソナライズが重視される時代において、華為と清華大学は共同で、PMGと呼ばれるパーソナライズされた生成技術を発表しました。この技術は、ユーザーの過去の行動や好みを利用して、ユーザーのニーズに合ったマルチモーダルコンテンツ(例:絵文字、Tシャツのデザイン図、映画ポスターなど)を生成します。実験により、PMG技術は大きな可能性と商業的価値を示しており、ユーザーにより豊かでパーソナライズされた体験を提供します。

image.png

【AiBase要約:】

⚙️ PMG技術はユーザーの過去の行動や好みを利用して、パーソナライズされたマルチモーダルコンテンツを生成します。

💡 PMGはキーワード生成と潜在ベクトル生成によってユーザーの好みを抽出し、マルチモーダルコンテンツの生成を実現します。

📈 PMG技術は、ECサイトの衣料品画像生成、映画ポスター作成、絵文字生成などの応用事例で有効性を検証されており、優れた生成効果を示しています。

詳細リンク:https://github.com/mindspore-lab/models/tree/master/research/huawei-noah/PMG

8.Gboardがタイピング体験を一新 Google、大規模言語モデルでワンクリックで全ての誤りを修正

GboardはGoogleがモバイルデバイス向けに開発したスマートキーボードで、新しく導入された「校正」機能は、大規模言語モデルを利用してワンクリックで文章全体と段落全体の誤りを修正し、従来の1文字ずつ修正する体験を根本的に変えました。この機能はPixel 8デバイスで既に提供されており、多くのユーザーがその恩恵を受けています。研究チームは複雑なエラー合成フレームワークを用いて模擬データセットを生成し、教師あり学習と強化学習技術を組み合わせることでモデルの性能を最適化し、大規模言語モデルがモバイルデバイスの入力インタラクション体験を向上させる可能性を示しました。

【AiBase要約:】

🔍 大規模言語モデルを利用してワンクリックで文章全体と段落全体の誤りを修正し、従来の1文字ずつ修正する体験を一新しました。

🚀 複雑なエラー合成フレームワークを用いて模擬データセットを生成し、教師あり学習と強化学習技術を組み合わせることでモデルの性能を最適化しました。

💡 クラウド上のTPU V5に配置され、遅延の最適化などを通じてユーザーの入力効率を向上させています。

詳細リンク:https://arxiv.org/abs/2406.04523

9.ConfyuiでNVIDIAのLumina-T2X画像生成モデルを使用可能に

NVIDIAのLumina-T2X画像生成モデルは、Confyuiで使用できるようになりました。オープンソースモデルとして、その美的表現と画像品質は業界をリードするMJ V6とほぼ同等であり、この成果はオープンソース分野において特に貴重です。

image.png

【AiBase要約:】

🌟 Lumina-T2Xは統一的なDiTアーキテクチャを採用しており、様々なメディアコンテンツを生成でき、AIによるコンテンツ作成分野の応用範囲を拡大します。

💡 Lumina-T2I画像生成モデルは、生成品質の向上とトレーニングコストの削減を実現し、AI技術の経済的可能性を示しています。

🔑 Lumina-T2Iの成功の鍵は、モデルのバックボーンにLarge-DiT、テキストエンコーディングモデルにLlama2-7B、VAEにSDXLを採用していることで、高品質な画像生成の基礎を築いています。

興味のある方は、Confyuiでこのプラグインを試してみてください::https://github.com/kijai/ComfyUI-LuminaWrapper

10.OpenAIのキーパーソンIlya氏、新たなAI企業SSIを設立 安全なスーパーインテリジェンスを目指す

Ilya Sutskever氏はOpenAIを退職後、Safe Superintelligence Inc.を設立し、超知能AIシステムの安全性に関する問題解決に注力しています。同社は、人間の知能を超えるAIを制御し、制限するための研究を行い、工学と科学のブレークスルーを通じて安全性の課題を解決することを計画しています。SSIは設立当初から営利企業であり、短期的なビジネス上の圧力を受けずに、現在技術人材の採用を進めています。

【AiBase要約:】

🔒 SSIは超知能AIシステムの安全性に関する問題解決に注力し、人間の知能を超えるAIを制御し、制限するための研究を行っています。

🚀 SSIは工学と科学のブレークスルーを通じてAIの安全性の課題を解決し、AIの能力と安全性を向上させることを計画しています。

💼 SSIは営利企業であり、短期的なビジネス上の圧力を受けずに、現在技術人材の採用を進めています。

11.GPT-4がチューリングテストに合格 半数以上の人がGPT-4と人間を区別できない

人工知能分野における重要なマイルストーンの一つであるチューリングテストにおいて、最近の試験でGPT-4は、インタラクティブな2人参加型のチューリングテストにおいて、人間と間違われる確率が54%に達することが示され、AIシステムのリアルなパフォーマンスに対する関心を高めています。参加者は、相手の言語スタイルと社会感情的な要素を使って人間かどうかを判断する傾向があり、機械知能に関する議論に大きな影響を与えています。

【AiBase要約:】

🤖 GPT-4はチューリングテストにおいて、人間と間違われる確率が54%に達し、リアルなパフォーマンスを示しました。

🔍 参加者は、相手の言語スタイルと社会感情的な要素を使って人間かどうかを判断する傾向がありました。

💡 この結果は、AIシステムが現実世界で人間を欺く可能性を示唆しており、新たな倫理、プライバシー、セキュリティ上の課題を提起しています。

12.AIデザインツールKittl:テキストプロンプトを入力するだけでアイコンやクリップアートなどを生成

KittlはAI駆動のデザインプラットフォームで、高度なアルゴリズムと機械学習を利用して、ユーザーは簡単なテキストプロンプトで高品質のデザイン要素を作成できます。複雑なスキルやソフトウェア操作は必要ありません。ベクターロゴ、魅力的な画像、クリップアート、高度なテキスト編集、魔法の色付け、すぐに使えるテンプレートを提供します。ユーザーはイラスト、フォント、写真、アイコン、テクスチャなど、無限のコンテンツにアクセスでき、簡単にドラッグアンドドロップしてカスタマイズできます。