【AI日報】へようこそ!ここでは、毎日人工知能の世界を探求するためのガイドとして、AI分野のホットな情報を毎日お届けします。開発者を中心に、技術トレンドの把握や革新的なAI製品の応用についてご紹介します。
最新のAI製品詳細はこちら:https://top.aibase.com/
1、GPT-SoVITSに匹敵する低メモリ消費のオープンソーステキスト音声変換モデルFish Speech
Fish Speechは、fishaudioが開発した新しいテキスト音声変換ツールです。中国語、英語、日本語の3言語に対応し、人間レベルの音声処理を実現しています。Flash-Attnアルゴリズムを使用して大規模データを処理し、効率的で正確かつ安定したTTS体験を提供します。
【AiBaseより】
😊 中国語、英語、日本語の3言語を完璧にサポートし、人間レベルの音声処理を実現
😊 音声クローンに対応。参考音声を提供するだけで、迅速にクローンを作成可能
😊 メモリ消費量が非常に少なく、わずか4GBで、さまざまな音声生成モデルに対応
オンライン体験アドレス:https://top.aibase.com/tool/fish-audiowenbenzhuanyuyin
詳細はこちら:https://www.aibase.com/news/9979
2、Meta 3D Gen発表、テキストから3Dアセットを1分以内に高速生成
最近、研究者らはMeta3D Gen(3DGen)と呼ばれる新しい技術を発表しました。これは、テキストから3Dアセットを1分以内に高速生成し、高品質なテクスチャとマテリアル体験を提供する技術です。Meta3D AssetGenとMeta3D TextureGenを統合し、効率的な3Dモデル作成方法を提供しており、既存のソリューションよりも3〜10倍高速です。
【AiBaseより】
🚀 Meta 3D Genシステムは、1分以内に高品質な3Dアセットを作成可能
💡 Meta3D Genは、Meta3D AssetGenとMeta3DTextureGenの2つのコア技術を統合
✨ AssetGenは、物理ベースレンダリングのマテリアルを生成し、リアルな再照明効果を実現
詳細はこちら:https://ai.meta.com/research/publications/meta-3d-gen/
3、MicrosoftがGraphRAGをオープンソース化、知識グラフで巨大言語モデルの質問応答、推論能力を強化
Microsoftが最近オープンソース化したGraphRAGシステムは、エンティティ知識グラフを使用して、巨大言語モデルの検索、質問応答、要約、推論などの能力を強化します。特に大規模データセットの処理に適しています。グローバルなエンティティ知識グラフを構築することにより、GraphRAGはテキスト内の複雑な関係と相互作用を捉え、検索の正確性と包括性を向上させます。さらに、GraphRAGはトークンの需要が低く、開発コストを削減できます。総合的なテストで優れたパフォーマンスを示しており、現在最高のRAG手法の1つです。
【AiBaseより】
💡 GraphRAGは、エンティティ知識グラフを構築することで、巨大言語モデルの検索、質問応答、要約、推論などの能力を強化し、特に大規模データセットの処理に優れています。
💡 GraphRAGのコアには、エンティティ知識グラフの構築とコミュニティサマリーの生成という2つのステップが含まれており、コミュニティサマリーを使用してデータセットから関連情報を抽出し、より包括的で正確な回答を生成します。
💡 GraphRAGはトークンの需要が低く、開発者のコスト削減に役立ちます。総合的なテストで優れたパフォーマンスを示しており、現在最高のRAG手法の1つです。
詳細はこちら:https://top.aibase.com/tool/graphrag
4、MicrosoftがデザインツールDesignerを発表:一言でパーソナライズされたグリーティングカードを生成
Microsoftが最近発表したMicrosoft Designerの「グリーティングカード」機能は、前例のないパーソナライズされたグリーティングカード作成体験を提供し、AI技術が日常生活でどのように活用できるかを示しています。
【AiBaseより】
🎨 テキストからデザインへ:ユーザーが簡単な説明を入力すると、AIが独自のグリーティングカードデザインに変換します。
🖼️ AIによる画像生成:グリーティングカードのデザインはユーザーの説明に基づいてAIが精細な画像を生成します。
✏️ 編集可能なコンテンツ:グリーティングカードの内側に編集可能なテキストが用意されており、ユーザーのニーズに合わせてカスタマイズできます。
詳細はこちら:https://designer.microsoft.com/
5、テンセント翻訳インテリジェントボディカンパニーTRANSAGENTSが開始
TRANSAGENTSは、テンセントAIラボが開発した、文学翻訳専用のマルチエージェント仮想翻訳出版会社です。現実の翻訳会社の仮想キャラクターの協力モデルをシミュレートすることで、スムーズで効率的な文学作品翻訳を実現します。TRANSAGENTSを使用した文学翻訳のコストは、専門の人間翻訳者よりも80倍低く、特定の分野の知識が必要な場合でも、人間翻訳者を凌駕する性能を発揮します。このプラットフォームは、AI技術が文学翻訳分野で持つ可能性を示しており、文学創作と普及に新たな可能性をもたらします。
【AiBaseより】
🔑 TRANSAGENTSは、超長編文学作品翻訳用に開発されたマルチエージェント仮想翻訳出版会社で、現実の翻訳会社の役割分担モデルをシミュレートしています。
💰 TRANSAGENTSを使用した文学翻訳のコストは、専門の人間翻訳者よりも80倍低く、翻訳コストの削減と優れた文学作品の発信促進に貢献します。
🌟 TRANSAGENTSは、特定分野の知識が必要な場合でも、人間翻訳者を凌駕する性能を発揮し、人間の評価者や高度な言語モデルから高い評価を得ています。
詳細はこちら:https://top.aibase.com/tool/transagents
6、SunoがiOSクライアントを発表、音声で音楽を生成
Suno社が発表したiOSアプリは、スマートフォンを仮想音楽スタジオに変え、音楽制作に革命を起こし、デジタル時代の創造的な表現方法を変える可能性があります。法的課題に直面していますが、技術は新しい作品を生成することを目的としていると主張しています。SunoのiOSアプリは、AI生成音楽が一般の人々に広がる上で重要な一歩であり、音楽界の未来のトレンドをリードします。
【AiBaseより】
🎵 スマートフォン上の音楽スタジオ:ユーザーはテキストプロンプトを入力するか、ハミングするだけで、さまざまな音楽スタイルに対応した完全な曲を生成できます。
⚖️ 法的課題と揺るぎない姿勢:レコード会社からの訴訟に直面していますが、AIが新しい作品を生成すると主張しており、訴訟の結果はAI音楽業界の発展に影響を与える可能性があります。
🔮 AI音楽の未来展望:AIと人間の音楽創作の境界が曖昧になり、創造性、音楽業界の未来など、深い問題提起がされています。
7、Apple幹部がOpenAI取締役会にオブザーバーとして参加
この記事では、Apple幹部のPhil Schiller氏がOpenAI取締役会にオブザーバーとして参加したというニュースを報じています。これにより、AppleはOpenAIの内部運営をより深く理解し、iOSとmacOSにChatGPTを統合してSiriの知能レベルを向上させる可能性があります。MicrosoftもOpenAI取締役会に参加しており、協力関係はより複雑になっています。
【AiBaseより】
🍏 Apple幹部のPhil Schiller氏がOpenAI取締役会にオブザーバーとして参加し、OpenAIへの理解を深めます。
🤖 Schiller氏の取締役会参加は、iOSとmacOSへのChatGPT統合を促進し、Siriの知能レベルを向上させるでしょう。
🔗 Microsoftも議決権のないオブザーバーとしてOpenAI取締役会に参加しており、OpenAI取締役会はより複雑になっています。
8、AI生成のパンダがラーメンを食べる動画がTikTokで42万回以上いいね!ユーザーは「リアルすぎる!」と称賛
最近、TikTokでAI生成動画技術が新たな高みに達しました。パンダと猫が箸を使ってラーメンを食べる動画は、信じられないほどリアルです。欠点もありますが、将来のAI動画はさらにリアルになるでしょう。
【AiBaseより】
🐼 動画のリアルさは驚くべきもので、ユーザーの間で話題になっています。
😺 AI技術は動画制作分野で広く活用されており、クリエイターと視聴者に新しい体験をもたらしています。
💻 国内外の動画大規模モデルの競争は激化しており、AIによる「神動画」はTikTokのチャレンジランキングで上位26位にランクインしています。
詳細はこちら:https://www.aibase.com/news/9993
9、ユーザーがGPT-4Vを自宅のカメラに接続、100万人のユーザーがその様子を視聴!
海外のユーザーがGPT-4Visionを自宅のカメラに接続したことで、100万人のユーザーがその様子を視聴しました。この行為は、AI技術が日常生活で持つ可能性を示していますが、プライバシーとセキュリティの問題も提起しています。技術の発展に伴い、より革新的で安全なアプリケーションが登場することを期待しています。
【AiBaseより】
👀 GPT-4Visionが自宅のカメラに接続され、100万人のユーザーがその様子を視聴しました。
🔒 プライバシーとセキュリティの問題が提起され、個人情報の保護への意識を高める必要があります。
💡 AI技術が日常生活で持つ可能性を示しており、技術の応用について考えるきっかけとなります。
詳細はこちら:https://www.aibase.com/news/9995
10、怒り!スコットランドの芸術家が作品を「自壊」、AIによる芸術への悪影響に抗議
スコットランドの芸術家マイケル・フォーブス氏は、自身の芸術作品を塗りつぶすことで、人工知能(AI)が芸術分野に及ぼす悪影響に抗議しました。フォーブス氏は、ジョン・レノンやテイラー・スウィフトの作品を含む4つの作品を「編集」しました。彼は、自身の行動を通じて、AIによる芸術分野における著作権侵害への関心を高めたいと考えています。芸術家はコンピューター生成画像と競争できなくなり、多くの人が芸術家の道を諦めています。
【AiBaseより】
⭐ スコットランドの芸術家マイケル・フォーブス氏は、自身の芸術作品を塗りつぶすことで、人工知能(AI)が芸術分野に及ぼす悪影響に抗議しました。
⭐ フォーブス氏は、ジョン・レノンやテイラー・スウィフトの作品を含む4つの作品を「編集」し、自身の行動を通じて、AIによる芸術分野における著作権侵害への関心を高めたいと考えています。
⭐ 芸術家はコンピューター生成画像と競争できなくなり、多くの人が芸術家の道を諦めています。