【AI日報】へようこそ!ここでは、人工知能の世界を探求するための毎日のガイドとして、AI分野のホットなニュースを毎日お届けします。開発者を重視し、技術トレンドの把握や革新的なAI製品の応用に関する理解を深めるお手伝いをします。
最新のAI製品詳細はこちら:https://top.aibase.com/
1、Midjourneyがモデルのパーソナライズ機能を発表
Midjourneyは最近、ユーザーの美的嗜好に合わせてMJモデルを微調整できる革新的なモデルパーソナライズ機能を発表しました。これにより、生成される画像が個人の好みにより近くなります。パーソナライズされたモデルは、ユーザーがお気に入りの画像を分析することで実現され、ユーザーの独特な美的センスを学習し、ユーザーの好みに合わせた画像を生成します。ユーザーは少なくとも200枚の画像を評価またはいいねする必要があります。パーソナライズ機能を有効にすると、プロンプトの後に特定のコードを追加してパーソナライズ効果を共有できます。
【AiBase要約:】
🎨 モデルのパーソナライズ機能により、ユーザーは美的嗜好に合わせてMJモデルを微調整し、生成される画像を個人の好みに近づけることができます。
🔍 パーソナライズされたモデルは、ユーザーが過去にお気に入りの画像を分析することで、ユーザーの独特な美的センスを学習し、生成される画像の精度を向上させます。
💡 ユーザーは少なくとも200枚の画像を評価またはいいねする必要があります。パーソナライズ機能を有効にすると、プロンプトの後に特定のコードを追加してパーソナライズ効果を共有できます。
詳細リンク:https://www.midjourney.com/rank
2、間もなくオープンソース化されるSD3 Mediumモデルに対応済みComfyUI
SD3 Mediumモデルが間もなくオープンソース化されることを受け、ComfyUIは既にその対応作業を完了し、新モデルの登場に備えています。これにより、よりリアルな質感、優れた構図、向上した性能、そして優れた微調整能力を備えた画像生成を体験できます。
【AiBase要約:】
📈 SD3 Mediumモデルが間もなくオープンソース化され、ComfyUIは対応作業を完了しました。
🖼️ SD3 Mediumは画像生成において著しい進歩を遂げ、細部まで豊かで非常にリアルな画像を生成できます。
💡 SD3 Mediumは、高品質で細部まで豊かな画像を生成する強力な能力を備えています。
詳細:
https://github.com/comfyanonymous/ComfyUI/commit/8c4a9befa7261b6fc78407ace90a57d21bfe631e
3、微信入力法がAI機能のベータテストを実施中 「=」キーでAI回答を取得
微信入力法のベータ版では、AIアシスタント機能が追加され、「=」キーを押すとAIが生成した回答を取得できます。絵文字と顔文字の推奨にも対応し、時間と日付の入力形式のサポートも強化されました。
【AiBase要約:】
🤖微信入力法にAIアシスタント機能が追加され、「=」キーを押すとAIが生成した回答を取得できます。
🤖絵文字と顔文字のサポートが強化され、時間と日付の入力形式のサポートも強化されました。
🤖現時点ではベータ版はWindowsユーザーのみを対象としており、iOS、Android、Macプラットフォームへの展開は今後検討される可能性があります。
4、バイトダンスがAI仮想交際チャット製品「小黄蕉」をリリース 写真生成機能とリアルな会話体験を提供
最近、「小黄蕉」(英語名Chatwiz)というAI仮想交際チャット製品がリリースされました。この製品の特徴は、写真生成機能を備え、会話が非常にリアルな点です。調査によると、この製品の工商主体は北京臻鼎科技有限公司(番茄小説)であり、その背後にはバイトダンス社がいます。
【AiBase要約:】
⭐ 小黄蕉はAI仮想交際チャット製品で、写真生成機能を備え、会話はリアルな体験を提供します。
⭐ バイトダンスはAI大規模モデルに積極的に取り組んでおり、様々なAI製品やサービスを提供しています。
⭐ 「小黄蕉」は、バイトダンスがAI応用分野における継続的な探求と革新を示しています。
5、科大訊飛、6月27日に「訊飛星火V4.0」を発表 最新のスマート音声技術を披露
科大訊飛は6月27日に「訊飛星火V4.0」を発表し、一言復元、高ノイズ環境での音声認識、複数の方言と複数の言語をシームレスに切り替える機能など、最新のエンドツーエンドのスマート音声技術の成果を披露します。劉慶峰氏は、科大訊飛は全二重技術と超人間的な合成技術において国際的にトップレベルにあると述べています。今後、科大訊飛は遠距離、高ノイズ、複数話者による会話シーン、表現力の高いパーソナライズされたシーンなどの研究開発に注力していきます。
【AiBase要約:】
🚀 訊飛星火V4.0は、一言復元、高ノイズ環境での音声認識、複数の方言と複数の言語をシームレスに切り替える機能など、最新のエンドツーエンドのスマート音声技術の成果を披露します。
💡 科大訊飛は全二重技術と超人間的な合成技術において国際的にトップレベルにあります。
🔮 今後、科大訊飛は遠距離、高ノイズ、複数話者による会話シーン、表現力の高いパーソナライズされたシーンなどの研究開発に注力していきます。
6、アップルが新しいAI機能を発表後、株価が史上最高値を更新
アップルの株価は火曜日の終値で7%以上上昇し、史上最高値を更新しました。この反発は、アップルにとって今年のパフォーマンスに希望を与え、市場がアップルの新しいAI機能に肯定的な見方をしていることを示しています。
【AiBase要約:】
📈 アップルの株価は火曜日に7%以上上昇し、史上最高値を更新しました。時価総額は3.18兆ドルに達する見込みで、マイクロソフトに次ぐ規模となります。
📱 新しいAI機能により、Siri仮想アシスタントの改良やその他のAI機能を含む、アップルデバイスの魅力が高まりました。
💡 開発者イベントの後、アナリストはアップルの株価目標を上方修正し、新機能が秋の新型iPhoneシリーズの購入を促進すると予想しています。
7、Follow-Your-Emoji:人物の表情の変化を捉え、表情豊かなアニメーションを生成
Follow-Your-Emojiは画期的な技術で、ビデオ内の人物の顔の特徴を抽出して、全く新しい顔のアニメーションを生成します。この技術は顔の特徴と瞳孔点を正確に捉え、顔の輪郭の干渉を除去することで、より自然で生き生きとしたアニメーション効果を実現します。エンターテイメント、教育、商業など幅広い分野で活用できます。
【AiBase要約:】
👤 ユーザーが写真を提供すると、技術によってビデオアニメーションが生成され、微妙な表情の変化が捉えられます。
🔒 アイデンティティは維持され、アバターのアイデンティティの特徴を参照して保持され、失われることはありません。
😊 表情豊かで、瞳孔の動きを含む様々な表情が生成され、アニメーションをより生き生きと、リアルなものにします。
詳細リンク:https://top.aibase.com/tool/follow-your-emoji
8、オンラインAI画像エディターFreepik Designer
Freepik Designerは革新的なオンラインAI画像エディターで、ユーザーにシンプルで使いやすいデザインツールを提供し、専門的なデザインスキルがなくても簡単に操作できます。AIツールの統合により、デザインプロセスがより効率的になり、豊富なテンプレートライブラリにより、様々なデザインニーズに対応できます。
【AiBase要約:】
🎨 シンプルで使いやすいデザインツールで、専門的なデザインスキルがなくても簡単に操作できます。
🖼️ 豊富なテンプレートライブラリを提供し、様々なデザインニーズに対応します。
💡 AIツールが統合されており、デザインの効率と品質を向上させます。
詳細リンク:https://top.aibase.com/tool/freepik-designer
9、イーロン・マスクがOpenAIに対する訴訟を取り下げ
イーロン・マスクは、OpenAIに対する契約違反の訴訟を取り下げました。マスク氏は、OpenAIが非営利の使命を放棄し、商業利益に転向したと主張しています。OpenAIはこれらの主張を否定し、「不整合」で「ばかげている」と述べています。
【AiBase要約:】
🔍 イーロン・マスクがOpenAIに対する訴訟を取り下げました。
💡 マスク氏は、OpenAIが非営利の使命を放棄し、商業利益に転向したと非難しています。
🔒 OpenAIはこれらの主張を否定し、「不整合」で「ばかげている」と述べています。
10、YandexがオープンソースツールYaFSDPを発表 LLMトレーニングの効率性におけるボトルネックを突破
Yandexがオープンソース化したYaFSDPツールは、世界中のAIコミュニティに画期的なLLMトレーニング最適化手法を提供し、トレーニング速度を大幅に向上させ、大量のGPUリソースを節約することで、独自のLLMトレーニングをより実現可能にします。Yandexは世界中のAIコミュニティの発展に継続的に貢献することを約束しており、YaFSDPのオープンソース化はその約束の表れです。
【AiBase要約:】
✨ YaFSDPは、Yandexがオープンソース化した高効率の大規模言語モデルトレーニング最適化手法で、LLMトレーニング速度を26%向上させることができます。
💡 YaFSDPは、GPU通信の効率とメモリ使用率の最適化に重点を置いており、300億〜700億のパラメータ規模のトレーニングにおいて優れたパフォーマンスを発揮します。
🌟 YaFSDPを使用して700億パラメータのモデルをトレーニングすると、約150台のGPUリソースを節約でき、コスト削減は50万〜150万ドルに達する可能性があります。
11、速度が410倍向上!TikTokはわずか32個のトークンで画像の再構築と生成が可能に
最近、生成モデルの発展は、高解像度画像の効率的な合成における画像トークン化の重要性を浮き彫りにしています。TikTokはTransformerベースの1次元トークン化フレームワークであり、画像を1次元の潜在シーケンスにトークン化することで、生成効率と品質を大幅に向上させます。高解像度画像の処理において優れたパフォーマンスを発揮し、生成速度が大幅に向上すると同時に、高品質なサンプル出力を維持します。
【AiBase要約:】
⚙️ 画像トークン化により計算需要が減少し、生成効率と有効性が向上します。
🔍 TikTokは画像を1次元の潜在シーケンスにトークン化し、わずか32個の離散トークンで256×256の画像を表します。
💡 TikTokはImageNetベンチマークテストで優れたパフォーマンスを発揮し、生成速度が410倍向上し、同時に高品質なサンプル出力を維持します。
12、MITが新しいアルゴリズムDenseAVを開発:ビデオを見ることで言語の意味を学習
MITが開発した新しいアルゴリズムDenseAVでは、研究者たちが動物のコミュニケーション方法を機械に理解させることで、ビデオを見ることで言語の意味を学習します。このアルゴリズムは、単語の意味と音の位置を教師なしで学習し、クロスモーダル接続の自然な区別を実現します。チームは、新しい言語の理解や異なる信号間の関連性の発見に適用することを期待しています。
【AiBase要約:】
🧠 DenseAVは、双方向エンコーダー接地アーキテクチャであり、高解像度、意味、視覚音声アライメントの機能を学習します。
🔍 教師なし学習により、単語の意味と音の位置の関連性を発見し、言語と音を自動的に区別します。
🌐 クロスモーダル検索において、以前のモデルImageBindよりも優れており、大量のビデオの学習や新しい言語の理解に適用されます。
詳細リンク:https://top.aibase.com/tool/denseav
13、AIをより倫理的に:Source.Plusが高品質なAIトレーニングデータを提供
Spawningは、アーティストがオンラインで作品の使用に関するより多くのコントロール権を持つことを目指しており、Source.Plusプロジェクトで発表されたデータセットには、約4000万枚のパブリックドメイン画像とクリエイティブコモンズCC0ライセンスの画像が含まれており、AIモデルのトレーニングに高品質なデータを提供します。このプラットフォームは、アーティストやクリエイターに作品の使用権限管理をより詳細に提供し、AI技術の発展と応用に新たな活力を注入します。
【AiBase要約:】
🔍 データ検索と整理:ユーザーは様々なメディアデータを迅速に検索し、トレーニングニーズに合わせて整理・注釈を付けることができます。
🌟 高品質なトレーニングデータ:厳選された審査済みのデータは、安全と品質、そして合法的な使用を保証します。
💡 幅広い用途:様々なAIモデルのトレーニングに適用でき、精度と堅牢性を向上させます。
詳細リンク:https://top.aibase.com/tool/source-plusSource.Plus
14、Mistral AIが6.4億ドルのシリーズB資金調達を実施