【AI日報】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、AI分野のホットなトピックをご紹介し、開発者に焦点を当て、技術トレンドの把握や革新的なAI製品の応用に関する理解を深めるお手伝いをいたします。
最新のAI製品はこちらで詳しく:https://top.aibase.com/
1、デジタルヒューマンが躍進!バイトダンスのLoopy、即夢で口パク機能が登場
バイトダンスの新プロジェクトLoopyが即夢で公開され、デジタルヒューマンの音声と映像、表情、感情を完璧に一致させることに成功しました。AIbaseによる体験では非常に優れた効果が確認され、現時点では中国語での効果が最も優れています。Loopyは口パク動画のぎこちなさを解消し、キャラクターが話す際に自動的に口調、感情、表情が加わり、仮想キャラクターの微妙な動きを正確に制御します。
【AiBase要約:】
👄 キャラクターが話す際に、口調、感情、表情が自動的に加わり、口パク動画のぎこちなさを解消。
🎤 テキスト読み上げとローカル音声のアップロードに対応し、キャラクターの会話と歌唱を実現。
👁 口パク動画では、喉仏や眉毛などの微妙な変化も考慮されており、動画全体のリアリティが向上。
詳細リンク:https://top.aibase.com/tool/jimeng
2、テンセントの元に器AIインテリジェントエージェント、公式アカウントへの公開に対応:デジタル分身の作成、7×24時間対応のインテリジェントカスタマーサービスが可能に
テンセントの混元は先日、AIインテリジェントエージェント製品「テンセント元に器」が微信公式アカウントへの公開に対応したことを発表しました。公式アカウント運営者向けに様々な新機能を提供します。ユーザーは簡単な3ステップでインテリジェントエージェントを作成し、ユーザーエンゲージメントと体験を向上させることができます。開発者は高品質のインテリジェントエージェントを迅速に作成でき、QQ、微信などのプラットフォームへの公開、API呼び出しにも対応しています。
【AiBase要約:】
🤖 デジタル分身によるリアルタイムインタラクション:ユーザーエンゲージメントと体験の向上。
🕒 24時間365日対応のインテリジェントカスタマーサービス:サービス効率の向上。
📝 記事への挿入機能:コンテンツのインタラクティブ性と情報量の強化、読者へのQ&Aアシスタント、より実用的な記事を提供。
3、阿里雲魔搭コミュニティ、AIGC専門エリアを開設:初回導入モデルは多様な157種類
アリババは2024年9月21日のクラウドコンピューティングカンファレンスで、魔搭コミュニティが正式にAIGC専門エリアを開設したことを発表しました。開発者向けに包括的なAI創作・開発プラットフォームを提供します。阿里雲は、セキュリティとデータ管理に関する複数の重要なアップグレード、および新しい弾性計算製品ファミリーも発表しました。
【AiBase要約:】
🚀 魔搭コミュニティがAIGC専門エリアを開設し、包括的なAI創作・開発プラットフォームを提供。機能ブロックとGPUコンピューティングパワーを無料で提供。
🔒 阿里雲のクラウドネイティブセキュリティ機能が全面的にアップグレードされ、クラウドネイティブネットワーク検出とレスポンス製品NDRが発表され、無料のセキュリティ保護機能が強化され、中小企業がクラウド上のセキュリティリスク管理を完了できるようになりました。
💻 阿里雲が弾性計算製品ファミリーを発表し、第9世代ECSエンタープライズインスタンスを発表。パフォーマンスが最大30%向上。
4、愛詩科技の動画生成大規模言語モデルPixVerse、新しいUIを発表:操作性が向上
愛詩科技の動画生成大規模言語モデルPixVerseが新しいユーザーインターフェース(UI)を発表し、一連の革新的な機能を追加し、ユーザーの創作体験を向上させました。アップデートには、万能創作フロート、トップページのインスピレーションライブラリ、クリエイティブワークステーションなどが含まれ、生成手順と機能レイアウトを最適化し、さまざまなデバイスのニーズに対応しています。PixVerse V2.5バージョンが世界中でリリースされ、動画生成のダイナミック効果、速度、画質が向上し、モデルの改善によりプロンプトの理解と生成能力が強化されました。Performance高性能モード、モーションブラシ、カメラワークコントロール、テキストコンテンツ生成などの新機能が追加され、動画制作がよりプロフェッショナルで生き生きとしたものになり、操作性が向上しました。
【AiBase要約:】
⚙️ アップデートされた機能には、万能創作フロート、トップページのインスピレーションライブラリ、クリエイティブワークステーションなどがあり、ユーザーエクスペリエンスが向上。
🚀 PixVerse V2.5バージョンが世界中でリリースされ、動画生成の効果と速度が最適化され、生成の正確性と美的レベルが向上。
🎨 Performance高性能モード、モーションブラシ、カメラワークコントロール、テキストコンテンツ生成などの新機能により、制作がよりプロフェッショナルで生き生きとしたものになり、操作性が向上。
詳細リンク:https://pixverse.ai/
5、知網華知大規模言語モデル5.0発表:適用範囲の拡大、推論能力の強化
同方知網とファーウェイクラウドが共同開催したセミナーで、華知大規模言語モデル5.0バージョンが発表されました。適用範囲、推論能力、コンテンツ生成の信頼性が全面的にアップグレードされ、スマートPPT、AI科学技術文献検索、華知アプリ、3Dホログラフィックインタラクティブデジタルヒューマンなどの新しいアプリケーションが導入されました。華知大規模言語モデル5.0は、全シリーズ、マルチモーダル、強力な知識、高い信頼性を実現し、教育研究、工業農業、行政経済、医療法律などの分野で既に成功裏に導入されており、CNKI AI学研アシスタントは1000以上の機関ユーザーから認められています。
【AiBase要約:】
🌟 適用範囲の拡大
🚀 推論能力の強化
💡 スマートPPT、AI科学技術文献検索、華知アプリ、3Dホログラフィックインタラクティブデジタルヒューマンなどの新しいアプリケーションが導入
6、ChatGPTの資源消費が深刻!メール1通の送信で、ペットボトル1本分の水を使用
最近の研究では、ChatGPTを使用してメールを作成すると、大量の水と電力を消費し、干ばつ問題を悪化させる可能性があることが明らかになりました。AIのリソース消費は懸念されており、持続可能な開発政策を策定する必要があります。
【AiBase要約:】
💧 100文字のメールを送信するたびに、ChatGPTは519mlの水を消費します。これはペットボトル1本分に相当します。
⚡ GPT-3のトレーニングには70万リットルの水、メール1通の送信には0.14キロワット時の電力が消費されました。
🌱 AIへの過剰な依存は資源消費問題につながる可能性があり、企業は持続可能な開発政策を策定する必要があります。
7、Deepgram、リアルタイムインテリジェント会話APIを発表、人間と機械のインタラクション体験を一新
Deepgramは最近、AI音声エージェントAPIを発表し、人間と機械のインタラクション体験を一新し、企業と開発者にこれまでにない自然な会話体験を提供します。このAPIは、高度な音声認識と合成技術を統合し、リアルタイムの会話の理解と生成をサポートし、効率的な音声アシスタントの構築に新たな道を切り開きます。
動画は公式提供、翻訳:小互
【AiBase要約:】
🚀 APIは高度な技術を統合し、リアルタイムの会話の理解と生成をサポートし、インタラクションの自然さを向上。
💡 革新的な会話終了検出モデルを搭載し、会話中の沈黙や中断をスムーズに処理し、より自然でスムーズなコミュニケーションを実現。
🔧 柔軟性が高く、さまざまな大規模言語モデルの統合に対応。レスポンスタイムは1秒以内と高速で、多様な分野への適用が可能。
詳細リンク:https://deepgram.com/agent/
8、StoryMaker:複数キャラクターのシーンでも、キャラクターの一貫性を簡単に維持
StoryMakerは、AI生成の連続画像にこれまでにない一貫性と連続性をもたらすパーソナライズされたソリューションであり、クリエイターが魅力的な視覚的な物語を簡単に構築できるようにします。その最大の強みは、強力なキャラクター一貫性維持能力であり、複数キャラクターのシーンでも、キャラクターの顔の特徴、服装、髪型、体勢の一貫性を維持します。この技術の柔軟性と多様な創作の可能性は、AI支援による創作に新たな可能性を切り開き、デジタルアートやエンターテインメント業界に新たな可能性をもたらします。
【AiBase要約:】
🔑 強力なキャラクター一貫性維持能力により、顔の特徴、服装、髪型、体勢を高度に一致させる。
🌟 適用範囲が広く、ユーザーは簡単なテキストコマンドで生成画像の背景、キャラクターのポーズ、スタイルを制御し、特定の物語のニーズに合った画像シーケンスを作成。
🎨 柔軟性が高く、衣装交換やキャラクター補間などの高度な機能に対応し、他の生成プラグインとシームレスに統合し、多様な創作の可能性を提供。
詳細リンク:https://top.aibase.com/tool/storymaker
9、元アップルデザイン責任者ジョニー・アイヴ氏、OpenAIと協力して謎のAIデバイスを開発中
ジョニー・アイヴ氏とOpenAIが協力して謎のAIハードウェアデバイスを開発しており、iPhoneよりも社会的な破壊が少ないコンピューティング体験を目指しています。プロジェクトチームは強力なメンバーで構成されており、多くのメンバーがアップルの名作製品のデザインに携わっていました。市場はこの協力に大きな期待を寄せており、斬新なAIデバイスが登場することを願っています。
【AiBase要約:】
🌟 ジョニー・アイヴ氏とOpenAIが協力して、謎のAIハードウェアデバイスを開発中。
🤖 新しいデバイスの目標は、iPhoneを超える社会的な破壊が少ないコンピューティング体験の創造。
🛠️ プロジェクトチームは強力なメンバーで構成されており、多くのメンバーがアップルの名作製品のデザインに携わっていました。
10、Apple Intelligenceを搭載した新しいSiri、発表日が前倒しの可能性
Power Onニュースレターによると、アップルはApple Intelligenceに基づいて完全に再構築されたSiriを発表する可能性があります。これは、完全な体験ではないにしても、ユーザーが早期に一部の機能を体験できることを意味します。マーク・ガーマン氏はApple Intelligence機能のリリーススケジュールに関する詳細情報を明らかにし、いくつかの新しい情報を明らかにしました。
【AiBase要約:】
🚀 アップルはApple Intelligenceに基づいた新しいSiriを早期に発表する可能性があり、ユーザーは一部の機能を早期に体験できる可能性があります。
💡 新しいSiriの機能は、以前の予想よりも早いiOS18.3でリリースされる予定です。
📅 iOS18シリーズのバージョンの開発スケジュールとリリース日についても具体的な詳細が明らかになり、iOS18.1からiOS18.4までのリリーススケジュールが含まれています。
11、グーグル、1億2000万ドルを投じてグローバル人工知能機会基金を設立
グーグルは、世界的なAI教育を促進するために、1億2000万ドルを投じてグローバルAI機会基金を設立すると発表しました。この基金は非営利団体と協力して、多言語AIトレーニングを提供し、各国間のデジタル格差を縮小します。スンダー・ピチャイCEOは、AIイノベーションを促進する政策を呼びかけ、持続可能な開発目標達成におけるAIの重要性を強調しました。
【AiBase要約:】
🌐 グーグルが「グローバルAI機会基金」に1億2000万ドルを投資し、世界的なAI教育を促進。
🤝 基金は非営利団体と協力して、多言語AIトレーニングを提供し、各国間のデジタル格差を縮小。
📈 スンダー・ピチャイCEOは、AIイノベーションを促進する政策を呼びかけ、持続可能な開発目標達成におけるAIの重要性を強調。
12、Perplexity AI、新しい「スポンサー付きQ&A」広告システムの導入を計画
Perplexity AIは、ナイキやマリオットとの提携交渉を行い、デジタル広告市場におけるグーグルの支配的地位に挑戦するために、新しい「スポンサー付きQ&A」広告システムの導入を計画しています。このシステムの料金体系はグーグルよりもはるかに低く、より多くのブランドの参加を促進し、Perplexityを10億ドル以上の評価額を持つユニコーン企業に押し上げました。しかし、同社は剽窃の申し立てにも直面しており、改善策を講じています。
【AiBase要約:】