【AI日報】へようこそ!ここは、あなたの人工知能の世界を探求するための毎日のガイドです。毎日、AI分野のホットなコンテンツを提供し、開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品の応用を理解するお手伝いをします。
最新のAI製品詳細はこちら:https://top.aibase.com/
1.アップル、iOS18.2正式版を発表:SiriにChatGPTを統合
アップル社はiOS18.2、iPadOS18.2、macOS Sequoia15.2を正式にリリースしました。特にiOS18.2に導入された新機能「Apple Intelligence」が注目を集めています。この機能はiPhone15ProとiPhone16シリーズに対応しており、ユーザーはカスタムGenmojiを作成し、統合されたChatGPTインテリジェント音声アシスタントSiriを使用できます。
【AiBase要約:】
🆕 iOS18.2はApple Intelligenceを導入し、カスタムGenmojiと画像生成アプリPlaygroundをサポート。
🤖 SiriにChatGPTが統合され、ユーザーはアカウントなしで無料でインテリジェントアシスタントサービスを利用可能。
🌍 言語サポートを拡張し、今後中国語や様々な英語の方言を含む複数の言語を追加予定。
2.Google、Gemini 2.0版正式発表:Gemini 1.5 Proより2倍高速
Googleは最近、Gemini 2.0 Flash AIモデルを発表しました。これは前世代のGemini 1.5 Proよりも処理速度が2倍速く、マルチモーダル機能も拡張されています。新しいモデルはリアルタイムでオーディオとビデオストリームを処理し、画像生成機能を統合し、グローバルなアクセシビリティを強化しています。Gemini 2.0 Flashはソフトウェアエンジニアリング分野でも優れたパフォーマンスを発揮し、AI駆動のコードアシストツールを提供することで、AI技術のさらなる発展を推進しています。
【AiBase要約:】
🚀 Gemini 2.0 Flashの処理速度は前世代の2倍で、パフォーマンスが大幅に向上。
🎥 リアルタイムAPIにマルチモーダル機能を追加し、オーディオとビデオストリームの処理に対応。
🌐 ネイティブの画像生成機能を統合し、テキストによる画像の作成と変更が可能。
公式紹介:https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#gemini-2-0-flash
3.百度文库、「プロフェッショナルPPT生成」AI機能をリリース:ワンクリックで高品質PPTを生成
百度文库は最近、「プロフェッショナルPPT生成」AI機能を発表しました。これは、ユーザーが高品質なPPTを作成するプロセスを簡素化することを目的としています。AI技術により、ユーザーはキーワードやテーマを入力するだけで、内容が明確で構造が明確なPPTをワンクリックで生成できます。この機能は、制作効率の向上だけでなく、プレゼンテーションの専門性を高めるものであり、特にビジネスパーソンが仕事の成果や将来計画を示すのに適しています。
【AiBase要約:】
💡 この機能はAI技術により、ワンクリックでプロフェッショナルなPPTを生成し、制作プロセスを簡素化。
📊 年末のまとめ、プレゼンテーションなど様々なシーンに適しており、ユーザーが仕事の成果を明確に示すのに役立つ。
🎨 新しいレイアウトデザインによりPPTの視覚効果が向上し、プレゼンテーションがより専門的で説得力のあるものになる。
4.Midjourney、100人同時編集可能な世界構築ツール「Patchwork」を発表
Midjourneyは、「Patchwork」という新しいツールを発表しました。これは、ユーザーに無限の白いキャンバスを提供し、創造的なコラボレーションと世界構築を行うためのものです。ユーザーはDiscordとGoogleアカウントを接続することでこのツールにアクセスし、最大100人の他のユーザーと同時に一つのキャンバスで共同作業できます。Patchworkでは、ユーザーはキャラクター、イベント、シーンの要素を追加し、新しい画像と説明を生成できます。
【AiBase要約:】
🌟 Patchworkは無限のキャンバスを提供し、ユーザーがリアルタイムで協力してストーリーと世界を構築可能。
🤝 このツールは最大100人のユーザーが共同で創作し、様々なキャラクター、イベント、シーンの要素を追加可能。
🎥 Midjourneyはパーソナライズされたモデルとビデオ生成機能をリリースし、機能と適用範囲を継続的に拡張予定。
詳細リンク:https://patchwork.midjourney.com/
5.ChatGPTのダウンはアップルのせい?OpenAIが緊急修復、現在アクセス再開
OpenAIのChatGPTとSoraが世界中で大規模なダウンに見舞われ、ユーザーはサービスにアクセスできなくなりました。この問題は、アップルの最新のソフトウェアアップデートが原因の可能性があり、SiriとChatGPTの統合がOpenAIサーバーに大きな負荷をもたらしたと考えられています。今回のダウンは3時間以上続き、数百万人のユーザーに影響を与え、AIサービスの計算能力への需要とトラフィック急増による課題を浮き彫りにしました。サービスは復旧しましたが、この事件はOpenAIサービスの安定性に対する懸念を引き起こしました。
【AiBase要約:】
⚠️ OpenAIのChatGPTとSoraが世界中でダウンし、ユーザーは正常にアクセスできない。
📱 アップルの最新のソフトウェアアップデートによりChatGPTがSiriに統合され、OpenAIサーバーの負荷が急増。
⏳ 今回のダウンは3時間以上続き、OpenAIサービスに依存する数百万人のユーザーに影響を与えた。
6.AIオーディオ新技術MMAudio:ビデオまたはテキストを入力すると、ビデオに自動的に音声効果を追加
MMAudioは、イリノイ大学、Sony AI、ソニーグループが共同で開発した新しい技術で、ビデオからオーディオへの高品質な合成を実現することを目的としています。この技術はマルチモーダル同時学習を通じて、ビデオとテキストの入力を使用して同期オーディオを生成し、オーディオ生成のアプリケーションシナリオを拡大します。
【AiBase要約:】
🌟 MMAudio技術はマルチモーダル同時学習により、ビデオとオーディオの高品質な合成を実現。
📦 ユーザーは簡単なインストール手順で、UbuntuでMMAudioを使用してオーディオを生成可能。
⚠️ 現状のバージョンにはいくつかの制限がありますが、研究チームはトレーニングデータの増加により性能を向上させる取り組みに注力しています。
詳細リンク:https://huggingface.co/spaces/hkchengrex/MMAudio
7.アップルとブロードコム、AIサーバープロセッサを共同開発、2026年量産開始予定
アップル社はブロードコム社と協力して、同社のオペレーティングシステムのAIサービスをサポートするためのカスタムサーバープロセッサを開発しています。「Baltra」というコードネームのこのプロジェクトは、2026年に生産段階に入る予定です。現時点ではこのプロジェクトの詳細については不明ですが、アップル社はArmアーキテクチャベースのチップ設計に注力しており、AI専用チップの開発は驚くべきことではありません。
【AiBase要約:】
🌟 アップルとブロードコムがAIプロセッサを共同開発、「Baltra」というコードネーム。
🖥️ このプロセッサは2026年に生産開始予定で、アップルのAIサービスをサポート。
🔍 現時点ではプロジェクトの詳細が公開されておらず、アップル社は新製品について常に秘密主義を貫いている。
8.Google、AIコーディングアシスタント「Jules」を発表、ソフトウェアのバグを自動修正し開発プロセスを高速化
Googleは最近、AIコーディングアシスタント「Jules」を発表し、プログラミングタスクの自動化における大きな進歩を示しました。Gemini 2.0プラットフォームをベースとしたJulesは、開発者が休憩している間もソフトウェアのバグを自動的に修正し、コードの変更を生成できます。このシステムはGitHubとシームレスに統合され、複雑なコードベースを分析して複数のファイルにわたる修正を実施し、開発効率の向上とコスト削減を目指しています。
【AiBase要約:】
🌟 JulesはGoogleが最近発表したAIコーディングアシスタントで、ソフトウェアのバグを自動的に修正し、コードの変更を生成可能。
🔧 このシステムはGitHubとシームレスに統合され、複雑なコードベースを分析し、複数のファイルで同時に修正を実施。
📅 Julesは2025年初頭にさらに多くのユーザーに公開予定で、開発効率の向上とコスト削減を目指している。
詳細リンク:https://labs.google.com/jules/
9.Google、次世代Trillium AIチップを発表、性能が4倍向上
Googleが最近発表したTrillium AIアクセラレータチップは、AI技術における大きなブレークスルーを示しています。このチップはGemini 2.0モデルのトレーニングにおいて4倍のパフォーマンス向上を示し、同時に消費電力を大幅に削減しており、AI開発の経済モデルを再構築する可能性があります。Googleはすでに自社のスーパーコンピュータアーキテクチャに10万個以上のTrilliumチップを導入しており、AIインフラストラクチャ分野における野心を示しています。
【AiBase要約:】
🌟 Trilliumチップのパフォーマンスは4倍向上し、消費電力を大幅に削減し、AIトレーニングの効率を向上。
💰 ドル当たりのトレーニング性能が2.5倍向上し、AI開発の経済モデルを再構築する可能性がある。
🔗 Googleはすでに10万個以上のTrilliumチップを導入し、世界最強のAIスーパーコンピュータを構築している。
詳細リンク:https://cloud.google.com/blog/products/compute/trillium-tpu-is-ga
10.Adobe、AIビデオ生成に進出!Fireflyプラットフォームのコンテンツ生成数が160億件を突破、ビデオ制作が「有料時代」へ
AdobeはAI分野、特にビデオ生成分野を積極的に拡大しています。Firefly AIプラットフォームの成功を背景に、Adobeは新しいハイエンドビデオ生成機能を発表し、来年初めにリリースされる予定です。この機能は現在テスト段階にあり、Premiere Proのユーザー数の増加を促進しています。
【AiBase要約:】
🎥 Adobeは来年初めにハイエンドビデオ生成機能をリリース予定で、現在テスト段階にあり、ユーザー数は大幅に増加。
📈 Fireflyプラットフォームは160億件以上のコンテンツを生成し、Adobe製品の幅広い応用と市場拡大を促進。
💼 Adobeは教育プログラムを通じて3000万人の学習者に対し、AIリテラシーとデジタルマーケティングスキルの向上を支援する計画。
11.OpenAIのSora、ゲームビデオを秘密裏に使用してトレーニングしていた疑い、著作権問題が浮上
OpenAIが最近発表したビデオ生成AIモデルSoraは大きな注目を集めていますが、そのトレーニングデータには、許可を得ずに使用された大量のゲームビデオやライブ配信コンテンツが含まれている可能性があり、同社に法的リスクをもたらしています。調査によると、Soraは様々なスタイルのビデオを生成でき、有名なストリーマーのキャラクターを模倣することさえできます。知的財産権弁護士は、許可を得ずにゲームコンテンツを使用してAIモデルをトレーニングすることは著作権侵害に当たる可能性があると懸念を表明しています。
【AiBase要約:】
⚖️ Soraのトレーニングデータには、許可を得ずに使用されたゲームビデオが含まれている可能性があり、法的リスクがある。
🎥 Soraは様々なゲームスタイルのビデオを生成でき、有名なストリーマーのキャラクターを模倣できる。
📜 知的財産権法は複雑であり、個人ユーザーはAI生成コンテンツによって著作権侵害のリスクに直面する可能性がある。
12.公安部、AIによるデマ拡散の新犯罪を公開:6人が50万件の虚偽情報を大量に投稿
最近、公安部サイバーセキュリティ局は、人工知能ツールを使用して虚偽情報を生成した事件を発表し、新たなデマ拡散の手口を明らかにしました。広州の警察は犯罪組織を摘発し、容疑者6人を逮捕しました。この組織は、ソーシャルメディアアカウントを登録し、AIツールを使用して大量の虚偽情報を投稿することで、深刻なインターネット汚染を引き起こしました。
【AiBase要約:】
🛑 犯罪組織はAIツールを使用して大量の虚偽情報を投稿し、インターネット汚染を引き起こした。
💰 この組織は低コストのAIライティングツールを使用してトラフィックからの収益を得ており、コストは非常に低い。
⚠️ 専門家はAI技術の悪用リスクを警告し、インターネットの情報秩序維持の強化を訴えている。