【AI日報】へようこそ!ここは、あなたが毎日人工知能の世界を探求するためのガイドです。毎日、AI分野のホットな情報を提供し、開発者に焦点を当て、技術トレンドの把握や革新的なAI製品の応用を理解するお手伝いをします。
最新のAI製品詳細はこちら:https://top.aibase.com/
1、最強の大規模言語モデルLlama3正式リリース GPT4レベルに到達
Llama3はMeta社が最近リリースしたオープンソースモデルで、80億と700億パラメータの規模を持ち、7月に正式リリースされる予定です。このモデルはマルチモーダル機能を備え、新しいコンピュータコーディング機能を統合しており、Metaスマートグラスなどのデバイスに適用される予定です。前世代のLlama2と比較して、推論、コード生成、指示追跡などの面で著しい進歩を遂げています。MetaとGoogleは協力して、リアルタイムの検索結果をAIアシスタントに統合し、ユーザーエクスペリエンスを向上させています。
【AiBase要約:】
✨ Llama3は80億と700億パラメータの規模を持ち、マルチモーダル機能を備え、Metaスマートグラスなどのデバイスに適用されます。
🚀 Llama3は推論、コード生成、指示追跡などの面で著しい進歩を遂げ、性能が飛躍的に向上しました。
💡 MetaとGoogleは協力して、リアルタイムの検索結果をAIアシスタントに統合し、ユーザーエクスペリエンスを向上させています。
体験アドレス:https://www.meta.ai/
モデルダウンロード:https://top.aibase.com/tool/meta-llama-3
Hugging Chat:https://huggingface.co/chat/conversation/6621c6d78f6a88b6b6084ac4
2、Midjourneyが新しい機能「Room」を発表 チャットルームで共同で画像を作成可能に
Midjourneyは最近、興味深い新機能「Room」を発表しました。これはユーザーに協調とソーシャルプラットフォームを提供するもので、ユーザーは一緒に画像を作成・共有し、リアルタイムチャットに参加できます。「Room」はユーザー間のインタラクションと協調を促進し、インスピレーションと創造的な交流を促し、Midjourneyの体験を豊かにします。
【AiBase要約:】
🎨 ユーザーは一緒に画像を作成・共有し、リアルタイムチャットでアイデアやフィードバックを交換できます。
💬 Roomは音声とテキストチャット機能を提供し、ユーザーが制作プロセスについて議論したり、アイデアを共有したりするのに役立ちます。
🤝 左側に生成された画像は、チャットに簡単に引用でき、ユーザー間のインタラクションと協調を促進します。
詳細リンク:https://www.midjourney.com/showcase
3、百度文库が「スマート漫画」「スマート画本」機能をリリース
百度文库は2024年のCreate2024百度AI開発者会議で、新しい「スマート漫画」と「スマート画本」機能を発表しました。ユーザーは一言で漫画や画本を作成できる体験を提供し、同時にクロスモーダルコンテンツ制作の発展を推進します。ユーザーは作品の作成を通じて収益を得たり、親子間の交流を深めたり、漫画制作コンテストやコミュニティ交流に参加したりすることができます。百度文库は玄机科技と協力し、世界をリードするスマート漫画ソリューションの構築を目指しています。
【AiBase要約:】
✨ ユーザーは一言で漫画や画本を作成でき、全チェーンの制作パスが実現します。
🎨 百度文库の「スマート漫画」機能はストーリー生成を最適化し、様々なスタイルとキャラクターを選択して高品質の作品を作成できます。
📚 「スマート画本」機能により、親は子供のために特別なストーリーを作成でき、親子間の交流を深め、図解と音声朗読を備えたビデオ体験を提供します。
詳細リンク:https://wenku.baidu.com/pcactivity/makeAppointment?_wkts_=1713506418546&
4、AI動画自動編集ツールCaptions 口パク、AIによる自動効果音追加などをサポート
CaptionsというAI動画編集ツールは、動画編集のプロセスを画期的に簡素化し、一連の自動化機能を提供することで、動画の視覚効果と聴覚効果を向上させます。ユーザーは字幕テンプレートを選択したり、効果音やステッカーなどの要素を追加したりして、動画をより魅力的にすることができます。CaptionsはAIによる視線注視、AIノイズリダクション、AIリップシンク、AIカラーグレーディングなどの機能もサポートしており、動画をよりプロフェッショナルで美しく仕上げることができます。ウェブ版はユーザーが簡単に使用でき、将来的には自動字幕翻訳機能を追加し、より多くのグローバルユーザーを引き込む予定です。
【AiBase要約:】
✨ 画期的な動画編集ツールで、重要な部分を自動的に認識して短編動画に編集し、編集プロセスを簡素化します。
🎬 自動化機能を提供し、視覚効果と聴覚効果を高めます。ユーザーは字幕テンプレートを選択したり、効果音やステッカーなどの要素を追加したりできます。
💡 AIによる視線注視、ノイズリダクション、リップシンク、カラーグレーディングなどの機能をサポートし、動画のプロフェッショナルさと魅力を高めます。
詳細リンク:https://top.aibase.com/tool/captions
5、スマホでオープンソースモデルを使えるように!Hugging FaceがiOSアプリHugging Chatを発表
Hugging Faceは最近、「Hugging Chat」というiOSクライアントアプリを発表し、ユーザーに便利な体験を提供しました。ユーザーは現在、スマホでHugging Faceプラットフォームでホストされている複数のオープンソースモデルにアクセスして使用できます。このアプリは応答速度が速く、ユーザーにスムーズな体験を提供しますが、中国語のサポートは改善の余地があります。この革新的な取り組みは、Hugging Faceが言語モデル分野におけるリーダーシップとユーザーニーズへの配慮を示すものです。
【AiBase要約:】
📱 ユーザーは現在、スマホでHugging Faceプラットフォームでホストされている複数のオープンソースモデルにアクセスして使用できます。
⚙️ アプリはCommand R+、Zephyr-14b、Mixtral8x7Bなど6つのモデルを提供しており、中国語のサポートは不十分ですが、人気があります。
🚀 アプリケーションの応答速度は非常に速く、ユーザーにスムーズな体験を提供します。
詳細リンク:https://apps.apple.com/us/app/huggingchat/id6476778843
6、NothingがイヤホンがChatGPTに対応すると発表
Nothingは、ChatGPTを自社のスマートフォンとイヤホンにさらに深く統合し、ユーザーにより迅速なサービスを提供すると発表しました。ユーザーは音声でAIツールと素早くインタラクトでき、手動操作は不要です。アップデート後、ユーザーはNothingイヤホンでChatGPTを使用でき、スマートアシスタントの体験が向上します。同社はこれにとどまらず、Nothing OSにChatGPTへのシステムレベルのエントリーポイントを埋め込み、スマートフォンのユーザーエクスペリエンスを改善する計画です。
【AiBase要約:】
🔊 ユーザーは音声でAIツールと素早くインタラクトでき、手動操作は不要です。
📱 アップデート後、ユーザーはNothingイヤホンでChatGPTを使用でき、スマートアシスタントの体験が向上します。
🚀 NothingはChatGPTを自社のスマートフォンとイヤホンにさらに深く統合し、ユーザーにより迅速なサービスを提供する計画です。
7、Stability AIが20人の従業員を削減 約10%に相当
Stability AI社は20人の従業員を削減すると発表しました。この削減は、コスト削減、投資家やパートナーからのサポート強化、そしてチームが革新的な製品の開発とリリースを継続するためのものです。同社は最近、人事異動の問題に直面しており、創業CEOは辞任し、著作権侵害訴訟に直面しています。従業員削減の決定は、CEO退任後の数週間の混乱の後に行われました。
【AiBase要約:】
📉 同社は従業員20人を削減し、これは従業員全体の約10%に相当し、コスト削減、サポート強化、製品開発促進を目指しています。
💼 同社は最近、人事異動の問題に直面しており、創業CEOは辞任し、著作権侵害訴訟に直面しています。
⚖️ 同社の従業員削減決定は戦略計画の一部であり、削減対象部門はまだ明らかになっていません。
8、OpenAIの画像生成器DALL-E2がサービス停止 DALL-E3が後任に
OpenAIは、画像生成器サービスDALL-E2の閉鎖を発表し、DALL-E3に置き換えられました。DALL-E3はChatGPTを統合し、よりシンプルなインターフェースとより高品質な画像を提供します。ユーザーは、DALL-E2が新規顧客を受け付けなくなることに注意し、画像生成にはDALL-E3を使用することをお勧めします。
【AiBase要約:】
🔍 DALL-E3はChatGPTを統合し、よりシンプルなインターフェースとより高品質な画像を提供します。
💡 DALL-E3はより高品質な画像と改善されたプロンプトの適合性を提供し、ChatGPT Plus、Team、Enterprise、およびOpenAI APIに対応しています。
🛑 DALL-E2は新規顧客を受け付けなくなります。DALL-E2インターフェースで新しい画像を作成することはできず、特に気に入ったコンテンツを安全にダウンロードすることをお勧めします。
9、国家インターネット情報弁公室が116個のAI大規模モデルの备案を確認
国家インターネット情報弁公室は「生成AIサービス备案情報公告」を発表し、116個のAI大規模モデルが备案手続きを完了したことを確認しました。これは、これらのモデルが関連する規定を満たし、中国国内で合法的に使用できることを意味します。この措置は、生成AIサービスの革新的な発展と規範的な適用を促進し、AI分野の発展に重要な意味を持ちます。
【AiBase要約:】
📝 116個のAI大規模モデルが备案を確認され、中国国内で合法的に使用できます。
📝 备案を確認されたAI大規模モデルは、複数の分野と適用シナリオを網羅しています。
📝 既にリリースされている生成AIアプリケーションは备案情報を公開し、情報透明性を高める必要があります。
10、国内百模で誰がトップか?清華大学による14の大規模言語モデル最新評価レポート発表 GLM-4、文心4.0が第一梯隊に
この記事では、清華大学基礎モデル研究センターが最近発表した「SuperBench大規模モデル総合能力評価レポート」をまとめ、国内外の14個の大規模言語モデルを総合的に評価しました。評価において、GLM-4、文心4.0などの国内モデルは優れたパフォーマンスを示し、国際的な一流モデルとの差は縮まりつつあります。
【AiBase要約:】
🔍 GPT-4シリーズモデルやClaude-3などの海外モデルはまだトップの位置にいますが、国内のトップ大規模言語モデルであるGLM-4と文心一言4.0は優れたパフォーマンスを示しています。
📊 意味理解とインテリジェントエージェントとしての能力評価において、国内モデルは国際的な一流モデルレベルに近づいています。
💡 大規模言語モデルの能力評価は、意味論的評価、コード評価、アライメント評価、インテリジェントエージェント評価、安全性評価の5つの段階を経ており、継続的な移行と発展の傾向を示しています。
詳細:
https://mp.weixin.qq.com/s/r_aAjFHTRDBGXhl3bd06XQ
11、MeMenteeBot:人間の言葉を理解し、観察を通して自己学習するロボット
MeMenteeBotは、画期的な機能を備えたロボットで、エンドツーエンドのタスク実行能力を持ち、人間の口頭指示を理解し、視覚的な模倣を通して自己学習します。その適応能力と柔軟な動作能力は印象的で、視覚模倣学習と高度なSim2Real技術を組み合わせ、ロボット技術が新たな段階に突入し、将来のロボットアプリケーションに無限の可能性を切り開きます。
【AiBase要約:】
🤖 MeMenteeBotはエンドツーエンドのタスク実行能力を持ち、口頭命令を受け取り、複雑なタスクを実行できます。
🔧 MeMenteeBotは、ナビゲーション、歩行、シーン理解、物体検出と位置特定、把持、自然言語理解を含む、完全な計画と制御ループ機能を備えています。
🔄 MeMenteeBotは高度なSim2Real学習技術を採用し、ロボットに柔軟な動作能力を与え、並外れた柔軟性と安定性を示しています。
12、予測:2027年までに生成AI支出は260億ドルに達する見込み