【AI日報】へようこそ!ここは、人工知能の世界を探求するためのあなたの毎日のガイドです。毎日、AI分野のホットな話題を提供し、開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品の応用を理解するお手伝いをします。
最新のAI製品はこちらからご確認ください:https://top.aibase.com/
1、可灵AI APIの口パク機能が全面的に開放、バーチャル試着がV1.5モデルにアップグレード
北京快手科技有限公司は最近、可灵AI(Kling)APIの最新アップグレードを発表しました。主な進歩は、バーチャル試着と口パク機能にあります。アップグレードされたV1.5モデルは、「上着+下着」の組み合わせ服装をサポートし、試着体験のリアリティを高めました。同時に、口パク機能の全面的な開放により、生成される動画コンテンツがより鮮やかになり、全く新しい創作の可能性をもたらします。これらの技術の進歩は、eコマース、広告マーケティングなどの分野のお客様に強力なサポートを提供し、ビジュアルコンテンツの革新と発展を促進します。
【AiBase要約:】
👗 可灵AIのV1.5モデルは組み合わせ服装をサポートし、バーチャル試着のリアリティと実用性を向上させます。
🎤 口パク機能が全面的に開放され、動画の人物の口元と音声の完璧な同期を実現します。
🚀 このアップグレードは、企業ユーザーが事業成長において新たな一歩を踏み出すのに役立ち、ビジュアルコンテンツの革新を促進します。
2、豆包大規模言語モデル、GPT-4に追いついたと発表、300万字の長文処理能力を初公開
バイトダンス傘下の豆包大規模言語モデルは、2024年度技術進捗報告書の中で、最新バージョンDoubao-pro-1215が総合性能においてGPT-4と完全に肩を並べ、特定の専門分野ではより優れた性能を示していると発表しました。この進歩は、中国の大規模言語モデル技術の台頭を象徴しており、理解精度と生成品質の顕著な向上を示しています。特に複雑なシナリオではGPT-4を凌駕し、より競争力のあるサービス価格を提供しています。
【AiBase要約:】
🚀 豆包大規模言語モデルは総合性能においてGPT-4と完全に肩を並べ、一部の専門分野ではより優れた性能を示しています。
💡 データ処理の最適化と革新的なモデルアーキテクチャにより、豆包は理解精度と生成品質において著しい進歩を遂げました。
📚 300万字の超長文処理能力を初めて公開し、処理遅延は15秒以内です。
3、智譜の深層推論モデル GLM-Zero プレビュー版が公開
智譜華章科技有限公司は、年末に拡張強化学習技術に基づく最初の推論モデルGLM-Zeroの初期バージョンであるGLM-Zero-Previewを発表しました。このモデルは、AIの数理論理、コード記述などの分野における推論能力の向上に重点を置いており、優れた性能を示しています。OpenAIのモデルにはまだ差がありますが、同社は継続的な最適化を行い、適用範囲を拡大する予定です。ユーザーは智譜清言プラットフォームでこのモデルを体験でき、開発者はAPIを介して呼び出すこともできます。
【AiBase要約:】
🚀 GLM-Zero-PreviewはAIの推論能力、特に数理論理とコード記述における能力向上に重点を置いており、優れた性能を示しています。
🛠️ ユーザーは智譜清言プラットフォームでGLM-Zero-Previewを無料で体験でき、テキストと画像のアップロードをサポートし、完全な推論プロセスを出力します。
📈 学習データの増加に伴い、GLM-Zero-Previewの深層推論における効果は着実に向上し、強化学習の重要性を示しています。
詳細リンク:https://chatglm.cn/main/gdetail/676411c38945bbc58a905d31?lang=zh
4、百度、2024年度AIプロンプト「答え」を発表
2024年末、百度は年度AIプロンプト「答え」を発表しました。これは、人々がAIへの依存と期待を反映しています。人々が頻繁にAIに答えを求めるにつれて、「答え」、「なぜ」などの言葉は、社会の感情と個人の悩みを明らかにしています。百度は、高頻度プロンプトを分析することで、AIがどのように人々の日常生活に溶け込み、思考と感情の拠り所になっているかを示しました。
【AiBase要約:】
🤖 AIは人々の生活の中で答えを求める重要なツールとなり、社会の感情と迷いを反映しています。
🔍 高頻度プロンプトは、人々の生活、仕事、感情における一般的な問題と願望を明らかにしています。
🌟 百度は、AIが今後も人類のパートナーとして、未来の可能性と未知の領域を探求し続けると強調しています。
5、通義、2024年若者AI利用動向レポートを発表:85後、90後世代のAIへの関心が高い
『2024年若者AI利用動向レポート』によると、AIの応用は生活のあらゆる側面に広く浸透しており、特に仕事、学習、創造的な表現において注目されています。95後世代、女性、企業経営者層がAIへの関心が最も高く、回答者の80%以上がAIツールに高い関心を示しており、半数近くが毎日AIを使用しており、AIが生活に欠かせないものになっていることを示しています。
【AiBase要約:】
🧑🎓95後世代、女性、企業経営者層のAIへの関心が著しく高まっており、回答者の80%以上がAIツールに高い関心を示しています。
🎨 AIは創造的な表現やエンターテイメント活動に広く利用されており、若者はAI生成コンテンツを試すことを好んでいます。
🔍 AIへの期待が高まる一方で、データプライバシーへの懸念も高まっており、警戒が必要です。
6、OpenAI CEO、2025年新技術製品を発表、AGI、アダルトモードが話題に
OpenAIのCEOであるSam Altmanは、2025年にAGI(汎用人工知能)やエージェント機能などを中心とした複数の新技術製品を発表すると発表し、大きな注目を集めています。新製品の発表は、OpenAIの人工知能分野における継続的な革新、特にユーザーからのフィードバックへの対応を示しており、市場ニーズへの感度の高さを示しています。アダルトモードの発表は、ネットユーザーの間で活発な議論を巻き起こし、よりオープンなコンテンツ生成体験への期待が高まっています。
【AiBase要約:】
🌟 OpenAIは2025年にAGI、エージェントなどの新製品を発表する予定で、人工知能分野における継続的な革新を示しています。
💬 アダルトモードがネットユーザーの注目を集め、よりオープンなコンテンツ生成体験への期待が高まっています。
📈 Altmanによる技術発表はユーザーからのフィードバックに基づいており、OpenAIが製品開発においてユーザーニーズを重視していることを反映しています。
7、智元ロボット、世界初の100万件のリアルマシンデータセットAgiBot Worldをオープンソース化
智元ロボットは複数の機関と協力して、AgiBot Worldデータセットをオープンソース化しました。これは、現実のシナリオに基づいた世界初の100万件のリアルマシンデータセットであり、ヒューマノイドロボット技術の発展を促進することを目的としています。このデータセットの規模と品質は既存の同種製品を凌駕しており、ロボット大規模言語モデルのトレーニングと応用を大幅に促進します。
【AiBase要約:】
🌍 AgiBot Worldは、全域の現実シナリオに基づいた世界初の100万件のリアルマシンデータセットであり、汎化と汎用的なロボット大規模言語モデルのトレーニングをサポートします。
📦 データセットには、家庭、飲食、産業など5つの主要なシナリオが含まれており、3000種類以上の現実の物体と80種類以上のスキル動画が含まれています。
📈 智元ロボットは今後、数千万件のシミュレーションデータをオープンソース化し、ヒューマノイドロボット技術の広範な応用を促進する予定です。
詳細リンク:https://github.com/OpenDriveLab/agibot-world
8、Hugging Face、SmolAgentsを発表:3行のコードでインテリジェントエージェントを作成し、AI開発を簡素化
Hugging FaceのSmolAgentsツールキットは、AI開発に革命的な変化をもたらし、インテリジェントエージェントの作成をかつてないほど簡単かつ効率的にしました。わずか3行のコードで、開発者は事前トレーニング済みのモデルを使用して、強力なインテリジェントエージェントを迅速に構築でき、開発のハードルを大幅に下げます。SmolAgentsの軽量設計と直感的なAPIにより、あらゆるスキルレベルの開発者が簡単に使い始め、迅速にタスクを完了できます。
【AiBase要約:】
🚀 SmolAgentsは3行のコードでインテリジェントエージェントの作成を簡素化し、開発のハードルを下げます。
📊 このツールキットは事前トレーニング済みのモデルを利用し、言語理解、インテリジェント検索、動的なコード実行などの機能をサポートしています。
💻 SmolAgentsは様々な開発シナリオに適用でき、タスクを迅速に完了でき、個人開発者や小規模チームに適しています。
詳細リンク:https://github.com/huggingface/smolagents
9、上海市、新たに登録が完了した9種類の生成AIサービスを追加
上海市網信办は最近、新たに9種類の生成AIサービスの登録を発表し、上海市における生成AIの革新と規範的な応用を促進することを目的としています。今回の登録により、総登録数は63件に達し、オンラインサービスはすべてオンライン番号を明記する必要があると強調され、透明性とユーザーの信頼性を高めています。新たに登録されたサービスには、無憂智面、AI同時口語練習などがあり、ユーザーにより安全で信頼性の高いサービス環境を提供することを目指しています。
【AiBase要約:】
📈 上海市は新たに9種類の生成AIサービスを追加し、登録総数は63件に達し、業界の健全な発展を促進しています。
🔍 オンラインの生成AIアプリケーションはすべてオンライン番号を明記する必要があり、サービスの透明性を高めています。
💡 新たに追加されたサービスには、無憂智面、AI同時口語練習などがあり、ユーザーに安全で信頼性の高い利用体験を提供することを目指しています。
10、高額!OpenAI o3モデルの1回あたりのクエリ費用なんと1000ドル!
OpenAIが最近発表したo3AIモデルは、同社で最も強力なAI製品と考えられていますが、運用コストは驚くほど高く、1回あたりのタスク費用が1000ドルを超えています。o3はARC-AGIベンチマークテストで優れた性能を示し、87.5%というスコアを獲得し、前世代のo1モデルの約3倍に達しています。しかし、この顕著な性能向上には莫大な費用が伴い、業界では経済性に対する懸念が生じています。
【AiBase要約:】
💸 o3AIモデルの1回あたりのクエリコストは1000ドルを超え、その高い運用コストを示しています。
📊 ARC-AGIベンチマークテストでo3は87.5%というスコアを獲得し、前世代のo1モデルの約3倍に達しています。
🔍 現在o3は一般公開されておらず、「ミニ版」は来年1月に公開される予定です。
11、Nvidia、Run:aiの買収を完了し、GPU管理ソフトウェアのオープンソース化を決定
Nvidiaは最近、イスラエルのソフトウェア企業Run:aiの買収を完了し、AIクラウドコンピューティングの管理効率の向上を目指しています。買収額は公表されていませんが、この取引の価値は約7億ドルとされています。Nvidiaは、Run:aiのソフトウェアをオープンソース化し、より広範なAIエコシステムをサポートすると発表しました。Run:aiのソフトウェアは、Nvidia GPUリソースを効率的にスケジュールし、AI演算性能を最適化できます。
【AiBase要約:】
🌟 NvidiaはRun:aiの買収を完了し、そのソフトウェアをオープンソース化してAI技術の発展を促進すると発表しました。
💻 Run:aiのソフトウェアはNvidia GPUリソースを効果的にスケジュールし、AI演算効率を向上させます。
🤝 Run:aiは引き続き顧客へのサポートを提供し、AIインフラストラクチャの使用効率を最大化することに取り組んでいます。
12.阿里雲、再び値下げ:Qwen-VL大規模言語モデルが全面値下げ、1元で600枚の画像処理が可能に
阿里雲は、大規模言語モデルQwen-VLの価格を再び引き下げ、値下げ幅は80%を超えています。今回の値下げ後、ユーザーはわずか1元で720P画像600枚または480P画像1700枚を処理できます。Qwen-VLシリーズモデルは、その強力なビジュアル理解能力で人気があり、様々な端末デバイスに適しています。阿里雲の値下げは、インフラストラクチャの最適化とモデル呼び出し量の増加によるものです。
【AiBase要約:】
🌟 阿里雲Qwen-VLシリーズモデルが80%以上値下げされ、コストパフォーマンスが大幅に向上しました。
🚀 1元で720P画像600枚を処理でき、ユーザーのコストを大幅に削減します。
💡 新しいKVキャッシュ課金モデルにより、API使用料金がさらに削減されます。