AIデイリーニュース：百度が革新的な「新検索」を発表；Lumaがレンズモーションコントロール機能を追加；ComfyUIが画像から動画への変換と表情編集に対応；xAIが世界最強のAIトレーニングシステムColossusを公開

【AI日報】へようこそ！ここは、あなたが毎日人工知能の世界を探求するためのガイドです。毎日、AI分野のホットな話題をお届けし、開発者に焦点を当て、技術トレンドの把握や革新的なAI製品の応用に関する情報を提供します。

最新のAI製品詳細はこちら:https://top.aibase.com/

1、百度「文心一言」アプリが「文小言」に名称変更：9月には文心大模型4.0を無料で利用可能に

百度は、人工知能アプリケーション「文心一言」アプリを大幅に更新し、新しいバージョン4.0.0をリリース、正式名称を「文小言」に変更しました。新バージョンでは機能が大幅に向上し、より豊富な使用シナリオを提供します。ユーザーは、検索、創作、チャットなど、多様なAI機能を利用できます。特に、質問、おしゃべり、記事作成、画像作成、タスク割り当てなど、5つの主要なシナリオ機能が追加されました。百度は文心4.0大規模モデルの利用を無料で開放し、会員サービスの割引も提供します。

微信截图_20240904081429.png

【AiBase要約:】
🚀 文小言アプリの機能が大幅に向上し、より豊富な使用シナリオを提供。
💡 新バージョンでは、質問、おしゃべり、記事作成、画像作成、タスク割り当てなど、5つの主要なシナリオ機能を追加。
🎁 百度は文心4.0大規模モデルの利用を無料で開放し、会員サービスの割引を提供。

2、LumaがDream Machine 1.6をリリース：レンズモーション制御機能を追加し、ビデオ生成により「映画的」な表現を実現！

Luma AIが最新リリースしたDream Machine 1.6バージョンは、AIビデオ生成技術に驚きの進化をもたらしました。12種類の異なるカメラ動作制御機能を追加し、創作ツールの制御能力を大幅に向上させました。ユーザーからのフィードバックも好意的で、新機能によって時間の節約とカメラ動作の幅とダイナミック効果の向上が実現したと評価されています。新バージョンは、より高品質でリアルなテキストからビデオへの生成体験を提供し、注目に値する選択肢です。

【AiBase要約:】
⚙️ 12種類の異なるカメラ動作制御機能を追加し、創作ツールの制御能力を向上。
🔍 ユーザーからのフィードバックは好意的で、新機能によって時間の節約とカメラ動作の幅とダイナミック効果の向上が実現。
🚀 新バージョンは、より高品質でリアルなテキストからビデオへの生成体験を提供し、ビデオコンテンツ制作に革命的な変化をもたらす。
詳細リンク:https://top.aibase.com/tool/luma-ai

3、マスク氏のxAIが世界最強のAIトレーニングシステム「Colossus」を発表

マスク氏のxAI社は、「Colossus」というAIトレーニングシステムを発表しました。10万枚のNvidia H100 GPUを搭載し、世界最強のAIトレーニングシステムと呼ばれています。これは、xAIがAI分野で重要な進歩を遂げたことを示しており、主力製品であるGrok-2の後継機種に強力な計算サポートを提供します。マスク氏は今後数ヶ月以内に、ColossusのGPU数を20万枚に倍増する計画で、その中には5万枚の新バージョンのH200 GPUが含まれます。

【AiBase要約:】
🌟 Colossusは10万枚のNvidia H100 GPUを搭載し、世界最強のAIトレーニングシステムと呼ばれている。
🚀 マスク氏はColossusのGPU数を20万枚に倍増する計画で、その中には5万枚の新バージョンのH200 GPUが含まれる。
💡 ColossusはxAIのGrok-2の後継機種に強力な計算サポートを提供し、年末までにリリースされる見込み。

4、静止画から動画生成はもう古い！ComfyUI-AdvancedLivePortraitなら表情も編集可能に

ComfyUI-AdvancedLivePortraitは、高度なリアルタイムアニメーション生成ツールです。強力な顔表情抽出と編集機能により、ビデオ制作をより生き生きとさせることができます。ユーザーは静止画から顔表情をキャプチャし、調整可能なパラメーターとして編集することで、キャラクターに新しい感情表現を与えることができます。また、編集後の表情を既存のビデオに挿入することもでき、柔軟な後期制作が可能です。リアルタイムプレビュー機能により、制作効率と精度が向上し、アニメーション制作のハードルが大幅に低くなります。ComfyUI-Managerに登録すれば、操作もより簡単になります。

【AiBase要約:】
🌟 ComfyUI-AdvancedLivePortraitは、静止画から顔表情を抽出・編集できる。
🎥 ユーザーは編集後の表情を既存のビデオにシームレスに挿入できる。
🚀 リアルタイムプレビュー機能により制作効率が向上し、アニメーション制作プロセスが簡素化される。
詳細リンク:https://top.aibase.com/tool/comfyui-advancedliveportrait

5、腾讯文档「スマートスキャン」機能がアップグレード：紙媒体をワンクリックで高解像度スキャン画像に変換

腾讯文档は最近、「スマートスキャン」機能をアップグレードし、ユーザーにより便利で効率的なドキュメント管理体験を提供することを目指しています。この新機能は、特に新学期に大量の資料や文書を扱う教師や学生にとって非常に便利です。ユーザーは腾讯文档のミニプログラムまたはアプリから「スマートスキャン」ツールにアクセスし、スキャンしてアーカイブ、手書き文字の削除、ID管理という3つの主要な機能を利用できます。

【AiBase要約:】
📄 スキャンしてアーカイブ：個人ノート、資料、PPTなどを高解像度スキャン画像に変換し、いつでも確認・共有が可能。
🖊️ 手書き文字の削除：テストの答案から手書きの跡を簡単に消去し、間違えた問題を整理し、学習効率を向上。
🔒 証明書管理：身分証明書、銀行カードなどの証明書を高解像度スキャン画像に変換し、便利な管理と安全なオプションを提供。

6、智谱と荣耀がAI大規模モデルで協業、端末側AIのスマート体験を探求

2024年9月2日、北京智譜華章科技有限公司と荣耀は北京でAI大規模モデル技術合同研究所の戦略的協力協定に調印しました。これは、両社の人工知能分野における協力が新たな段階に入ったことを示しています。この協力は、スマート端末分野における大規模モデル技術と応用イノベーションを推進し、ユーザーによりスマートで便利なAIサービスを提供し、各業界が汎用人工知能時代への移行を加速することを目指しています。

【AiBase要約:】
🤝 智譜と荣耀がAI大規模モデル技術合同研究所の協力協定に調印し、端末側AIのスマート体験を共同で探求。
🔍 智譜は認知知能大規模モデルの開発に注力し、荣耀は消費電子分野におけるAI技術のリーダー。
🚀 この協力は、大規模モデル技術の消費級端末産業への導入を推進し、各業界が汎用人工知能時代への移行を加速させることを目指す。

7、こっそり大規模アップデート！GoogleがChromeアドレスバーにGemini AIを密かに統合、@でAIアシスタントを呼び出せるように

Googleは最近、Chromeブラウザに大きなアップデートを行い、Gemini AIチャットボットをアドレスバーに統合しました。ユーザーは「@gemini」と入力するだけでGeminiにアクセスでき、シームレスなAIヘルプ体験を提供します。今回のアップデートは、GoogleがAIを中核製品として位置づけていることを明確に示しており、Gemini 1.5 Flash軽量版を使用することで、ユーザーはブラウザから直接AI機能にアクセスできるようになりました。

【AiBase要約:】
🚀 Gemini AIチャットボットがChromeアドレスバーに統合され、シームレスなAIヘルプ体験を提供。
🔍 Gemini 1.5 Flash版によりユーザーはAI機能に直接アクセス可能になり、プロ版ほどではないものの、大幅な改善が見られる。
📈 GoogleはAIを製品スイートに統合し、Chromeに多くのAI機能が導入されている。Geminiの統合は、AI優先戦略の大幅なアップグレードを示している。

8、Anthropicが最新機能Artifactsのシステムプロンプトを発表予定

Anthropic社は、研究者の疑問に応えるため、最新機能Artifactsのシステムプロンプトを発表する予定です。Artifacts機能は、ユーザーがClaudeチャットインターフェースの横にコードスニペットを実行することを可能にし、すべてのユーザーに公開されています。システムプロンプトの公開は、ユーザーがモデルの動作を理解するのに役立ち、AI開発者の透明性を促進します。

【AiBase要約:】
📝 Anthropic社は今後数週間以内に、ClaudeモデルのArtifactsシステムプロンプトを発表予定。
💻 Artifacts機能は、ユーザーがClaudeチャットインターフェースの横にコードスニペットを実行することを可能にし、すべてのユーザーに公開済み。
📜 システムプロンプトの公開は、ユーザーがモデルの動作を理解するのに役立ち、AI開発者の透明性を促進する。

9、Googleが新しいスタイル転送モデルRB-Modulationをオープンソース化

Googleは最近、RB-Modulationという新しいスタイル転送モデルをオープンソース化しました。この技術のブレークスルーは、人工知能画像処理分野で広く注目を集めています。RB-Modulationは、優れた画像スタイル変換能力を示すだけでなく、複数の重要な技術指標においても顕著な進歩を遂げています。このモデルのトレーニングフリー特性により、ユーザーは追加のトレーニングなしで、高品質の画像スタイルのパーソナライズされたカスタマイズを実現できます。

【AiBase要約:】
🔥 パーソナライズされた制御：RB-Modulationは、追加のトレーニングなしでスタイルとコンテンツのパーソナライズされた制御を実現。
💡 高忠実度：生成された画像は参照スタイルに忠実で、情報の漏洩を防ぐ。
🌟 強力なスタイル記述能力：必要な画像属性を正確に捉え、再現できる。
詳細リンク:https://huggingface.co/spaces/fffiloni/RB-Modulation

10、AI宿題代行ツールが登場：ロボットアームが代わりに筆記、学生の救世主か、教育の新たな懸念か？

この記事では、bilibiliの人気UP主である極客湾チームが開発したAI自動宿題ロボット「白日夢」を紹介し、幅広い注目と議論を呼んでいます。このロボットは、自動ページめくり、問題の自動解答、人の筆跡を模倣した筆記など、AI技術の教育分野における可能性を示しています。しかし、同時に教育の本質についての考察と疑問も提起しており、技術開発と教育の本来の目的のバランスを取る必要があることを示唆しています。

【AiBase要約:】
⚙️ 白日夢は極客湾チームが開発したAI筆記ロボットで、自動ページめくり、問題の自動解答、人の筆跡を模倣した筆記などの機能を備える。
💡 2.0バージョンでは、高度なCoreXY構造とAIモデルを採用し、安定性と精度が向上し、複数の科目の問題に対応可能。
🔮 白日夢の登場は、教育方法についての考察を促し、技術の進歩は教育の本来の目的とバランスを取り、技術が教育に役立つようにする必要がある。

11、AIが名作を再構築！ダークファンタジー版「美少女戦士セーラームーン」がネットで話題に、小紅書の一つの投稿が2.2万いいね！

最近、ダークファンタジー版「美少女戦士セーラームーン」が小紅書で話題になっています。AI技術によって名作アニメが再解釈され、芸術創作の無限の可能性を示しています。ダークなスタイルと「美少女戦士セーラームーン」の組み合わせは広く受け入れられ、イノベーションの歓迎と名作の再解釈への関心を示しています。AIによるリメイクの成功は、人々の想像力とノスタルジアを刺激し、今後の映画やアニメのリメイクに新たなインスピレーションを与えます。

【AiBase要約:】
🎨 ダークファンタジー版「美少女戦士セーラームーン」が小紅書で人気となり、AI技術が芸術創作分野における無限の可能性を示している。
🌙 AIによって生成された画像は、ぼやけた画質と暗い色調で、要素をグリム童話のダークなスタイルと融合させ、視聴者の郷愁を誘う。
🔮 ダークなスタイルと「美少女戦士セーラームーン」の組み合わせは広く受け入れられ、イノベーションの歓迎と名作の再解釈への関心を示している。

12、インテルのAI PCチップ「Lunar Lake」が発表