DALL·E3画像生成モデルに67種類の新しい画像スタイルが追加されました。ユーザーは縦横比、スタイル、アスペクト比を調整して、より詳細な制御が可能になります。このアップデートは現在グレーテスト段階にあり、まもなく全ユーザーに公開される予定です。
同時に、OpenAIのDALL·E3は画像メタデータに透かしを追加し、コンテンツの出典と信頼性の標準化をサポートします。
DALL·E3画像生成モデルに67種類の新しい画像スタイルが追加されました。ユーザーは縦横比、スタイル、アスペクト比を調整して、より詳細な制御が可能になります。このアップデートは現在グレーテスト段階にあり、まもなく全ユーザーに公開される予定です。
同時に、OpenAIのDALL·E3は画像メタデータに透かしを追加し、コンテンツの出典と信頼性の標準化をサポートします。
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
网易科技報道によると、京東はエージェントインテリジェンス分野における展開を全面的に加速させている。京東傘下の大規模エージェントインテリジェンスブランドであるJoyInsideは、十社を超えるトップロボット企業と協力関係を構築し、京東がスマートロボット市場を制覇するための重要なエンジンとなっている。情報筋によると、JoyInsideはJD大規模モデルによって技術的支援を受け、ロボットと消費者との知能的対話能力を専門としており、その製品戦略は「1人1匹の犬1つのおもちゃ」のシナリオアプリケーションに焦点を当てている。このブランドが登場して以来、複数のサブセクターでトップ企業が参入していることが成功事例として認められている。
最近、台湾の鴻海精密工業株式会社(通称:フォックスコン)は国家知識産権局商標局に「FoxBrain」の商標登録申請を行いました。このAI推論大規模モデルはファーウェイが初めて挑戦したものです。また、台湾で初めての同種類のAIモデルでもあります。公開された情報によると、この商標の国際分類は科学機器であり、現在は「実質審査待ち」の状態です。「FoxBrain」は鴻海研究院が主力で開発したAI推論大規模モデルで、データ分析などを含みます。
智譜AIは最新版の汎用視覚モデルであるGLM-4.1V-Thinkingを正式にオープンソース化しました。GLM-4Vアーキテクチャに基づき、思考チェーン推論メカニズムが追加され、複雑な認知タスクの能力が顕著に向上しています。このモデルは画像、動画、ドキュメントなどのマルチモーダル入力をサポートし、長時間動画の理解、画像質問応答、科目問題の解法、文字認識、ドキュメント解釈、Grounding、GUIエージェント、コード生成など多様なシナリオに長けており、様々な業界への応用ニーズをカバーしています。GLM-4.1V-9B-Thinkin
【AIニュース】へようこそ!ここは毎日人工知能世界を探索するためのガイドです。毎日、AI分野の注目情報をお届けし、開発者に焦点を当てて技術トレンドを理解し、革新的なAI製品の応用を紹介します。新鮮なAI製品については、以下のリンクから詳しくご確認ください:https://top.aibase.com/1、オープンソースのエンドツーエンド音声大規模モデル「Step-Audio-AQAA」:音声を聞き取って自然な音声を生成する「Step-Audio-AQAA」は、オープンソースのエンドツーエンド音声大規模モデルです。