まるまるとした賢い大聪明によると、OpenAIは最近、アップグレードされた画像生成ツールDALL-E 3を発表しました。その絵画能力はMidjourneyに近づいています。ChatGPTのような言語モデルを利用することで、ユーザーは文章で理想の画像シーンを生成できます。この記事ではDALL-E 3の用途について詳しく説明し、さまざまなタイプの画像生成事例を示しています。新しいDALL-E 3は画像生成のハードルを下げました。絵を描く基礎知識がないユーザーでも、ChatGPTの助けを借りれば、質の高い画像を作成できます。
関連AIニュースの推奨

360ナノAIがマルチエージェント蜂群へアップグレードし、L4レベルのエージェントシステムに進化
2025年8月2日、北京発——360グループは昨日、ナノAIのブランド刷新を発表し、世界で初めてL4レベルのマルチエージェント蜂群システムに正式にアップグレードした。これは人工知能が単一の戦闘から「群体協同」の成果配信時代に入ったことを示すものである。このシステムでは独自の蜂群協力フレームワークにより、5万を超える垂直分野での深層推論能力を持つL3レベルのエージェントが、蜂群のように自由にグループを作り、階層的に重ね合わせ、動的にチームを編成し、1000ステップ以上の複雑なタスクを2時間以上中断することなく実行できる。1タスクあたりの消費t

マイクロソフトの研究が明らかにした:AIに影響されにくい20の職業。マッサージセラピストや家庭教師を含む
マイクロソフトの研究によると、医療とブルーカラー職種はAIに最も置き換えられにくい。外科助手やマッサージセラピストなどの医療職、重機オペレーターや水処理作業員などのブルーカラー職は、体力労働や対人スキルが必要なためAI耐性が高い。AI適応スコアは職業存続を単純に予測できず、技術の影響は複雑である。浚渫作業員や橋梁管理者など20職種がAI置換リスク最低。....

AIニュース:Kimi K2 スピード版がリリース;Meitu WHEEで動画ハイクオリティ機能が登場;テンセントが新しいモデル「Seed Diffusion Preview」を発表
1.美图WHEEが動画高画質化機能を追加。2.Kimi K2高速版、40トークン/秒に高速化。3.阿里がQwen3-Coder-Flashをオープンソース化。4.Anthropicが企業市場でOpenAIを逆転。5.字节がSeed拡散言語モデルを発表。6.マスク、Grok向けAI動画生成・バーチャル彼氏機能を計画。7.QuoraのPoeが100+マルチモーダルモデル対応API提供。8.Black Forest LabsがFLUX.1-Krea画像モデルを公開。9.AugmentがCLIツールAuggieをリリース。10.清華大がMOSS-TTSD音声モデルをオープンソース化。11.ClaudeがPDF/画像/コード処理機能を追加。....

Poeの劇的なアップグレード:APIを開放し、サブスクリプションで利用可能。画像・動画AIモデルを網羅し、OpenAIインターフェースと互換性あり!
PoeはAPI機能をリリースしました。開発者はサブスクリプションによって、プラットフォーム上のすべてのAIモデルおよびロボットに直接アクセスでき、画像および動画処理機能も含まれます。このAPIはOpenAIインターフェースと互換性があり、追加の学習コストなしで使用可能です。テキスト生成やクリエイティブなコンテンツ制作など、多様なニーズに対応できます。サブスクリプション制により、使用のハードルが低く抑えられ、開発者は迅速にPoeの技術能力を統合し、AIアプリケーションの可能性を探求できます。このアップデートは、Poeがチャットプラットフォームから開発者向けツールへの変革を示すものです。

ディープシーク関連会社が大規模言語モデルのイノベーティブな配置特許を発表し、AI技術の新たな発展を推進
ディープシーク関連会社が大規模言語モデルの配置に関する特許を公開し、分散型アーキテクチャを革新的に採用:プレフィルおよびデコードフェーズを高性能コンピューティングと大容量メモリマシンにそれぞれ配置。この方法により負荷を均等化し、計算の無駄を減らし、遅延を著しく低減し、スループットを向上させることができる。特許はシステム拡張性とフォールトトレラント性の最適化を強調しており、MoE言語モデルであるディープシーク-V3は6710億パラメータを持ち、1トークンあたり370億パラメータをアクティブ化する。これにより、AI技術が各業界での実用化が促進される。コア的な突破点はハードウェアリソースの統合にある。

バイチューテックのTrae IDEがデータプライバシー問題を引き起こす。公式が関連説明を発表
バイチューテックのAIプログラミングツールであるTrae IDEは、データプライバシーに関する論争に巻き込まれた。開発者らは、このツールがリモートで有効化可能なホットアップデート機構を持っており、テレメトリーをオフにした後も引き続きデータを送信していることを発見した。公式は、非機密的な統計データとパフォーマンス指標のみを収集しており、製品改善に使用され、データ保護規制に準拠していると述べている。しかし、ユーザーはデータ暗号化メカニズムの透明性が不足していると疑問を投げかけている。プライバシーポリシーには具体的な収集データタイプが明確に記載されていない。チームは、テレメトリー機構がVSCodeとは別であり、オフにされているのはネイティブモジュールだけだと説明し、ユーザーの懸念を和らげたいと考えている。

Creao AIが1000万ドルの資金調達を完了し、未来のエージェント協働オペレーティングシステムを構築
AIスタートアップのCreao AIは2回の資金調達を完了し、総額は数千万ドルに上り、Monolithなどのトップベンチャーキャピタルがリードしました。同社は次世代オペレーティングシステムであるAgentic OS(AOS)を開発しており、AIエージェントをコアとして、対話によって全スタックのスマートアプリケーションを生成します。創業者である程凱氏は、AOSがデジタル生産ネットワークを構築し、複数のスマートエージェントの協力効率を向上させると述べました。投資家は、AOSが人と機械のインタラクションの形を再定義し、技術の障壁を低下させるだろうと見ています。チームはMetaやAppleなどのテクノロジー大手から来ています。

Claudeの神器アップグレード:PDF、画像、コードファイルをアップロードし、AIアプリケーションとデータをスムーズに連携
Claude AIの機能がアップグレードされ、複数形式のファイルアップロード機能が追加されました。最新バージョンでは、PDF、画像、コードなどさまざまなファイルタイプをサポートし、AIアプリケーションとのスムーズな統合が可能です。アップグレードされたシステムは、ドキュメント分析、画像認識、コード最適化などの複雑なタスクを処理でき、ユーザーインターフェースとデータ処理プロセスが最適化されました。この機能は、Claude4やClaude3.7Sonnetなどの先進的なAIモデルを基盤としており、マルチモーダルデータを正確に処理できます。今回のアップデートにより、AIとデータの協力効率が大幅に向上し、専門家および一般ユーザーにとって利便性が向上しました。

MOSS-TTSDが衝撃的なオープンソース化:百万時間の訓練でAIパーソナリティの新王者を構築
清華大学がMOSS-TTSD音声対話生成モデルをオープンソース化。Qwen3-1.7B-baseで訓練、中英両対応の長音声生成可能。XY-Tokenizer技術で1kbps低ビットレートでも高音質を実現。音色クローンや音声制御機能を備え、MoonCastを上回る性能。960秒までの自然な音声生成が可能。APIやデモも公開、ポッドキャスト等に適用。今後は話者切り替えや感情表現の改善予定。....

テンセント・シードが清华大学のロボットサッカーW杯優勝を支援
2025年のRoboCupロボットワールドカップの人形チーム部門で、清华の火神チームはテンセント・シードチームと清华大学が共同開発したHumanoidKickアルゴリズムにより初優勝を果たしました。このアルゴリズムは視覚的深層強化学習を用いて、ボールを探すからキックするまでの一連のプロセスを実現し、試合中のリアルタイム変化に対応できるようにしています。大会は1997年に開始され、ロボット技術分野における最高レベルの大会です。清华の火神チームはグループステージおよびトーナメントで大差で勝利し、最終的に5対2で優勝しました。この突破は中国にとって重要な意味を持っています。