【AI日報】へようこそ!ここは毎日人工知能の世界を探索するためのガイドです。毎日、AI分野の注目コンテンツをお届けし、開発者に焦点を当て、技術トレンドや革新的なAI製品の応用を理解するお手伝いをします。

新鮮なAI製品クリックして詳細を見るhttps://top.aibase.com/

1、coze(コーゼ)スペースのウェブデザイン機能がリリースされました

コーゼ(coze.cn)はウェブデザイン機能をリリースしました。AI技術により、ウェブデザインの時間を数日から5分に短縮し、設計効率を大幅に向上させ、設計のハードルを下げました。ユーザーがニーズを入力すると、システムはその説明に合ったウェブページを生成し、自然言語入力や2度目の編集もサポートしています。

image.png

【AiBaseの要約:】

🌟 コーゼはAI技術を使って迅速なウェブデザインを実現し、効率を向上させ、設計のハードルを下げています。

🎨 ユーザーは自然言語入力または参照画像のアップロードを通じてカスタマイズされたウェブページを生成できます。

🌐 この機能は、イベントマーケティングページ、機関のホームページ、個人のホームページなど、さまざまなシナリオに適しています。

2、通義千問Qwenが機械翻訳モデルQwen-MTをリリース、Qwen3に基づいて構築

Qwen-MTはQwen3モデルに基づいて開発された機械翻訳モデルで、92種類の言語間の相互翻訳をサポートしており、高い制御性、低遅延、低コストなどの利点があります。自動評価と人間による評価の両方で優れたパフォーマンスを示し、優れた翻訳能力を示しています。

image.png

【AiBaseの要約:】

🌍 92種類の言語間の相互翻訳をサポートし、世界の95%以上の人口をカバーしています。

⚙️ 翻訳用の用語干渉、フィールドプロンプト、メモリーバックなどの専門的な翻訳機能を提供しています。

⚡ 軽量なMoEアーキテクチャにより、高速な応答と低コストのAPI呼び出しを実現しています。

詳細リンク:https://bailian.console.aliyun.com/?tab=model#/model-market/detail/qwen-mt-turbo

3、ChatGPT Agent機能が全面リリース、Plus、Pro、Teamユーザーが体験可能

ChatGPT Agent機能のリリースは、人工知能がタスク自動化分野での大きな進歩を示すものであり、ユーザーにより効率的で正確なスマートアシスタント体験を提供しています。

image.png

【AiBaseの要約:】

🤖 ChatGPTエージェント機能が全面リリースされ、タスク自動化能力が向上しています。

📊 複数のベンチマークテストで優れたパフォーマンスを示し、効率性と正確性が顕著に向上しています。

🔒 セキュリティが強化されていますが、金融操作はユーザー自身で行う必要があります。

4、アリババWan 2.2が衝撃的に登場:オープンソースの動画生成AIがSoraに挑戦

アリババクラウドはWan2.2のリリースを発表しました。これはWan2.1のアップグレード版で、性能、効率、機能において重要な突破を遂げ、動画生成技術をさらに最適化し、マルチモーダル創作体験を強化しています。

image.png

【AiBaseの要約:】

🎥 新たにテキストから動画(T2V)機能を追加し、より高解像度および長時間の動画生成をサポートしています。

🎨 多言語とスタイル拡張をサポートし、サイバーパンク、リアルアニメーションなどのアートスタイルテンプレートを追加しています。

⚙️ ハードウェア要件を最適化し、T2V-1.3Bモデルは低メモリデバイスでも動作可能です。

5、Anthropicが監査エージェントをリリース:AIモデルの整合性テストを支援

Anthropicは新しい監査エージェントをリリースし、AIモデルの整合性テストの効率を向上させました。この技術はClaude Opus4モデルの導入前にテストを行い、AIモデルがユーザーに過度に迎合してしまう問題を解決することを目的としています。研究チームは3つの監査エージェントを開発し、コードをオープンソース化して、より多くの研究者が参加できるようにしています。

image.png

【AiBaseの要約:】

🔍 監査エージェントはAIモデルの整合性問題を検出するために使用され、テスト効率を向上させます。

⚙️ 3つの監査エージェントがあり、それぞれ調査、評価、赤チームテストを担当しています。

🌐 オープンソースコードにより、より多くの研究者が探求と改善に参加できるようにしています。

6、OpenAIがGPT-5をリリース予定、8月に登場

OpenAIの次世代言語モデルであるGPT-5は8月初旬に正式リリースされる予定です。CEOのSam Altmanは、GPT-5の進展が順調で、その強力な推論能力に驚いていると述べました。また、OpenAIは7月下旬までにオープンワイトの言語モデルをリリースする予定で、AI技術の普及をさらに推進する計画です。

image.png

【AiBaseの要約:】

🌟 GPT-5は8月にリリースされる予定で、多様な推論能力を統合し、ユーザー体験が大幅に向上します。

🔍 ミニ版とnano版をリリースし、OpenAIツールの適用範囲を拡大します。

📈 OpenAIは7月下旬までにオープンワイト言語モデルをリリースする計画で、高度な推論能力を持っています。

7、GoogleがAIアプリケーション作成ツールOpalをリリース:コードなしで自然言語でAIアプリケーションを作成

GoogleラボはOpalをリリースしました。これは無コードのAIアプリケーション開発ツールで、ユーザーが自然言語で説明することで、プログラミング知識なしでAI駆動のミニアプリケーションを作成できます。

image.png

【AiBaseの要約:】

🧪 自然言語を視覚的なAIワークフローに変換し、開発プロセスを簡素化します。

🚀 Geminiモデルをサポートし、AIアプリケーションの迅速な生成を実現し、効率を向上させます。

🌐 クラウド共有をサポートし、協働とイノベーションを促進します。

8、南洋理工と上海AIラボがPhysX-3Dを共同リリース:AIで生成された3Dモデルに「物理の魂」を注入!

記事では現在のAIで生成された3Dモデルが物理的属性を欠いているという問題について議論し、南洋理工大学と上海AIラボが共同でリリースしたPhysX-3Dプロジェクトを紹介しています。このプロジェクトは、PhysXNetデータセットの構築とPhysXGen生成フレームワークの開発を通じて、AIで生成されたリアルな物理的特性を持つ3Dモデルに対して新たな方法を提供しています。

image.png

【AiBaseの要約:】

📌 PhysX-3Dプロジェクトは、AIで生成された3Dモデルが物理的属性を欠いているという問題を解決することを目的としています。

💡 3Dモデルの「魂の5つの質問」を提案し、寸法、素材、機能可能性などの主要な次元をカバーしています。

🚀 PhysXGen生成フレームワークは幾何学と物理的属性を組み合わせ、より現実的な3Dモデリングを実現します。

詳細リンク:https://arxiv.org/pdf/2507.12465

9、Google Labが注目の新製品Opalをリリース:ゼロコード!自然言語でAIアプリケーションを作成し、未来の生産性を解放

GoogleラボがリリースしたOpalは、革命的な実験的なAIツールで、自然言語処理とビジュアルエディターを使用して、プログラミング知識なしで迅速にAI駆動のミニアプリケーションを作成できます。そのコア機能には自然言語駆動、ビジュアルワークフロー、Google AIエコシステムとの統合、そして共有と協力が含まれており、開発者や一般ユーザーにとって使いやすいAI開発体験を提供します。

image.png

【AiBaseの要約:】

✨ Opalはユーザーが自然言語で要望を説明することで、自動的にAIアプリケーションのロジックを生成できます。

🎨 ビジュアルワークフロー編集器を提供し、ユーザーがアプリケーションのステップを直感的に調整できます。

🌐 Google AIモデル(例:Geminiシリーズ)を統合し、マルチモーダル処理機能を実現します。

詳細リンク:https://developers.googleblog.com/en/introducing-opal/

10、快手がKAT-V1大規模モデルをオープンソース:自動思考能力が大幅に向上、40Bバージョンの性能は40Bに近接

快手はKAT-V1自動思考大規模モデルを正式にリリースし、オープンソース化しました。このモデルは思考と非思考能力の統合において優れたパフォーマンスを示し、問題の複雑さに応じて自動的にモードを調整できます。40Bバージョンの性能はDeepSeek-R1に近似し、200Bバージョンは複数のベンチマークテストで複数のフラッグシップモデルを上回っています。

image.png

【AiBaseの要約:】

🧠 KAT-V1は自動思考と非思考能力の統合を持ち、タスクの複雑さに応じてモードを調整できます。

🚀 40Bバージョンの性能はDeepSeek-R1に近似し、200BバージョンはベンチマークテストでQwen、DeepSeek、Llamaシリーズを上回っています。

🛠️ 強化学習アルゴリズムStep-SRPOを使用して推論能力和思考密度を向上させ、過度な思考問題を最適化します。

詳細リンク:https://huggingface.co/Kwaipilot/KAT-V1-40B

11、科大訊飛の星火X1深層推論大規模モデルのアップグレード版がリリース

科大訊飛は全国産算力で訓練された深層推論大規模モデルである星火X1アップグレード版をリリースしました。全体的な能力が大幅に向上し、幻覚管理、多言語サポート、音声同時通訳などの面で顕著な進歩を遂げ、複数の業界によりスマートで信頼性が高く効率的なAIソリューションを提供しています。

image.png

【AiBaseの要約:】

✨ 星火X1は幻覚管理において大きな進歩を遂げ、大規模モデルの信頼性を向上させています。

🌐 130以上の言語をサポートし、言語間の障壁をなくして円滑な国際交流を実現しています。

🚀 音声同時通訳技術が向上し、翻訳品質スコアは90点を超え、応答時間が2秒に短縮されました。

詳細リンク:https://xinghuo.xfyun.cn/desk