Figure、新型スマートモデルHelixを発表、人型ロボットへの音声コマンドによる家事対応を実現

AIbase基地
この記事はAIbaseデイリーからのものです
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
モデルの訓練・評価・テスト用大規模データセット・ベンチマーク
ユーザーに各種文書のテキスト抽出・文書処理を提供、汎用・カスタムシーン対応の多様な文書処理をサポート
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
AMDはOpenAIと戦略的協力関係を結び、AIハードウェアエコシステムの発展を共同で推進しています。OpenAIはAMDの6GWチップを購入し、株式取得権を低価格で得ることになります。この情報が発表されると、AMDの株価は40%近く上昇し、市場からは前向きな反応があり、投資家がAMDがAI分野での潜在能力に期待していることが示されています。
OpenAIが新世代の動画生成モデルSora2APIを発表しました。テキストや画像を用いて音声付きの動的動画を生成できるこの技術は、マルチモーダルな拡散モデルに基づいており、数年の訓練を通じて3次元空間の理解、運動モデリング、シーンの連続性において優れた性能を発揮しています。テキストから動画への生成品質が著しく向上しています。
OpenAIは、最強のAIモデルであるGPT-5Pro APIを正式にリリースしました。このモデルは開発者向けに全面的に開放され、40万トークンの文脈窓をサポートし、複雑なテキストを処理できるため、研究執筆や法的分析などの分野で利用可能です。また、これによりさまざまな業界での革新が促進される見込みです。
スタンフォード大学がトレーニング可能なインテリジェントエージェントフレームワークAgentFlowを発表しました。モジュール化設計によりAIの意思決定能力を向上させます。フレームワークには、プランナー、エグゼキューター、バリデーター、ジェネレーターの4つのコアモジュールが含まれており、明示的なメモリによって連携します。プランナーはサブゴールを設定しツールを選択し、エグゼキューターはツールを呼び出し、バリデーターはプロセスの連続性を判断し、ループ型のインテリジェント意思決定システムを形成します。
AIダイジェストはVeo 3.1のアップデートを紹介:キャラクター一貫性保持とマルチシーンストーリー生成機能を追加。動画品質と長さが向上し、コンテンツクリエイターを支援。....
アントグループが初の1兆パラメータOSSモデル「Ling-1T」を発表。推論・コード生成・数学計算で優れた性能を発揮し、中国AIの新たな基準を確立。....
OpenAIはDevDay2025カンファレンスで、ChatGPTにアプリケーションシステムを導入することを発表しました。ユーザーは会話の中で直接サードパーティのサービスを使用でき、ホテル予約やデザイン生成、音楽再生など、画面を切り替えることなく利用可能です。これにより、ChatGPTは単なる対話ツールから機能豊富なアプリケーションプラットフォームへと進化し、ユーザーがAIと対話する方法を完全に変革するものです。
Veo 3.1バージョンアップ:動画生成時間は1分まで延長され、キャラクターの一貫性が強化されて人物の連続性が確保され、出力品質はネイティブ1080pに向上し、映画級カラーリングやスタイルテンプレートが追加され、複数のクロームやプロンプトに対応する機能が搭載され、クリエイターが効率的にプロフェッショナルな映像を作成できるように支援します。
IBMとAnthropicが提携し、ClaudeをIBMの開発環境に統合。一部顧客に先行提供中。AI活用ガイドも共同で発表。....
1Password は、AI エージェントがウェブサイトを自動的に閲覧する際のユーザー認証情報の悪用や漏洩のセキュリティリスクに対応する "Secure Agentic Autofill" 機能をリリースしました。このソリューションは、機密情報を保護し、パスワードが AI ツールや大規模言語モデルによって不適切に記憶または使用されることを防ぐことを目的としています。