OpenAIは、チャットボットChatGPTが désormais「見る、聞く、話す」ことができるようになったと発表しました。ユーザーは音声でChatGPTとやり取りし、画像を共有して分析できるようになります。これはGPT-4導入以来、OpenAIにとって最大の改善であり、今後2週間以内に有料ユーザー向けに展開される予定です。
関連AIニュースの推奨

AIニュース: 12306 MCP Serverがリリース;BaiduがAI検索アシスタントTizzy.aiを発表;ChatGPTの音声録音モードがPlusユーザー向けに解放
1.百度が無広告AI検索「Tizzy.ai」をリリース。2.12306が列車検索エンジンをオープンソース化。3.ChatGPT音声機能をPlusユーザーに開放。4.5分でWebアプリ構築可能なSaaSテンプレート「FireGEO」登場。5.GitHubドキュメント生成ツール「ReadMeX」無料公開。6.百度AIにビデオ通話機能追加。7.成長型AIデジタルパートナー「ベラ」発表。8.OpenAIがレポート自動作成機能を準備中。9.MidJourneyが企業向けAPI提供予定。10.MiniMaxが自然言語でECサイト構築可能に。11.Claude Sonnet4モデルが再リリース。....

AIが言語のコミュニケーションに与える影響!私たちの日常的な会話はますますGPT用語が増えている
ドイツ研究で、AIが人間の言語に影響を与え、ChatGPTなどのツールが「GPT語彙」を生み出していることが判明。AIが好む語彙の使用増加が確認され、人間は無意識にAIの言語パターンを模倣していることが示された。....

テスラGrokアシスタントにHeyk音声起動機能が登場!手動操作から解放!
テスラのAIアシスタントGrokに「Hey Grok」音声起動機能追加予定。AMDチップ搭載車種限定で、Wi-Fi接続が必要。現在は車両操作不可だが、近く実装予定。....

ChatGPTに音声変換機能が追加!オフィスの強力なツールで会議の要点を簡単に記録
OpenAIはmacOS有料ユーザー向けにChatGPT音声文字起こし機能をリリース。120分の録音を文字化し、タイムスタンプ付きの記録と要約を自動生成。GPT-4o契約者のみ利用可能で、録音データは自動削除される(改善オプション有効時を除く)。企業/教育ユーザーはデフォルトでトレーニング対象外。Windows/Android/Web版は未対応。....

OpenAIが大作を出す!ChatGPTがECサイトに変身し、直接手数料を徴収
OpenAIはChatGPTで商品販売と手数料収益を計画。Shopifyと連携し、決済システムを開発中。無料ユーザーからも収益化し、Googleのビジネスモデルに挑戦。戦略転換を示す。....

ChatGPTの録音モードがPlusユーザーに全面的に開放され、macOSデスクトップアプリで利用可能に
OpenAIはChatGPTの録音モードを全面的にリリースし、PlusユーザーはmacOSデスクトップでこの機能を利用できます。このモードは音声のリアルタイム変換や内容の要約に対応しており、会議記録やブレインストーミングなどのシナリオに特に適しています。端末側での処理によりプライバシーが確保されるという特徴があります。現在はmacOSプラットフォームに限定されていますが、今後モバイル端末への拡張も検討されているようです。この機能はOpenAIが音声インタラクション分野において持つ技術的な優位性を示しており、AI生産性アプリケーションの新たな基準を設定しています。

百度AIアシスタントがビデオ通話機能を提供し、リアルタイムでビデオコミュニケーションを実現
百度AIアシスタントが「ビデオ通話」新機能をリリース。百度APPでAIとリアルタイムビデオ交流が可能に。生活探索、服装アドバイス、ペット行動分析、感情ケアの4シーン対応。方言認識もサポートし、高齢者も簡単利用可。AIアシスタントが生活パートナーへ進化。....

OpenAIが大規模発表!Agent Modeでブラウザ+クラウドファイルを一括操作してスマートなレポートを瞬時に生成
OpenAIは革新的なAgent Modeをリリース予定で、Operatorのブラウザ操作とDeep Researchのファイル分析機能を統合しています。このモードは自動的なウェブサイト操作(フォーム入力や検索など)およびクラウドファイル分析(Google Driveなどのプラットフォームに対応)をサポートし、プロフェッショナルなレポートの作成が可能です。核心技術にはCUAとo3モデルが採用されており、GUIインタラクティブ性とデータ分析能力を備え、複数のセキュリティ保護機能も搭載しています。個人の旅行プランニングや企業の市場分析などさまざまなシナリオに適しており、今後はさらに拡張される予定です。

AIニュース:テンセントはAIプログラミングツールTRAE2.0のリリースを発表;Mistralは音声モデルVoxtralを大幅にリリース;月の暗面はKimi K2 APIの遅さについてコメント
1.字节跳动TRAE2.0に音声機能追加 2.Mistralが多言語対応Voxtral発表 3.Kimi API速度改善中 4.昆仑万維がAgentOrchestra公開 5.Thinking Machines Labが20億ドル調達 6.Kimi-2がGPT-4.1超え 7.TRAEがKimi-K2サービス開始 8.字节跳动がPOLARISをOSS化 9.ima知識庫がWeb版リリース....
