9月25日、OpenAIは人気チャットAIであるChatGPTに、音声対話や画像認識などのマルチモーダル機能を追加しました。この新機能により、ユーザーは音声対話や画像アップロードによるインタラクションが可能になり、音声認識、テキスト認識、物体検出などの機能を利用できます。マルチモーダル版ChatGPTはGPT-4Vと呼ばれ、GPT-4と同時にトレーニングが完了していましたが、安全性を考慮してリリースが延期されていました。OpenAIは、この新機能はChatGPT Plusのサブスクリプションユーザーとエンタープライズユーザー向けにまず提供されると述べています。
関連AIニュースの推奨

飛渡科技が峥嵘大モデルを発表しました。デジタルツインが知能の新しい時代を迎える!
飛渡科技が「峥嵘大モデル」を発表、国際評価プラットフォームCity3Dで優れた性能を発揮。災害シミュレーションや文化遺産保護に応用可能。API開放で業界の智能化を推進。....

Stream-Omni:さまざまなモードの組み合わせをサポートし、テキスト、ビジュアル、音声の統合を開始
中科院計算所がStream-Omniマルチモーダル大規模モデルを発表。テキスト・画像・音声の3モーダルに対応し、モーダル間アライメント技術により大規模データ依存を低減。音声とテキストのリアルタイム変換を実現。任意のモーダル組み合わせが可能で、特に画像理解と音声対話に優れる。論文とコードは公開済み。....

オープンソースAIデスクトップアシスタントのGlassが人気、会議のリアルタイム記録やインスピレーションのキャプチャ
2025年7月にオープンソースAIアシスタントGlassが人気に。Pickleチーム開発で、macOS対応、バックグラウンド動作が特徴。会議メモや学習ノートを自動整理し、プライバシー保護も。Apache2.0ライセンスでGitHubスター1.8k。Windows/Linux版や「デジタルクローン」機能の拡張予定。....

AIニュース:BilibiliがコードネームHのAIクリエイティブツールをリリースする可能性あり;Zhiyuanは「Naochiロボット」のLinx X2-Nを発表;Yushu Techが科创板に上場を目指す
B站は動画作成支援AI「H」を発表。智元は双形態ロボット「霊犀X2-N」を公開。宇樹科技は科創板IPOで120億評価。EarthMindが地球データ分析を革新。Gemini CLIが音声/動画処理機能を更新。macOS助手Glassがオープンソース化。Claudeが数学特化モデル「Neptune v3」を発表予定。GPT-5はマルチモデル統合でブレークスルーを目指す。....

ClaudeがClaude Neptune v3モデルを発表予定。数学能力が非常に強い
Anthropicが開発中のAIモデル「Claude Neptune v3」が注目を集めています。数学的推論能力に優れ、OpenAIやGoogleのトップモデルに匹敵する可能性があります。現在は内部テスト段階で、市場競争優位を目指しています。....

最強のワーカー!インドのオジサンが1枚の履歴書で5つのシリコンバレーAI給与を受ける
シリコンバレー企業でSoham Parekhが偽履歴で5社同時リモート勤務。AI面接支援ツール「CheatingDaddy」が話題に。同様の事例が他業界でも報告され、労働者の収入不安と職業倫理が議論されている。....

AIスター教則動画:ゼロコストでケニーワイの代数を語る マンション流量を簡単に換金
AIツールを使った有名人のイメージ動画作成と収益化方法を解説。企画から脚本作成、HeyGen等での動画生成、編集を経てSNSに投稿。広告収入や知識販売で収益化可能。肖像権に注意し、AI生成と明記が必須。編集スキルとSNS運用経験のある人向け。....

智元がナーリンX2-Nを発表: ロールアームの二つの形状に切り替え可能
智元社が哪吒ロボット「霊犀X2-N」を発表。二形態デザインが特徴で、車輪形態は効率的な移動と耐衝撃性、足型形態は12kgの荷物を運びながら障害物を越えられる。複雑な地形に対応可能で、優れたバランスと環境適応力を備える。....

保険業界が10年間の人工知能に関する州レベルの規制提案の中止に反対
米国保険業界は、AI州規制10年凍結案に強く反対。PIAなど現行の州規制体系崩壊を懸念、40州検事総長も消費者保護の観点から反対。AI定義の曖昧さが既存保険テックツールに悪影響を与えると指摘。....

テンセントがオープンソースの混元-A13B: ダイナミック推論の大規模モデル 会議できることが特徴
Tencentの新言語モデル「混元-A13B」をオープンソース化。800億パラメータのMoEアーキテクチャで、動的推論を採用。STEMデータに特化し、AIME2024で87.3%の精度。主流モデルと同等性能だが、一部結果に議論あり。....