9月25日、OpenAIは人気チャットAIであるChatGPTに、音声対話や画像認識などのマルチモーダル機能を追加しました。この新機能により、ユーザーは音声対話や画像アップロードによるインタラクションが可能になり、音声認識、テキスト認識、物体検出などの機能を利用できます。マルチモーダル版ChatGPTはGPT-4Vと呼ばれ、GPT-4と同時にトレーニングが完了していましたが、安全性を考慮してリリースが延期されていました。OpenAIは、この新機能はChatGPT Plusのサブスクリプションユーザーとエンタープライズユーザー向けにまず提供されると述べています。
関連AIニュースの推奨

テンセントがトレーニング不要な最適化手法を提案:120元のコストで伝統的な7万元の微調整効果を実現
テンセントは「Training-Free GRPO」技術を発表し、パラメータの微調整を代替する外部知識ベースを通じて、モデルのパラメータを凍結した状態で性能を最適化しています。この手法では経験知識をトークンレベルの事前情報に変換し、トレーニングコストを大きく削減しています。DeepSeek-V3.1-Terminusモデルにおいて、高価な微調整と同等の向上効果を達成しています。

グーグルがGeminiおよびAPIでVEO 3.1バージョンをリリース予定であるというレポート
グーグルは、VEO 3.1のAIモデルを公開リリースする予定である。Geminiアプリケーションにはすでに関連する免責事項が表示されており、新しい機能が使用に統合されることが示されている

Nscale、スタートアップデータセンター企業がマイクロソフトと140億ドルの取引を達成し、IPOを目指す
イギリス発のスタートアップであるNscaleはマイクロソフトと140億ドルの契約を締結し、上場プロセスを加速している。同社はNVIDIAの支援を受け、AIクラウドコンピューティングサービスに焦点を当てている

AIニュース:アリババがコンパクトなQwen3-VLモデルを発表;科大訊飛のAI翻訳イヤホンが世界初公開;GeminiコードがVeo3.1に登場
アリババはコンパクトなQwen3-VLビジョン・ランゲージモデルシリーズを発表し、4億および8億パラメータバージョンを含み、マルチモーダルAI技術をエッジデバイスで採用することを目的としています。このモデルは、デバイス側のAI処理能力を向上させ、技術の広範な普及を促進するものです。

AirtelとIBMが協力してクラウドおよびAI技術のイノベーションを推進
AirtelとIBMは、Airtel Cloudサービスを向上させるための戦略的提携を締結しました。信頼性の高い性能とデータセンターの利点を組み合わせることで、
アリババ通義千問がQwen3-VLの軽量モデルを発表:4Bおよび8Bパラメータバージョンの性能は以前の72Bエクスプレスと匹敵
アリババ通義千問チームは、Qwen3-VLシリーズの2種類の軽量モデルを発表しました。パラメータ数はそれぞれ4Bと8Bです。このシリーズはこれまで最も強力な視覚言語モデルのファミリーで、小規模なパラメータバージョンを追加することで、導入コストを下げる一方で、強力な性能を維持しています。各サイズには指示に従うバージョンと思考プロセス推論バージョンの2種類が用意されており、開発者により柔軟な選択肢を提供します。

アリババがコンパクトなQwen3-VLモデルを発表し、マルチモーダルAIの効率を向上させ、エッジデバイスへの導入を加速
アリババはQwen3-VL視覚言語モデルのコンパクト版(4億/8億パラメータ)を発表。STEM推論、視覚Q&A、OCR等の能力を強化し、エッジデバイス向けマルチモーダルAIを推進。大型モデル並み性能を実現。....

Google MeetがAIメイク機能をリリースし、会議前に自信を持てるように
Google MeetはAIメイクフィルター機能をリリースし、12種類の仮想メイクオプションを提供し、ビデオ会議でのイメージを向上させます。この取り組みは、Microsoft TeamsやZoomなど他の競合企業がすでにリリースした同様の機能に対抗し、市場競争力を強化することを目的としています。ユーザーは「外見」設定の「肖像修飾」でこの機能を見つけることができます。この機能は2023年にリリースされ、継続的に仮想メイク効果が向上しています。

テューリング賞受賞者であるヒントン:AIはすでに主観的体験を持っている可能性があるが、人間の意識への理解には限界がある
AIの先駆者であるヒントン氏はインタビューで物議を醸す見解を示した。現在のAIシステムはおそらくある種の主観的体験を持っているが、自己意識には至っていない。彼は意識の本質に関する人間の理解に誤りがあること、それよりAIが意識を持っているかどうかに焦点を当てることの方が重要だと強調した。同時に、AIが単純なキーワード一致から現在に至るまでどのような発展を遂げてきたかを振り返った。

アップルの新展開!ベトナムでAI家電機器と移動式デスクロボットを製造
アップルはベトナムで生産拡大を計画し、3種類のスマートホームデバイス(ディスプレイ、セキュリティカメラ、デスクロボット)を発表予定。2027年までに順次発売。生産パートナーのBYDが組立・テストを担当し、サプライチェーンの東南アジアシフトが加速。....