本日、騰訊の「混元」はモデルマトリクスの全面的なアップグレードを正式に発表しました。これには「旗艦級高速推論モデル」である混元TurboS、「深層推論モデル」である混元T1が含まれ、さらにこれらのベースとして新たなモデル「T1-Vision(視覚深層推論モデル)」と「混元Voice(エンドツーエンドの音声通話モデル)」が登場しました。
また、「騰訊混元2.0」や「騰訊混元3D v2.5」、そして「混元ゲームビジュアル生成」などの一連のマルチモーダルモデルも同時に「アップデート」されました。このアップデートにより、「混元」はAI分野での競争力を強化し、マルチモーダル技術における新たな進展を示すものとなりました。
2025年腾讯雲AI産業応用サミットで、騰訊グループの上級執行副社長である湯道生氏は、混元TurboSモデルが国際的に認められたChatbot Arena評価プラットフォームで上位8位にランクインし、DeepSeekに次ぐ国内トップクラスのモデルとなったことを明らかにしました。TurboSはコードや数学などの理科分野での卓越した能力により、世界トップ10入りを果たしました。このモデルの優れたパフォーマンスは、革新的な事前学習および後学習技術に起因しており、理科推論能力が10%以上向上しています。
混元のもう一つの深層推論モデルであるT1も継続的に改善されており、最近では新しいアップデートがリリースされました。T1は競技数学や常識クイズなどの複数の領域において能力が大幅に向上しました。特に競技数学の成績は8%向上し、複雑なタスクのエージェント能力は13%向上しました。このような持続的な技術革新は、騰訊がAI分野での堅実な投資と革新精神を示すものです。
新たに発表されたT1-Visionモデルは、独自の長思考チェーンを持つ特徴があり、複数の画像入力をサポートします。これにより、モデルが画像を理解する効率が向上し、全体的なパフォーマンスは従来のシーケンシャルアプローチより5.3%向上し、理解速度は50%向上しました。
一方、混元Voiceモデルは低遅延の音声通話を実現し、旧バージョンと比較して応答速度が30%向上し、遅延時間を1.6秒にまで短縮しました。
マルチモーダル生成に関して、「混元2.0」は極めて高い正確さと迅速な生成能力で業界をリードし、ユーザーのリアルタイムインタラクティブ体験を満たしました。さらに、「混元3D v2.5」モデルは生成能力と制御性で大きな突破を遂げ、複数の生成カテゴリーで優れたパフォーマンスを発揮しました。
様々な業界に役立つために、騰訊混元は大規模な3Dシーン生成モデルの開発を計画しており、ゲームやスマート製品の革新を支援します。また、「混元」はオープンソース技術に取り組んでおり、画像、動画、3Dなど全モーダルでオープンソース化を達成し、パートナーに無料のモデルリソースや技術サポートを提供しています。
ポイント: 🔹 腾讯混元はモデルマトリックスをアップデートし、視覚深層推論モデル「T1-Vision」とエンドツーエンドの音声通話モデル「混元Voice」を発表しました。 🔹 「混元TurboS」は世界的な評価で上位8位に入り、理科能力が大きく向上しました。 🔹 腾讯混元はオープンソース技術に注力し、マルチモーダルモデルの持続的な改善と業界への応用を促進しています。