OpenAIは音声AIモデルの開発を加速し、音声優先のスマートハードウェアに向けて準備を進めている。複数チームを統合し、音声対話技術の向上に注力。現行モデルの精度と速度を改善するため、新世代オーディオモデルの開発を推進中。....
OpenAIは音声AI技術の開発を加速し、対話性能と応答速度を向上させ、音声優先スマートデバイスの導入に備えています。....
OpenAIは音声AIシステムの再構築にチームを統合し、2026年に音声優先デバイスをリリース予定。ポストスクリーン時代の核として音声インタラクションに注力。....
微信入力法iOS版が3.0.0にアップデートされ、音声優先インタラクションを核に。音声入力の再構築、基盤モデルの強化で速度と精度向上、実用性と多言語対応、プライバシー保護も強化。最大の特徴は広東語など15の中国方言への対応拡大。....
ウィスプは音声を優先としたアプリケーションビルダーで、数秒で音声アイデアをアプリケーションに変換します
Google
$0.49
入力トークン/百万
$2.1
出力トークン/百万
1k
コンテキスト長
Xai
$1.4
$3.5
2k
$17.5
Alibaba
$8
$240
52
-
$3.9
$15.2
64
$15.8
$12.7
Bytedance
$0.8
$2
128
Baidu
$2.4
$12
8
Tencent
32
$3
$9
XiaomiMiMo
MiMo Audioは小米が開発した音声言語モデルで、大規模な事前学習により強力な少サンプル学習能力を発揮します。このモデルは、従来のモデルが特定のタスクの微調整に依存する限界を突破し、音声インテリジェント、音声理解などのタスクで優れた性能を発揮し、オープンソースモデルの中で先進的なレベルに達しています。
FireRedTeam
FireRedASRは、標準中国語、中国の方言、英語をサポートするオープンソースの産業用自動音声認識(ASR)モデルシリーズで、公開されている標準中国語ASRベンチマークテストにおいて新たな最先端(SOTA)を達成し、優れた歌詞認識能力も備えています。
parthiv11
IndicWhisperはインド言語に最適化された最先端の音声認識モデルで、インド言語の各種ベンチマークテストで優れた性能を発揮します。
IndicWhisperはインド言語向けに最適化された最先端の音声認識モデルで、インド言語の各種ベンチマークテストで優れた性能を発揮します。