最高のASR AIツールモデル_厳選ASR情報

AIニュース

アリババの音声AI大規模モデルが国際的な権威あるランキングを制覇し、国内音声AIで3冠を達成

2026年5月28日、世界のAI評価プラットフォームArtificial Analysisは音声ランキングを発表した。アリババのFun-Realtime-TTS-Preview音声大規模モデルは1190点を獲得し、世界第5位、国内第1位を記録した。このモデルはASRなどの3つの主要な音声分野で国内首位に立ち、全面的な優位性を示している。

15.7k 20 時間前

小米が全ラウンド音声大モデル MiMo-V2.5 を発表。TTSで1つの文で新しいボイドを生成可能。ASRは方言と多言語の混在に対応し、オープンソースをサポート

小米がMiMo-V2.5全リンク音声モデルシリーズを発表。TTSモデル3種とオープンソースASRモデル1種を含み、音声入力と出力をカバー。TTSモデルは感情、トーン、役割を正確に制御し、音声のプログラミング、創作、複製を可能にし、人機対話の自然さを向上させ、音声インテリジェンスの新時代を切り開く。....

20.8k 1 分前

小米 MiMo-V2.5の衝撃的なベータテスト：4.3時間で手作業でコンパイラを作成、長距離スマートエージェントが満点の飛躍を遂げる

小米はMiMo-V2.5シリーズの大モデルを発表し、MiMo-V2.5、V2.5-Proおよび対応するTTSとASRモデルを含んでおり、モデルが「使える」から「使いやすい」へと進化したことを示している。その中でもエース型のMiMo-V2.5-Proは、一般的なスマートエージェント機能とソフトウェアエンジニアリングにおいて、Claude Opus4.6やGPT-5.4などのトップモデルと競合できる水準に達しており、主な強みは高い指示従従性と自己修正能力である。

15.3k 5 時間前

小米 MiMo-V2.5の衝撃的なベータテスト：4.3時間で手作業でコンパイラを作成、長距離スマートエージェントが満点の飛躍を遂げる

マイクロソフトがフロントエンド音声AIシリーズVibeVoiceをオープンソース化：1回の処理で90分間の複数発話者対話、GitHubで27Kスターを獲得

マイクロソフトがオープンソース化したVibeVoice音声AIモデルは、ASRおよびTTSをサポートし、長時間の音声処理、複数発話者対話の生成、リアルタイムでの低遅延の特徴を持っています。GitHubで27Kスターを獲得しています。MITライセンスを採用しており、ローカル環境での展開が可能で、クラウドコストが不要です。音声合成分野のイノベーションを推進することを目的としています。

21k 7 時間前