アリババの通義大規模モデル「百聆」音声モデルが大幅アップデート。わずか3秒の音声で9言語・18方言にシームレス切替可能。標準中国語、広東語、日本語、英語などをサポートし、喜びや怒りなど多様な感情も再現。Fun-CosyVoice3モデルは特に改善が顕著で、初回応答遅延50%削減、日中混合話法の認識精度大幅向上。....
香港が「聆音」EchoCare超音波大モデルを発表。400万枚超の画像データで訓練され、医師不足の解消と診断精度向上を目指す。中国では年間20億件の超音波検査があるが、医師は15万人不足している。....
百聆はGPT-4oに類似した音声対話型ロボットです。ASR+LLM+TTSにより実現されており、低スペック環境でも動作し、割り込みも可能です。
Google
$0.49
入力トークン/百万
$2.1
出力トークン/百万
1k
コンテキスト長
$17.5
Alibaba
$8
$240
52
-
$3.9
$15.2
64
$15.8
$12.7
Bytedance
$0.8
$2
128
Baidu
$2.4
$12
8
Tencent
32
$3
$9
$1.6
$10