腾讯搜狗入力20.0.0記念版がAI化を全面アップグレード。Tencent Hunyuan大モデルを基に、AI音声・翻訳・入力機能を重点強化。音声認識遅延40%低減、精度98%、方言認識精度30%向上。....
京東京造は第二弾の自社開発AI玩具を発表し、子供から高齢者まで全世代をカバー。AIの癒し効果を家族全体の必需品に拡大。方言を話すオウムや感情認識デバイスなど、家庭に優しく溶け込む製品で、各世代の情感ニーズに応える。....
2025年上半期、京津冀の某下級病院で医療大モデルシステムが導入され、電子カルテ作成効率と補助診断の向上が目的であった。しかし実際の運用では効果が得られず、逆に悪影響が出た。主な理由は、モデルが当地の方言を正確に認識できず、カルテ記録に誤りが生じ、診断補助の効果に悪影響を与えたことである。
アリババの通義大規模モデル「百聆」音声モデルが大幅アップデート。わずか3秒の音声で9言語・18方言にシームレス切替可能。標準中国語、広東語、日本語、英語などをサポートし、喜びや怒りなど多様な感情も再現。Fun-CosyVoice3モデルは特に改善が顕著で、初回応答遅延50%削減、日中混合話法の認識精度大幅向上。....
オープンソースの産業レベル自動音声認識モデル。標準中国語、方言、英語に対応し、優れた性能を誇ります。
Anthropic
$21
入力トークン/百万
$105
出力トークン/百万
200
コンテキスト長
Alibaba
$1
$10
256
$8
$240
52
$15.8
$12.7
64
Bytedance
-
Baidu
32
Huawei
128
Tencent
24
$0.3
Iflytek
$2
8
$3
$9
$1.5
$4.5
tiantiaf
Whisper-smallアーキテクチャに基づく音声方言分類モデルで、江淮方言、膠遼官話、冀魯官話、蘭銀官話、普通話、西南官話、中原官話、広東語を含む8種類の中国方言バリエーションを識別するために特別に設計されています。このモデルはCommon Voice 11.0データセットで学習され、重要な音声認識価値を持っています。
amedcj
クルド語のクルマンジ方言に特化した自動音声認識モデルで、Whisperアーキテクチャを微調整したものです。
dennis-9
Whisperアーキテクチャに基づく自動音声認識モデルで、特定の言語や方言に対して微調整されています
MAdel121
これはエジプトアラビア語方言に対して微調整されたWhisper-small自動音声認識モデルで、SpeechBrainツールキットに基づいて訓練されています。
islomov
Whisper mediumモデルをファインチューニングしたウズベク語音声認識モデルで、タシュケント方言をサポートし、約700時間のトレーニングデータを使用
CoRal-project
これはデンマークで最先端の音声認識モデルで、AlvenirがCoRalプロジェクトの一環として訓練したもので、CoRal-v2データセットで訓練され、さまざまなデンマーク方言をカバーしています。
Alvenirによって訓練されたデンマーク最先端の音声認識モデル、CoRal-v2データセットに基づき、複数のデンマーク方言をサポート
panlr
Whisper-mediumをファインチューニングした潮州語(潮汕語)正字認識モデルで、多方言アクセントの正字転写をサポート
badrex
このモデルはMMS-300mをファインチューニングしたアラビア語方言音声認識モデルで、現代標準アラビア語および4つの主要なアラビア語方言を識別できます。
MBZUAI
QASRデータセットでファインチューニングされたアラビア語自動音声認識モデルで、特に方言変種に適しています
FireRedTeam
FireRedASRは、標準中国語、中国の方言、英語をサポートするオープンソースの産業用自動音声認識(ASR)モデルシリーズで、公開されている標準中国語ASRベンチマークテストにおいて新たな最先端(SOTA)を達成し、優れた歌詞認識能力も備えています。
FireRedASRは、標準中国語、中国語方言、英語をサポートするオープンソースの産業用自動音声認識(ASR)モデルシリーズです。公開されている標準中国語ASRベンチマークテストで最新最優(SOTA)レベルを達成し、優れた歌詞認識能力も備えています。
HebArabNlpProject
レバント方言(イスラエルアラビア語)に対して微調整されたWhisperモデルで、この特定のアラビア語変種の自動音声認識性能を向上させます。
Kushtrim
OpenAI Whisper Large v3 Turboをアルバニア語向けに最適化した音声認識モデルで、標準アルバニア語とゲグ方言をサポート
nizarmichaud
OpenAI Whisper Large V3 Turboモデルのファインチューニング版で、QLoRaを活用してスイスドイツ語方言に最適化され、スイスドイツ語自動音声認識タスクで最先端の性能を達成。
Rziane
openai/whisper-mediumをAT_ENTデータセットでファインチューニングしたアラビア語(チュニジア方言)音声認識モデル
ychafiqui
openai/whisper-mediumをダリジャ方言音声テキスト変換データセットでファインチューニングした音声認識モデル
roshna-omer
openai/whisper-smallをファインチューニングしたクルド語ソラニ方言音声認識モデル
ilsp
クレタ方言向け初の自動音声認識(ASR)モデルで、ギリシャ語XLS-Rモデルをファインチューニングして訓練されました。
jensenlwt
OpenAIのWhisper-smallモデルをベースに、シンガポール英語音声データセットで微調整された自動音声認識モデルで、シンガポール英語のアクセント、俗語、方言に特化して最適化されています。