説明はありません
mispeech
MiDashengLM-7B-0804は小米が発表した7Bパラメータのマルチモーダル音声言語モデルで、音声理解とテキスト生成タスクをサポートし、一般的なシナリオの推論と微調整に適しています。
MiDashengLMは、汎用音声字幕技術を利用して、様々な音声理解タスクを卓越して遂行できる、効率的な音声理解モデルです。性能と効率の面で優れています。このモデルは、いくつかの重要な音声理解タスクで同類のモデルを上回り、効率的な推論速度と包括的な音声理解能力を備えています。
米大声言語モデルは、高効率な音声言語モデルであり、字幕ベースのアライメント方式により、包括的な音声理解を実現します。このモデルは、複数の音声理解ベンチマークテストでトップクラスの性能を発揮し、同時に高い推論効率を維持し、スループットが3.2倍向上し、最大512のバッチサイズをサポートします。