O Kimi-Audio é um modelo básico de áudio de código aberto avançado, projetado para lidar com várias tarefas de processamento de áudio, como reconhecimento de voz e diálogo de áudio. O modelo foi pré-treinado em larga escala em mais de 13 milhões de horas de dados de áudio e texto diversificados, possuindo poderosas capacidades de raciocínio de áudio e compreensão de linguagem. Suas principais vantagens incluem desempenho e flexibilidade excepcionais, sendo adequado para pesquisadores e desenvolvedores realizarem pesquisas e desenvolvimento relacionados a áudio.