Reverie公司发布新款语音转文本模型,支持印地语、英语及Hinglish混合语言,适应印度多语言环境。该模型已处理300万次API调用,在银行和呼叫中心等行业应用中展现出高精确度和快速响应能力。
谷歌在iOS和Android版Chrome浏览器中新增AI模式快捷按钮,美国用户已可使用。该功能将逐步推广至160个国家,支持印地语、日语等多语言,方便用户快速访问AI搜索服务。
谷歌AI搜索功能结束仅支持英语状态,新增印地语、印尼语、日语、韩语和巴西葡萄牙语五种语言支持,向全球更多用户开放智能搜索体验。
谷歌宣布AI搜索功能“AI模式”新增支持印地语、印尼语、日语、韩语和巴西葡萄牙语,此前仅限英语用户使用。该功能经过六个月测试,旨在帮助用户用母语提出复杂问题,更深入地探索网络内容。
Alibaba
$1
Input tokens/M
$10
Output tokens/M
256
Context Length
$2
$20
-
$8
$240
52
$3.9
$15.2
64
$15.8
$12.7
Bytedance
$0.8
$0.15
$1.5
128
Baidu
32
$1.6
$4
Tencent
24
$2.4
$12
8
Iflytek
RinggAI
这是一个专为通话记录分析打造的混合语言AI模型,能够处理印地语、英语和混合印地英语的通话转录内容。模型基于Qwen2.5-1.5B-Instruct进行微调,具备强大的多语言理解和信息提取能力。
tiantiaf
基于openai/whisper-small优化的印度多语言分类模型,支持23种印度地区语言的精准识别,为语言识别领域提供高效解决方案。
Anjan9320
这是一个基于Facebook MMS项目的超轻量级印地语语音合成模型,采用VITS架构,能够将印地语文本转换为高质量、自然流畅的语音输出。模型专为印地语优化,具有高效的推理性能。
这是一个基于Facebook MMS项目的超轻量级印地语语音合成模型,专门针对女性声音进行了优化。该模型能够将印地语文本转换为自然流畅的女性语音,具有轻量级、高效运行的特点,支持随机时长预测器生成不同节奏的语音。
bharatgenai
Param 1是由BharatGen推出的英印双语语言模型,拥有29亿参数。该模型从零开始训练,支持英语和印地语,经过早期监督微调(SFT),可作为下游任务、安全测试和定制的基础。
ai4bharat
基于Wav2Vec2架构的印地语自动语音识别模型,由AI4Bharat开发
freddyaboulton
这是一个基于canopylabs/3b-hi-ft-research_release模型转换的GGUF格式模型,支持印地语文本处理。
ARTPARK-IISc
基于OpenAI的Whisper-Large-V3模型微调的印地语语音识别模型,训练数据包含约718小时的印地语转录语音
DeepMostInnovations
专为印地语文本训练的自定义前沿句子嵌入模型,采用先进的Transformer架构与专用池化策略,可生成高质量的印地语句子语义表示。
nashrah18
基于Helsinki-NLP/opus-mt-en-hi微调的英印地语翻译模型,专为印度旅行的单身女性游客优化地道表达
jiviai
AudioX是由Jivi AI开发的多语言自动语音识别模型,针对印度语言优化,支持印地语、古吉拉特语和马拉地语。
LingoIITGN
Ganga-2-1b是一个基于印地语数据集训练的指令微调模型,是Project Unity项目的一部分,旨在处理印度语言的多样性和丰富性。
Oriserve
基于Whisper架构优化的印地语-印地英语混合语音识别模型,专为印度口音和噪声环境优化
基于Whisper架构优化的印地语-印英混合语自动语音识别模型,支持噪声环境下的高精度转录
11mlabs
Indri是一个支持英语和印地语的文本转语音(TTS)模型,参数规模为124M,采用GGUF格式优化CPU推理。
SPRINGLab
基于F5架构从头开始训练的印地语文本转语音模型,由印度理工学院马德拉斯分校SPRING实验室开发。
Indri 是一个基于 Transformer 架构的新型、超小型、轻量级 TTS 模型,支持英语和印地语的文本转语音任务。
Indri 是一个基于Transformer架构的超小型轻量级TTS模型,支持英语和印地语的文本转语音任务。
Tejasva-Maurya
该模型是基于microsoft/speecht5_tts在common_voice_17_0数据集的印地语验证集上微调得到的语音合成模型。
ShigrafS
基于microsoft/speecht5_tts微调的印地语文本转语音模型
DS Core MCP服务器项目是一个基于DS Core开放API平台的医疗数据集成工具集,包含四个独立的MCP服务器,分别用于患者管理、文档管理、DICOM影像管理和数字印模管理,使大型语言模型能够安全便捷地访问医疗数据和服务。