Meta发布Omnilingual ASR系统,突破AI语音技术局限,首次实现对1600种语言的高精度识别。系统采用“上下文学习”机制,仅需少量音频样本即可快速学习新语言。这一开源技术打破语言“精英垄断”,推动数字平权,助力濒危和小语种社区融入AI时代。
蚂蚁数科在港金融科技节推出多语种多模态大模型训练框架,突破多语言应用瓶颈。该技术针对埃及阿拉伯语等小语种,通过语言感知优化框架,实现“以目标语言思考”机制,提升资源稀缺语言的训练效果。
蚂蚁数科在香港金融科技节推出“多语种多模态大模型训练框架”,旨在解决大模型在多语言环境的应用瓶颈。传统英文大模型在小语种中易出现语言错乱和推理混乱,限制全球化发展。该框架通过优化多语种处理能力,提升模型在多样化语言环境下的表现,推动AI技术更广泛高效地服务于全球各行业。
拉脱维亚公司Tilde于2025年9月3日发布开源大语言模型TildeOpen LLM,拥有300亿参数,采用CC-BY-4.0许可证。该模型专注于支持欧洲小语种,包括拉脱维亚语、立陶宛语、乌克兰语和土耳其语等,旨在促进欧盟语言公平和数字主权发展。
Alibaba
$1
Input tokens/M
$10
Output tokens/M
256
Context Length
Iflytek
$2
-
Tencent
$3
4
Openai
$0.7
$2.8
1k
$15
$45
$21
$84
128
$100
Derur
这是一个收集了多种小语种GGUF格式大语言模型的精选集合,支持俄语、英语、德语等多种语言,涵盖了事实查询、数学计算、文化幽默和道德过滤等多个测试维度。