新加坡AISG发布新一代大语言模型Qwen-Sea-Lion-v4,底层架构从Meta Llama切换为阿里Qwen3-32B,在东南亚语言评估基准Sea-Helm的<2000亿参数开源榜单夺冠。切换主因:Qwen3预训练覆盖119种语言/方言,对印尼语等低资源语言适配更优;分词优化放弃西方常用方案,原生多语架构降低后续训练门槛。
Grab开发自研语言模型,因现有大模型对东南亚多语言理解不足。其超级应用覆盖多国服务,需处理非拉丁字母文档,如客户身份验证等合规任务。
Mistral AI 近日推出了名为 Saba 的新型语言模型,该模型专注于提升对中东和东南亚地区语言及文化差异的理解。Saba 模型拥有240亿参数,虽然规模小于许多竞争对手,但 Mistral AI 声称其在保证准确性的同时,提供了更高的速度和更低的成本。其架构可能与 Mistral Small3模型相似。Saba 能够在性能较低的系统上高效运行,甚至在单 GPU 设置下也能实现每秒超过150个令牌的速度。该模型尤其擅长处理阿拉伯语和印度语,包括泰米尔语和马拉雅拉姆语等南印度语。Mistral AI 的基准测试显示,Saba 在阿拉
["阿里巴巴集团旗下研究机构达摩院推出了专为东南亚语言量身定制的人工智能大语言模型。","东南亚LLM在越南语、印度尼西亚语、泰语、马来语、高棉语、老挝语、他加禄语和缅甸语数据集上进行了预训练,并且在语言和安全任务方面优于其他开源模型。","针对特定地区的LLM,东南亚被视为重要的增长市场。","SeaLLM在非拉丁语系任务中的表现优于其他LLM,其解释和处理非拉丁语系文本的能力可延长9倍。"]
东南亚地区定制的开放语言模型
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
Anthropic
$105
$525
200
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
-
$6
$24
Baidu
128
$8
$240
52
Bytedance
$1.2
$3.6
4
aisingapore
Qwen-SEA-LION-v4-4B-VL 是一个基于 Qwen3-VL-4B-Instruct 架构构建的 40 亿参数视觉语言模型。它专门针对东南亚地区进行了指令微调,具备多语言和多元文化能力,支持英语及七种东南亚语言,并保留了强大的视觉-语言理解能力。
Qwen-SEA-LION-v4-32B-IT-4BIT是针对东南亚语言优化的32B参数大语言模型的4位量化版本,在保持优异性能的同时显著降低内存需求,可在消费级硬件上运行。
Qwen-SEA-LION-v4-32B-IT是基于Qwen3-32B构建的东南亚语言大语言模型,专门针对东南亚地区进行了预训练和指令微调。该模型在包含7种东南亚语言的SEA-Pile v2语料库上继续预训练,并在800万对高质量问答数据上进行指令微调,具备强大的多语言理解和推理能力。
Gemma-SEA-LION-v4-27B-IT是专为东南亚地区预训练和指令微调的大语言模型,在东南亚语言任务上表现出色,具有128K的大上下文长度,具备图像和文本理解能力,支持高级函数调用和结构化输出。
QuantFactory
Sailor2是一个专注于东南亚地区的多语言大模型,支持15种语言,包括英语、中文及多种东南亚语言。
SEA-LION是针对东南亚地区进行预训练和指令调优的大语言模型系列,专门设计用于支持东南亚多种语言,为该地区提供更精准、高效的语言处理能力。
为东南亚地区预训练和指令调优的大语言模型,支持13种东南亚语言
Llama-SEA-LION-v3.5-70B-R 是一个专为东南亚语言优化的混合功能大语言模型,支持13种语言,具备复杂推理和通用文本生成能力。
Llama-SEA-LION-v3.5-8B-R是一个针对东南亚语言优化的8B参数大型语言模型,支持13种东南亚语言,具备复杂推理和通用文本生成能力。
SeaLLMs
SeaLLMs-Audio是面向东南亚的大规模音频语言模型,支持印尼语、泰语、越南语、英语和中文五大语种,具备音频分析、语音交互等能力。
Llama-SEA-LION-v3-70B-IT是一款多语言大语言模型,专门针对东南亚语言进行了优化。该模型在约1230万条英语指令-完成对和450万条东南亚语言指令-完成对的数据集上进行了两阶段微调,支持包括缅甸语、中文、英语、菲律宾语、印尼语等13种语言。
SEA-LION 是一个针对东南亚语言优化的大语言模型系列,支持13种东南亚语言,基于Llama 3.1架构构建。
SEA-LION是一系列为东南亚地区预训练和指令微调的大语言模型,致力于解决该地区多语言处理问题,为东南亚语言的自然语言处理提供强大支持。
Llama-SEA-LION-v3-8B 是一个针对东南亚语言优化的多语言大语言模型,支持11种东南亚语言,并在约2000亿个标记上进行了持续预训练。
sail
Sailor2是由Sea AI Lab开发的社区驱动项目,专为东南亚地区设计的多语言大语言模型。提供10亿、80亿和200亿三种参数规模,支持15种东南亚语言,基于Apache 2.0许可证发布,让该地区用户能更便捷地使用先进语言技术。
Gemma-SEA-LION-v3-9B 是一个多语言大语言模型,专为东南亚地区优化,支持11种东南亚官方语言。
Gemma-SEA-LION-v3-9B-IT是一个针对东南亚地区优化的多语言大语言模型,基于Gemma2架构构建,支持13种东南亚语言,经过指令微调,具备8192上下文长度处理能力。
SeaLLMs-v3是面向东南亚语言的大语言模型系列的最新成果,在同规模模型中表现卓越,能有效处理多种东南亚语言任务,提供安全可靠的响应。该模型经过特别优化,减少了幻觉现象,并对当地语境具有敏感性。
SeaLLMs-v3是面向东南亚语言的大语言模型系列的最新版本,在同类规模模型中取得最先进的性能,在世界知识、数学推理、翻译和指令遵循等任务中表现出色,特别优化了可靠性和安全性,减少幻觉现象。
SeaLLM-7B-v2.5是一款面向东南亚地区的先进多语言大语言模型,支持多种东南亚语言,在多语言知识基准测试和数学推理任务中表现出色。