阿里通义实验室发布Fun-ASR1.5语音识别大模型,通过统一架构实现通用性与精准度的平衡。该模型支持全球30种主流语言,并深度适配汉语七大方言及20多种地方口音,在多语言、多方言及复杂语境下表现突出。
小米Kaldi团队开源OmniVoice模型,支持超600种语言,在中文和多语言TTS基准测试中多项指标达到SOTA。中文WER低至0.84%,多语言性能超越主流商用模型,实现语音合成新突破。
微软Bing团队开源词嵌入模型Harrier,支持超100种语言,在MTEB v2基准测试中表现优异。模型基于20亿示例及GPT-5合成数据训练,采用32,000词元上下文窗口,具备27亿参数,显著提升多语言任务准确性与灵活性。
微软必应团队开源全新词嵌入模型系列Harrier,包含三个版本,其中27B旗舰模型在多语言基准测试中超越OpenAI、亚马逊和谷歌Gemini等主流专有模型,位居榜首。该模型支持超100种语言,上下文窗口达32,000词,旨在重塑搜索、检索及AI代理的底层逻辑。
ChatGPT Image 2是与OpenAI相关的AI图像模型,文本渲染和多语言输出出色。
多模型AI聊天助手,集成GPT 5、Claude等,多功能支持多语言
Qwen3是Qwen系列大型语言模型的最新成员,支持多种思考模式和多语言。
基于DeepSeek R1和V3模型的浏览器侧边栏AI工具,提供问答、创作、翻译等功能
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$6
$24
Baidu
128
$2
$20
RinggAI
这是一个专为通话记录分析打造的混合语言AI模型,能够处理印地语、英语和混合印地英语的通话转录内容。模型基于Qwen2.5-1.5B-Instruct进行微调,具备强大的多语言理解和信息提取能力。
KonradBRG
该模型是基于FacebookAI/xlm-roberta-large在多语言文本上微调得到的笑话评分模型,专门用于评估笑话的质量和幽默程度。在评估集上取得了0.4005的准确率和5.0327的均方根误差。
Dogacel
这是一个基于原始DeepSeek-OCR模型的优化版本,专门支持在苹果金属性能着色器(MPS)和CPU上进行推理的OCR模型。它能够从图像中提取文本并转换为结构化格式,支持多语言文档识别。
ai-sage
GigaChat3-10B-A1.8B是GigaChat系列的对话模型,基于混合专家(MoE)架构,共有100亿参数,其中18亿为活跃参数。该模型采用多头潜在注意力和多令牌预测技术,支持25.6万令牌的长上下文,在多语言对话和推理任务中表现出色。
tencent
混元OCR是由混元原生多模态架构驱动的端到端OCR专家VLM模型,仅用10亿参数的轻量级设计,在多个行业基准测试中取得最先进成绩。该模型擅长处理复杂的多语言文档解析,在文本定位、开放域信息提取、视频字幕提取和图片翻译等实际应用场景中表现出色。
Guilherme34
Qwen3-32B是Qwen系列最新一代的大语言模型,具备强大的推理、指令遵循、智能体交互和多语言处理能力。它支持100多种语言和方言,能在思维模式和非思维模式间无缝切换,为用户提供自然流畅的对话体验。
mamei16
Chonky 是基于 DistilBERT 的多语言段落分割模型,在 3400 多万篇维基百科文章的近 110 亿个标记上微调训练而成,能够将任意自然语言文本分割成语义块,支持 104 种语言。
ekacare
Parrotlet-e是一款先进的多语言医学嵌入模型,专门针对印度各语言中的医学术语进行优化。它基于BAAI/bge-m3进行微调,在超过1800万对多语言医学术语对上进行训练,支持12种印度语言和英语,对临床文档中的缩写、拼写变体和口语表达具有很强的鲁棒性。
redponike
Qwen3-VL-4B-Instruct 是通义千问系列最新的视觉语言模型,在4B参数规模下实现了卓越的视觉感知、文本理解与生成、空间推理和智能体交互能力。它支持长上下文和视频理解,具备强大的OCR和多语言处理能力。
mradermacher
这是yanolja/YanoljaNEXT-Rosetta-27B-2511模型的静态量化版本,提供了多种量化类型的权重文件,支持多语言翻译任务。该模型专门针对32种语言进行优化,包括中文、英语、日语、韩语等主要语言。
本项目提供了 `yanolja/YanoljaNEXT-Rosetta-4B-2511` 模型的 GGUF 量化版本。该模型是一个专注于多语言翻译任务的大语言模型,支持包括中文、英语、日语、韩语、法语、德语等在内的 33 种语言。量化版本由 mradermacher 创建,提供了多种不同精度和文件大小的量化选项,便于在资源受限的环境下部署和使用。
yanolja
YanoljaNEXT-Rosetta-27B-2511是基于Gemma3架构微调的270亿参数解码器语言模型,专门为结构化数据翻译设计,能在保留数据结构的同时实现多语言间的高效准确翻译。
这是Qwen3-VL-8B-Abliterated-Caption-it模型的静态量化版本,支持多语言图像描述任务,提供多种量化级别选择,平衡性能与资源需求。
Lamapi/next-12b 是一个基于12B参数的大语言模型,通过多语言数据集进行微调,支持50多种语言,具备高效文本生成能力,适用于化学、代码、生物、金融、法律等多个领域的自然语言处理任务。
Lamapi/next-12b 是一个120亿参数的多语言大语言模型,提供了多种量化版本,支持文本生成、问答、聊天等多种自然语言处理任务。该模型在多个领域数据集上训练,具有高效、轻量级的特点。
unsloth
Granite-4.0-H-350M-Base是IBM开发的轻量级仅解码器语言模型,专为资源受限设备设计,支持多语言文本生成和代码补全功能。
Granite-4.0-H-350M是IBM开发的轻量级指令模型,具有350M参数,在多语言处理和指令遵循方面表现出色,专为设备端部署和研究场景设计。
Lamapi
Next 12B是基于Gemma 3的120亿参数多模态视觉语言模型,是土耳其最先进的开源视觉语言模型。该模型在文本和图像理解方面表现出色,具备先进的推理和上下文感知多模态输出能力,特别提供专业级的土耳其语支持,同时具备广泛的多语言能力。
RedHatAI
Llama-4-Maverick-17B-128E-Instruct-NVFP4是一个经过FP4量化处理的多语言大语言模型,基于Meta-Llama-3.1架构,专为商业和研究用途设计。该模型通过将权重和激活量化为FP4数据类型,显著减少了磁盘空间和GPU内存需求,同时保持较好的性能表现。
mlx-community
DeepSeek-OCR-8bit是基于DeepSeek-OCR模型转换的MLX格式版本,专门针对苹果芯片优化的视觉语言模型,支持多语言OCR识别和图像文本理解任务。
FileScopeMCP是一个基于TypeScript的代码分析工具,通过计算文件重要性评分、追踪依赖关系、生成可视化图表和添加文件摘要,帮助开发者快速理解代码库结构。支持多语言项目分析,提供Mermaid图表生成和持久化存储功能,可与Cursor的模型上下文协议集成。
FastApply MCP Server是一个企业级代码智能平台,通过本地AI模型、AST语义搜索、安全扫描和智能模式识别,提供全面的代码分析、搜索和重构能力,支持多语言开发和大规模代码库处理。
Code Graph RAG MCP是一个先进的模型上下文协议服务器,通过智能图表示和多语言代码分析能力,提供13种专业工具进行代码理解、关系映射和语义搜索。
i18n MCP Server 是一个强大的国际化工具,通过服务器接口利用语言模型自动翻译JSON语言文件,简化多语言项目管理流程。
该项目为Apache Fineract®提供模型上下文协议(MCP)服务,支持Python、Java和Node.js实现,使AI代理能访问金融数据与操作。包含调试工具、多语言实现及标准化API接口。
Cohere MCP Server是一个实现模型上下文协议(MCP)的服务器,集成Cohere API提供多语言模型和高级检索功能。
Claude本地语义代码搜索工具,使用EmbeddingGemma模型实现完全离线的多语言代码智能搜索,通过MCP协议与Claude Code集成,保护隐私且无需API密钥
多语言实现的模型上下文协议服务器,用于与Claude、Cursor等应用配合使用
POEditor MCP服务器是一个用于与POEditor翻译管理API交互的模型上下文协议服务器,提供术语管理、翻译更新和多语言支持功能
该项目提供了一个基于韩国旅游组织(KTO)官方API的模型上下文协议(MCP)服务器,使AI助手能够查询韩国旅游景点、文化活动、餐饮住宿等详细信息。支持多语言搜索、位置感知、缓存和自动重试等功能,可通过Docker或Python直接运行。
Outscraper MCP服务器是一个简化模型上下文协议(MCP)的服务,提供对Outscraper谷歌地图数据提取服务的访问。它包含两个核心工具:谷歌地图搜索和谷歌地图评论提取,支持多语言、区域过滤、数据增强等功能。
MCP-Serve是一个基于MCP协议的多语言翻译服务,提供文本翻译和资源管理功能,支持与AI模型交互扩展能力。
MiniMind Docker是一个一体化部署解决方案,提供包含Web界面、API和MCP支持的MiniMind大语言模型服务,支持一键Docker部署、智能GPU管理和多语言界面。
基于大语言模型的多语言本地化翻译工具,支持多种文件格式的智能处理和批量翻译
YouTube视频字幕提取MCP服务器,支持多语言字幕获取,方便AI模型如Claude直接使用视频字幕内容。