Inworld发布TTS-1.5文本转语音模型,以自然、富有表现力的实时语音为亮点。该模型支持多语言,延迟低于250毫秒,使用成本约每分钟0.005美元,比同类产品便宜25倍,有望吸引广泛用户。
印度语音AI初创公司Bolna获630万美元种子轮融资,由General Catalyst领投,Y Combinator等跟投。其平台支持多语言智能语音通话,助力企业自动化客户互动。
Zadarma于2026年1月20日推出全新AI语音智能体,为企业提供全天候、多语言、高拟真的电话应答与客户服务。该智能体能自然接听来电、理解复杂意图,基于企业知识库提供精准信息,并可在需要时转接人工客服,提升服务效率与满意度。其深度集成Zadarma云PBX与CRM平台。
谷歌Gemini3Pro图像生成模型上线两月生成超10亿张图片,支持本地编辑、镜头调整、光照控制等功能,可输出2K/4K多语言文本图像,显著提升创意控制能力。
多模型AI聊天助手,集成GPT 5、Claude等,多功能支持多语言
专为 Mac 用户设计的 AI 语音助手,通过语音指令实现润色、翻译及自动化办公。
在线查找用户名足迹,支持多平台搜索及多语言界面。
免费AI图片翻译器,可将图片文字译成130+语言,保留原始布局。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
Anthropic
$105
$525
200
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$6
$24
$2
$20
-
Baidu
128
$8
$240
52
Bytedance
$1.2
$3.6
4
RinggAI
这是一个专为通话记录分析打造的混合语言AI模型,能够处理印地语、英语和混合印地英语的通话转录内容。模型基于Qwen2.5-1.5B-Instruct进行微调,具备强大的多语言理解和信息提取能力。
KonradBRG
该模型是基于FacebookAI/xlm-roberta-large在多语言文本上微调得到的笑话评分模型,专门用于评估笑话的质量和幽默程度。在评估集上取得了0.4005的准确率和5.0327的均方根误差。
Dogacel
这是一个基于原始DeepSeek-OCR模型的优化版本,专门支持在苹果金属性能着色器(MPS)和CPU上进行推理的OCR模型。它能够从图像中提取文本并转换为结构化格式,支持多语言文档识别。
ai-sage
GigaChat3-10B-A1.8B是GigaChat系列的对话模型,基于混合专家(MoE)架构,共有100亿参数,其中18亿为活跃参数。该模型采用多头潜在注意力和多令牌预测技术,支持25.6万令牌的长上下文,在多语言对话和推理任务中表现出色。
tencent
混元OCR是由混元原生多模态架构驱动的端到端OCR专家VLM模型,仅用10亿参数的轻量级设计,在多个行业基准测试中取得最先进成绩。该模型擅长处理复杂的多语言文档解析,在文本定位、开放域信息提取、视频字幕提取和图片翻译等实际应用场景中表现出色。
Guilherme34
Qwen3-32B是Qwen系列最新一代的大语言模型,具备强大的推理、指令遵循、智能体交互和多语言处理能力。它支持100多种语言和方言,能在思维模式和非思维模式间无缝切换,为用户提供自然流畅的对话体验。
mamei16
Chonky 是基于 DistilBERT 的多语言段落分割模型,在 3400 多万篇维基百科文章的近 110 亿个标记上微调训练而成,能够将任意自然语言文本分割成语义块,支持 104 种语言。
ekacare
Parrotlet-e是一款先进的多语言医学嵌入模型,专门针对印度各语言中的医学术语进行优化。它基于BAAI/bge-m3进行微调,在超过1800万对多语言医学术语对上进行训练,支持12种印度语言和英语,对临床文档中的缩写、拼写变体和口语表达具有很强的鲁棒性。
redponike
Qwen3-VL-4B-Instruct 是通义千问系列最新的视觉语言模型,在4B参数规模下实现了卓越的视觉感知、文本理解与生成、空间推理和智能体交互能力。它支持长上下文和视频理解,具备强大的OCR和多语言处理能力。
mradermacher
这是yanolja/YanoljaNEXT-Rosetta-27B-2511模型的静态量化版本,提供了多种量化类型的权重文件,支持多语言翻译任务。该模型专门针对32种语言进行优化,包括中文、英语、日语、韩语等主要语言。
本项目提供了 `yanolja/YanoljaNEXT-Rosetta-4B-2511` 模型的 GGUF 量化版本。该模型是一个专注于多语言翻译任务的大语言模型,支持包括中文、英语、日语、韩语、法语、德语等在内的 33 种语言。量化版本由 mradermacher 创建,提供了多种不同精度和文件大小的量化选项,便于在资源受限的环境下部署和使用。
yanolja
YanoljaNEXT-Rosetta-27B-2511是基于Gemma3架构微调的270亿参数解码器语言模型,专门为结构化数据翻译设计,能在保留数据结构的同时实现多语言间的高效准确翻译。
这是Qwen3-VL-8B-Abliterated-Caption-it模型的静态量化版本,支持多语言图像描述任务,提供多种量化级别选择,平衡性能与资源需求。
Lamapi/next-12b 是一个基于12B参数的大语言模型,通过多语言数据集进行微调,支持50多种语言,具备高效文本生成能力,适用于化学、代码、生物、金融、法律等多个领域的自然语言处理任务。
Lamapi/next-12b 是一个120亿参数的多语言大语言模型,提供了多种量化版本,支持文本生成、问答、聊天等多种自然语言处理任务。该模型在多个领域数据集上训练,具有高效、轻量级的特点。
unsloth
Granite-4.0-H-350M-Base是IBM开发的轻量级仅解码器语言模型,专为资源受限设备设计,支持多语言文本生成和代码补全功能。
Granite-4.0-H-350M是IBM开发的轻量级指令模型,具有350M参数,在多语言处理和指令遵循方面表现出色,专为设备端部署和研究场景设计。
Lamapi
Next 12B是基于Gemma 3的120亿参数多模态视觉语言模型,是土耳其最先进的开源视觉语言模型。该模型在文本和图像理解方面表现出色,具备先进的推理和上下文感知多模态输出能力,特别提供专业级的土耳其语支持,同时具备广泛的多语言能力。
RedHatAI
Llama-4-Maverick-17B-128E-Instruct-NVFP4是一个经过FP4量化处理的多语言大语言模型,基于Meta-Llama-3.1架构,专为商业和研究用途设计。该模型通过将权重和激活量化为FP4数据类型,显著减少了磁盘空间和GPU内存需求,同时保持较好的性能表现。
mlx-community
DeepSeek-OCR-8bit是基于DeepSeek-OCR模型转换的MLX格式版本,专门针对苹果芯片优化的视觉语言模型,支持多语言OCR识别和图像文本理解任务。
Refact Agent 是一个开源AI编程助手,支持多语言代码生成、调试和优化,集成主流开发工具,可本地化部署并提供智能补全和代码解释功能。
一个通过MCP协议获取YouTube视频字幕的服务
FileScopeMCP是一个基于TypeScript的代码分析工具,通过计算文件重要性评分、追踪依赖关系、生成可视化图表和添加文件摘要,帮助开发者快速理解代码库结构。支持多语言项目分析,提供Mermaid图表生成和持久化存储功能,可与Cursor的模型上下文协议集成。
Code Runner MCP Server是一个支持多语言代码片段执行的MCP服务,可在VS Code等应用中直接运行代码并显示结果。
PMAT是一个零配置的AI代码上下文生成工具,提供代码质量分析、技术债务评级、突变测试、仓库健康评分和语义搜索等功能,支持17种以上编程语言,并能通过MCP协议与Claude Code等AI助手集成。
一个基于SerpAPI的Google职位搜索MCP服务器,提供多语言支持、灵活搜索参数和智能错误处理。
FastApply MCP Server是一个企业级代码智能平台,通过本地AI模型、AST语义搜索、安全扫描和智能模式识别,提供全面的代码分析、搜索和重构能力,支持多语言开发和大规模代码库处理。
AST MCP服务器是一个基于抽象语法树(AST)和抽象语义图(ASG)的代码分析服务,支持多种编程语言,提供代码结构解析、语义分析和复杂度评估等功能,可与Claude Desktop等MCP客户端集成使用。
OpenManus是一个无需邀请码即可实现各种想法的开源项目,由MetaGPT团队成员在3小时内构建完成。它提供了一个简单的实现,允许用户创建自己的智能代理,并支持多种语言和配置。项目欢迎建议、贡献和反馈,未来计划包括更好的规划、实时演示、回放功能、RL微调模型和全面的基准测试。
英雄联盟模拟对战预测器,提供基于历史数据的召唤师分析和AI驱动的10阶段对战模拟,支持多语言和性能比较。
一个集成了Vibe Coding方法和知识图谱技术的MCP服务器,使用Kuzu图数据库进行AI辅助软件开发,支持多语言代码分析和企业级安全性能
一个基于DeepL API的MCP服务器,提供文本翻译和语言列表功能。
CodeSavant是一个基于MCP协议的代码管理服务器,提供代码读写、执行和版本控制功能,支持多语言开发和历史回溯。
项目提供多语言支持的提交信息规范文档
一个多功能代码扫描工具,支持多语言解析、定义提取和.gitignore过滤,可输出多种格式结果,提供CLI和MCP服务器两种运行模式。
一个基于SerpAPI的Google新闻搜索MCP服务器实现,支持多语言区域和智能分类
一个多语言代码依赖分析服务,生成依赖图和架构评分
Gossiphs是一个零配置、高性能的通用代码文件关系分析工具,支持多种编程语言,基于tree-sitter和git分析,提供Python SDK和MCP协议支持,便于与AI集成。
Kyutai TTS的Docker部署方案,提供一键启动的Web界面、REST API和MCP工具支持,支持GPU加速和多语言界面。