OpenAI推出生命科学AI模型GPT-Rosalind,以DNA结构发现者命名,旨在加速药物研发。该模型通过分析生化数据,协助科研人员进行证据合成、假设生成、实验规划和蛋白质工程分析,提升实验室研究效率,推动医疗应用转化。
微软Bing团队开源词嵌入模型Harrier,支持超100种语言,在MTEB v2基准测试中表现优异。模型基于20亿示例及GPT-5合成数据训练,采用32,000词元上下文窗口,具备27亿参数,显著提升多语言任务准确性与灵活性。
雅虎推出AI搜索功能Yahoo Scout,由Claude模型驱动,整合30年数据资产,包括500亿用户档案和18万亿行为信号,支持自然语言合成自有频道信息。
Meta AI推出Matrix框架,通过去中心化设计解决合成数据调度瓶颈。它将控制与数据流序列化为消息,分布到不同队列处理,避免中心控制器浪费GPU资源、增加协调开销的问题,提升数据新鲜度和多样性。
通过合成数据增强时间序列理解和推理的模型。
GAIA-2 是一个先进的视频生成模型,用于创建安全的自动驾驶场景。
加速视频扩散模型,生成速度提升 8.5 倍。
Steiner 是一个基于合成数据训练的推理模型,旨在探索多种推理路径并自主验证。
Openai
-
输入tokens/百万
输出tokens/百万
上下文长度
Anthropic
$105
$525
200
$21
Google
$0.7
$2.8
1k
Alibaba
$6
$24
256
$8
$240
52
Moonshot
$4
$16
Baidu
32
$8.75
$70
400
$1.75
$14
$0.35
Tencent
24
$2.4
$12
8
Xai
$1.6
$10
pnnbao-ump
VieNeu-TTS-1000h是一款先进的越南语端侧文本转语音模型,基于约1000小时高质量越南语语音数据训练,具备即时语音克隆功能,支持越南语与英语的无缝切换,能在CPU或GPU上实时合成24kHz波形。
IbrahimSalah
这是一个基于300小时纯净阿拉伯语音频数据微调的文本转语音模型,专门为带完整元音符号的现代标准阿拉伯语提供高质量语音合成,支持声音克隆和长文本处理功能。
onnx-community
Granite-4.0-1B是IBM开发的轻量级指令模型,基于Granite-4.0-1B-Base微调而成。该模型结合了开源指令数据集和内部合成数据集,采用监督微调、强化学习和模型合并等技术开发,适合设备端部署和研究用例。
Granite-4.0-350M是IBM开发的轻量级指令模型,基于Granite-4.0-350M-Base微调而成。该模型结合了开源指令数据集和内部合成数据集,采用监督微调、强化学习和模型融合等技术开发,具备强大的指令跟随能力,特别适合设备端部署和研究场景。
ibm-granite
Granite-4.0-350M是IBM开发的轻量级指令模型,基于Granite-4.0-350M-Base微调而成。该模型结合了开源指令数据集和内部合成数据集,采用监督微调、强化学习和模型合并技术开发,具备强大的指令跟随能力和工具调用功能。
Granite-4.0-1B是IBM开发的轻量级指令模型,基于Granite-4.0-1B-Base进行微调,结合了开源指令数据集和内部合成数据集,采用监督微调、强化学习和模型合并技术开发而成。
Granite-4.0-H-350M是IBM开发的轻量级指令模型,基于Granite-4.0-H-350M-Base微调而成。该模型结合了开源指令数据集和内部合成数据集,采用监督微调、强化学习和模型合并等多种技术开发,具备强大的指令跟随能力和多语言支持。
unsloth
Granite-4.0-H-Small是IBM开发的具有320亿参数的长上下文指令模型,基于Granite-4.0-H-Small-Base微调而成。该模型结合了开源指令数据集和内部合成数据集,采用监督微调、强化学习对齐和模型合并等技术,在指令遵循和工具调用能力方面有显著提升,特别适合企业级应用。
Granite-4.0-H-Micro是IBM开发的30亿参数长上下文指令模型,基于Granite-4.0-H-Micro-Base微调而来。该模型结合了开源指令数据集和内部合成数据集,采用监督微调、强化学习对齐和模型合并等技术开发,具备结构化的聊天格式,在指令遵循和工具调用能力方面表现优异。
Granite-4.0-H-Tiny是IBM开发的具有70亿参数的长上下文指令模型,基于Granite-4.0-H-Tiny-Base进行微调。该模型结合了开源指令数据集和内部合成数据集,采用监督微调、强化学习对齐和模型合并等技术开发,具备增强的指令跟随和工具调用能力,特别适用于企业级应用。
Granite-4.0-Micro是IBM开发的30亿参数长上下文指令模型,基于Granite-4.0-Micro-Base微调而来。该模型结合了开源指令数据集和内部合成数据集,采用监督微调、强化学习对齐和模型合并等技术开发,具备增强的指令遵循和工具调用能力,特别适用于企业级应用。
Granite-4.0-H-Micro是IBM开发的30亿参数长上下文指令模型,基于Granite-4.0-H-Micro-Base微调而来。该模型结合了开源指令数据集和内部合成数据集进行训练,具备增强的指令遵循和工具调用能力,特别适合企业级应用。
Granite-4.0-H-Small是IBM开发的具有320亿参数的长上下文指令模型,基于Granite-4.0-H-Small-Base微调而成。该模型结合了开源指令数据集和内部合成数据集,采用监督微调、强化学习对齐和模型合并等技术开发,在指令遵循和工具调用能力方面有显著提升。
Granite-4.0-Micro是IBM开发的具有30亿参数的长上下文指令模型,基于Granite-4.0-Micro-Base微调而来。该模型使用了开源指令数据集和内部合成数据集,具备增强的指令遵循和工具调用能力,支持多语言任务,可作为各领域AI助手的基础模型。
WeightedAI
波斯语OCR是一个专门针对波斯语文本设计的光学字符识别深度学习模型,采用CNN+变压器架构,在包含60万张合成波斯语文本图像的数据集上训练,序列准确率达到96%。
Granite-4.0-H-Tiny是IBM开发的70亿参数长上下文指令模型,基于Granite-4.0-H-Tiny-Base微调而来。该模型结合开源指令数据集和内部合成数据集训练,具备专业、准确、安全的回复能力,支持多语言和工具调用,适用于企业级应用。
Granite-4.0-H-Micro是IBM开发的30亿参数长上下文指令模型,基于Granite-4.0-H-Micro-Base微调而来。该模型结合了开源指令数据集和内部合成数据集训练,具备多语言支持和增强的工具调用能力,在企业应用中表现出色。
openchs
这是一个基于Helsinki-NLP的opus-mt-mul-en模型进行微调的斯瓦希里语-英语翻译模型。该模型专门针对儿童热线服务场景进行了优化训练,采用合成的热线对话数据进行训练,具备防止生成幻觉的机制,并通过早停策略监控BLEU分数来保证翻译质量。
notmax123
Zonos-v0.1 是一款领先的开源文本转语音(TTS)模型,基于超过20万小时的多语言语音数据训练,在表现力和质量上可与顶级TTS供应商相媲美。支持零样本语音克隆、多语言合成和精细的音频控制。
lastmass
MedGemma-GRPO是MEDGemma模型的微调版本,专为临床病例推理任务设计。该模型结合监督微调(SFT)和组相对策略优化(GRPO),旨在引导模型遵循逻辑诊断路径,在合成医疗案例数据集上训练,特别适用于复杂心血管、血栓和自身免疫性疾病的诊断推理。
一个为化学研究设计的MCP服务器,集成了81个工具,涵盖文献检索、化合物数据、合成规划、实验计算和论文写作等完整科研流程,支持25+科学API和202个命名反应。
一个基于Streamlit的智能聊天机器人,使用GPT-4o自动路由用户请求到不同工具(如聊天、图像生成、数据库查询、语音合成等),支持快速实验AI工具路由功能。
Aleatoric MCP 客户端为AI助手提供生成确定性合成市场数据的工具,支持6大交易所,用于回测、压力测试和模型验证。
Agent Payment MCP是一个为AI编程助手提供高级工具的一键安装器,包括智能数学计算、合成数据生成、文本处理、Python隔离执行、网络工具等功能,采用按使用量付费模式
Agent Payment MCP 是一个一键式安装程序,可为 Claude Desktop、Cursor 等 AI 编程助手添加超过 55 种高级工具,包括智能数学计算、合成数据生成、文本处理、Python 隔离运行、网络工具和加密存储等功能,采用按次付费模式。