国家数据局通过官方渠道将大模型计量单位“Token”正式定名为“词元”,并披露我国AI行业日均词元调用量已超140万亿次。此举统一了长期存在的译名争议,标志着大模型技术标准在国家层面进一步规范化。
我国发布首个人形机器人全产业链标准体系,涵盖基础共性、关键技术、产品应用等环节,填补产业规范化空白,推动行业进入标准化引领的高质量发展阶段。
豆包手机助手宣布将调整AI操作手机能力,强调技术进步需保障用户权益,将推动行业规则清晰化,避免“一刀切”限制合理使用。此前其预览版因展示自动点外卖等功能引发关注。
AI音频公司ElevenLabs推出商用音乐生成模型,首次跨界进入AI音乐市场。该公司与Merlin Network和Kobalt Music Group达成授权合作,获得合法训练数据,规避版权风险。这种授权模式为行业提供了新思路,既保护艺术家权益又开辟新收入来源。此举反映AI创作市场正走向规范化发展,在技术创新与版权保护间寻求平衡。
AI数据规范化工具
Alibaba
$8
Input tokens/M
-
Output tokens/M
32
Context Length
Baidu
ai-forever
基于mT5-large架构的俄语和英语拼写检查模型,通过规范化单词纠正拼写错误和打字错误。
saarus72
基于FRED-T5-large微调的俄语文本规范化模型,支持数字和拉丁字符的规范化处理
nguyenvulebinh
这是一个支持越南语的自动语音识别模型,能够输出规范化文本、标记时间戳以及多说话人分段。
一个支持英语自动语音识别(ASR)的序列到序列模型,能够输出规范化文本、标注时间戳以及多说话人分段。
benjamin
复合词规范化模型,用于分解和规范化复合词,提升语言模型对复合词的处理能力。
GanjinZero
CODER是一种知识增强型跨语言医学术语嵌入模型,专注于医学术语规范化任务。
通过规范化的Spec驱动开发流程,将功能需求转化为生产就绪代码的MCP服务工具
Loaded Vibes是一个企业级Agentic TypeScript Web开发框架,提供包含Next.js 15、React 19、GenAIScript编排器、MCP服务等技术的全栈开发环境与工具链,支持通过18个标准化开发周期进行规范化的项目构建与管理。