AIBase
首页
AI资讯
AI产品库
模型广场
MCP服务
AI服务
算力市场
AI应用指南
ZH

AI资讯

查看更多

AI日报:豆包输入法正式上线;混元开源HunyuanOCR模型;Claude Opus4.5发布

腾讯混元开源10亿参数OCR模型HunyuanOCR,基于多模态架构,在多项任务中实现领先性能,支持多场景文字识别应用。

23.5k 3 天前
AI日报:豆包输入法正式上线;混元开源HunyuanOCR模型;Claude Opus4.5发布

腾讯发布 HunyuanOCR 开源模型,参数仅 1B 成就多项 SOTA 表现

腾讯发布1B参数开源模型HunyuanOCR,基于混元多模态架构,在OCR应用中达到SOTA水平。模型采用端到端设计,一次推理即可获得最优结果,包含原生分辨率视频编码器、自适应视觉适配和轻量化混元语言三大核心组件。

14.1k 前天
腾讯发布 HunyuanOCR 开源模型,参数仅 1B 成就多项 SOTA 表现

腾讯混元开源 HunyuanOCR 模型:1B 参数斩获多项 SOTA,多场景赋能 OCR 应用

腾讯混元开源10亿参数OCR模型HunyuanOCR,采用端到端设计,集成视频编码器、视觉适配器和轻量化语言模型,在多项榜单获SOTA成绩,以体积小、部署便捷为核心优势,提供高效OCR解决方案。

13.2k 前天
腾讯混元开源 HunyuanOCR 模型:1B 参数斩获多项 SOTA,多场景赋能 OCR 应用

模型

查看更多

HunyuanOCR

tencent

H

混元OCR是由混元原生多模态架构驱动的端到端OCR专家VLM模型,仅用10亿参数的轻量级设计,在多个行业基准测试中取得最先进成绩。该模型擅长处理复杂的多语言文档解析,在文本定位、开放域信息提取、视频字幕提取和图片翻译等实际应用场景中表现出色。

多模态TransformersTransformers支持多种语言
tencent
24.9k
444
AIBase
智启未来,您的人工智能解决方案智库
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商务合作网站地图