AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
TW

AI資訊

查看更多

AI日報:豆包輸入法正式上線;混元開源HunyuanOCR模型;Claude Opus4.5發佈

騰訊混元開源10億參數OCR模型HunyuanOCR,基於多模態架構,在多項任務中實現領先性能,支持多場景文字識別應用。

23.5k 前天
AI日報:豆包輸入法正式上線;混元開源HunyuanOCR模型;Claude Opus4.5發佈

騰訊發佈 HunyuanOCR 開源模型,參數僅 1B 成就多項 SOTA 表現

騰訊發佈1B參數開源模型HunyuanOCR,基於混元多模態架構,在OCR應用中達到SOTA水平。模型採用端到端設計,一次推理即可獲得最優結果,包含原生分辨率視頻編碼器、自適應視覺適配和輕量化混元語言三大核心組件。

14.1k 昨天
騰訊發佈 HunyuanOCR 開源模型,參數僅 1B 成就多項 SOTA 表現

騰訊混元開源 HunyuanOCR 模型:1B 參數斬獲多項 SOTA,多場景賦能 OCR 應用

騰訊混元開源10億參數OCR模型HunyuanOCR,採用端到端設計,集成視頻編碼器、視覺適配器和輕量化語言模型,在多項榜單獲SOTA成績,以體積小、部署便捷爲核心優勢,提供高效OCR解決方案。

13.2k 昨天
騰訊混元開源 HunyuanOCR 模型:1B 參數斬獲多項 SOTA,多場景賦能 OCR 應用

模型

查看更多

HunyuanOCR

tencent

H

混元OCR是由混元原生多模態架構驅動的端到端OCR專家VLM模型,僅用10億參數的輕量級設計,在多個行業基準測試中取得最先進成績。該模型擅長處理複雜的多語言文檔解析,在文本定位、開放域信息提取、視頻字幕提取和圖片翻譯等實際應用場景中表現出色。

多模態TransformersTransformers多語言
tencent
24.9k
444
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商務合作網站地圖