腾讯混元开源10亿参数OCR模型HunyuanOCR,基于多模态架构,在多项任务中实现领先性能,支持多场景文字识别应用。
字节跳动推出“豆包输入法”,安卓版已上线,iOS版即将发布。它基于豆包App语音模型,提升语音识别、语义理解和键盘输入效率,支持方言、英语及中英混合输入,适应轻声、快语和嘈杂环境,核心功能是语音后自动纠错。
豆包输入法今日上线小米商店,但暂因维护无法下载。其核心亮点是搭载与豆包App同源的语音技术,支持方言、纯英文及中英混合输入,并优化轻声说话功能,适应多种交互环境。
Bytedance
$1.2
Input tokens/M
$3.6
Output tokens/M
4
Context Length
$0.8
$2
256
-
128
$0.15
$1.5
$8
$4
$16
$3.5
$12
$3
$9
32
$0.5
$0.3
$0.6
$5