{1:百度飛桨チームは、文心大模型を基盤とした汎用画像キー情報抽出ツールPP-ChatOCRを発表しました。2:PP-ChatOCRは、OCR文字認識と大規模言語モデル技術を組み合わせることで、様々なシーンにおいて画像からキー情報を抽出できます。3:PP-ChatOCRはPaddleXで公開されており、高性能な展開をサポートし、高い精度と安定性を達成しています。}
OpenAIのGPT-4 Turboモデルを活用した高効率OCR処理
大規模言語モデルを用いて、PDFスキャンからのOCR出力を向上させます。
Alibaba
$2
入力トークン/百万
$20
出力トークン/百万
-
コンテキスト長
Moonshot
$4
$16
256
Baidu
32
Tencent
$1
$0.75
64
Bytedance
$0.8
$8
Iflytek
Deepseek
128
Xai
$0.5
$0.3
224