百度がオープンソースした3BパラメータのUnlimited OCR: 5日でStarが1万を突破し、長文ドキュメント解析の記録を更新
百度がオープンソースした3BパラメータのエンドツーエンドOCRモデルであるUnlimited OCRは、書籍や論文などの長文ドキュメントに特化しています。プロジェクトリリースから5日でGitHubのStar数が1万を突破し、4つのトレンドチャートでトップになりました。技術面では、推論時に約570Mのパラメータがアクティブ化され、Reference Sliding Window Attention機構を革新的に導入し、ページごとの結合の制限を打ち破り、数十ページを一度に連続して解析することが可能となり、長文ドキュメントの処理効率を大幅に向上させました。