OpenAI升級科研AI平臺Prism,將底層模型提升至GPT-5.3並引入Codex CLI,旨在實現科研全流程一體化。該平臺整合文本編輯、PDF閱讀、LaTeX編譯和文獻管理功能,幫助科研人員告別多工具切換,提升科學寫作與協作效率。
OpenAI推出科研協作平臺Prism,由GPT-5.2驅動,整合文本編輯、LaTeX編譯、PDF閱讀、文獻管理和AI聊天功能,解決科研寫作中多軟件切換問題。調研顯示高級科研用戶對AI工具需求強烈,Prism旨在提升科研效率。
2026年1月28日,OpenAI推出AI原生在線工作空間Prism,專爲科研人員設計。該工具由GPT-5.2驅動,深度集成AI能力,旨在重塑科學寫作與團隊協作流程。Prism基於收購的Crixet雲端LaTeX平臺構建,整合多項功能於統一界面,打破傳統科研工具割裂現狀,成爲科研領域的集成化“全能助手”。
dots.ocr是一款1.7B參數的輕量化多語言文檔解析模型,在OCR領域表現突出。其特點包括:1)輕量高效,處理單頁PDF僅需數秒;2)支持100種語言,低資源語言處理優勢明顯;3)精準識別文檔佈局元素並保持閱讀順序;4)表格和公式解析能力突出,可輸出LaTeX格式。適用於文檔數字化等場景,但在處理複雜表格、圖片內容時仍有侷限。該模型以輕量化設計打破傳統OCR侷限,展現了文檔解析技術的新高度。
免費在線LaTeX編輯器,支持AI寫作,無需安裝,可在瀏覽器編寫文檔。
強大的文檔轉換工具,支持圖像和 PDF 轉換為 LaTeX 等格式。
Streamdown是一個為AI驅動流式處理而設計的React Markdown的即插即用替代品。
AI數學家教,即時計算和渲染LaTeX格式數學問題
prithivMLmods
基於Qwen2.5-VL-3B-Instruct微調的視覺OCR模型,專注於文檔級OCR、長上下文視覺語言理解和數學LaTeX格式轉換
基於Qwen/Qwen2-VL-2B-Instruct微調的多模態模型,專為OCR、圖像轉文本、LaTeX數學求解及手寫識別優化
docscopeOCR-7B-050425-exp 是基於 Qwen/Qwen2.5-VL-7B-Instruct 微調的模型,專注於文檔級 OCR、長上下文視覺語言理解和數學 LaTeX 格式的精確圖像到文本轉換。
coreOCR-7B-050325-preview 是基於 Qwen/Qwen2-VL-7B 微調的視覺語言模型,專注於文檔級 OCR、長上下文視覺語言理解和精確的圖像到文本轉換(支持數學 LaTeX 格式)。
minnesotanlp
基於BERT微調的學術寫作意圖分類模型,用於預測LaTeX論文寫作中的下一步寫作意圖
tjoab
基於Transformer的光學字符識別模型,專為處理手寫數學圖像和結構化數學語法而優化。
Matthijs0
基於圖像生成LaTeX公式的VisionEncoderDecoder模型,使用Swin Transformer編碼器和GPT-2解碼器架構
U4R
基於InternVL2-1B的多模態表格識別模型,支持將表格圖像轉換為LaTeX/HTML/Markdown格式
Brian314
TexTeller是基於ViT架構的端到端公式識別模型,能夠將自然場景圖像中的數學公式直接轉換為LaTeX格式公式。
StructEqTable-Deploy是一個高效開源的表格轉LaTeX工具包,能夠將表格圖像轉換為LaTeX代碼,並執行多種與表格相關的推理任務。
DGurgurov
基於VisionEncoderDecoderModel的基準模型,針對從圖像生成LaTeX公式的數據集進行了微調。
MixTex
一個專注於識別中英文混合LaTeX公式的OCR模型,支持本地離線CPU推理
Pix2Text的數學公式識別(MFR)模型,基於TrOCR架構訓練,可將數學公式圖片轉換為LaTeX文本表示。
lamm-mit
Cephalo是一個專注於多模態材料科學的視覺大語言模型系列,當前版本專精於將數學公式圖像轉換為LaTeX代碼。
hoang-quoc-trung
Sumen是一個基於Transformer架構的端到端模型,專門用於將數學公式圖像轉換為LaTeX序列,支持印刷體和手寫體公式識別。
breezedeus
Pix2Text的數學公式識別(MFR)模型,基於TrOCR架構訓練,能夠將數學公式圖像轉換為LaTeX文本表示。
OleehyO
TexTeller是基於ViT架構的端到端公式識別模型,能夠識別自然圖像中的數學公式並將其轉換為LaTeX格式公式。
CuiSiwei
基於Nougat-small微調的數學公式識別模型,擅長從圖像中提取LaTeX公式代碼
vikp
Texify 是一個 OCR 工具,專門用於將公式圖片和文本轉換為 LaTeX 格式。
Norm
該模型是基於Nougat-base微調的LaTeX OCR模型,專門用於從圖像生成LaTeX代碼,特別優化了數學公式圖像的識別能力。
一個基於MCP協議的LaTeX數學公式轉MathML服務器,提供工具和資源兩種訪問方式。
Academia MCP是一個為學術研究設計的MCP服務器,提供搜索、獲取、分析和報告科學論文與數據集的工具,支持ArXiv、ACL Anthology、Hugging Face等平臺,幷包含網頁爬取、LaTeX編譯、PDF閱讀及LLM增強功能。
一個基於MCP協議的LaTeX轉MathML服務
一個MCP服務器,允許Claude Desktop、Cursor等MCP客戶端直接訪問和處理arXiv論文,通過獲取LaTeX源代碼來準確解析數學內容。
一個基於MCP協議的PDF處理服務器,支持從PDF中提取文本和LaTeX數學公式,並能與Claude集成進行文檔分析。
Typst MCP Server是一個實現MCP協議的服務器,幫助AI模型與Typst排版系統交互,提供LaTeX與Typst轉換、語法驗證和圖像生成功能。
一個連接桌面掃描文件並使用簡歷文件和職位描述生成LaTex簡歷的工具
Claude-LaTeX MCP集成項目通過Anthropic的模型上下文協議(MCP)將Claude AI與LaTeX編輯器連接,為學術寫作、科幻創作和哲學寫作提供AI輔助功能,包括公式生成、文檔結構優化、引用管理等核心工具,以及針對不同類型內容的專業擴展模塊。
LaTeX編譯與文檔生成的MCP服務器,提供模板管理、代碼片段和PDF生成功能
一個將LaTeX數學公式轉換為SVG的MCP服務器,支持多種數學字體和輸出格式,方便AI助手生成數學公式圖像。