ReaderLM v2, Jina AI द्वारा विकसित 1.5B पैरामीटर वाला एक छोटा भाषा मॉडल है, जो विशेष रूप से HTML को Markdown में बदलने और HTML से JSON निकालने के लिए बनाया गया है, जिसमें असाधारण सटीकता है। यह मॉडल 29 भाषाओं का समर्थन करता है और 512K तक के टोकन के इनपुट और आउटपुट संयोजन लंबाई को संभाल सकता है। इसने एक नए प्रशिक्षण प्रतिमान और उच्च गुणवत्ता वाले प्रशिक्षण डेटा का उपयोग किया है, जिससे लंबे पाठ सामग्री को संसाधित करने और Markdown सिंटैक्स उत्पन्न करने में पिछले संस्करणों की तुलना में महत्वपूर्ण प्रगति हुई है। यह Markdown सिंटैक्स को कुशलता से उपयोग करता है और जटिल तत्वों को उत्पन्न करने में माहिर है। इसके अलावा, ReaderLM v2 ने सीधे HTML से JSON उत्पन्न करने की सुविधा भी पेश की है, जिससे उपयोगकर्ता दिए गए JSON ढांचे के अनुसार मूल HTML से विशिष्ट जानकारी निकाल सकते हैं, जिससे मध्यवर्ती Markdown रूपांतरण की आवश्यकता समाप्त हो जाती है।