एलन आर्टिफिशियल इंटेलिजेंस रिसर्च इंस्टीट्यूट ने कई विश्वविद्यालयों के साथ मिलकर दुनिया का पहला 100% ओपन-सोर्स बड़े मॉडल OLMo जारी किया है, जिसमें वेट्स, कोड, डेटा सेट और प्रशिक्षण की पूरी प्रक्रिया शामिल है। प्रदर्शन मूल्यांकन से पता चलता है कि OLMo-7B कई कार्यों में थोड़ी बेहतर है। इसी समय, शोधकर्ताओं ने प्री-ट्रेनिंग डेटा सेट डोलमा को सार्वजनिक किया है, जो भाषा मॉडल प्री-ट्रेनिंग क्षेत्र में ओपन रिसर्च को बढ़ावा देता है। डेटा पारदर्शिता के संदर्भ में, डेटा व्यवस्थित करने के उपकरण और विश्लेषण उपकरण प्रदान किए गए हैं।