OpenAI ने अपने 12-दिवसीय लॉन्च इवेंट में नई पीढ़ी के तर्क श्रृंखला मॉडल - o3 और इसके लघु संस्करण o3-mini की घोषणा की, जिन्हें o1 श्रृंखला का उत्तराधिकारी माना जाता है। ये मॉडल विशेष रूप से प्रश्नों का उत्तर देने से पहले अधिक गहन विचार करने के लिए डिज़ाइन किए गए हैं ताकि सटीकता बढ़ सके।

o3 मॉडल ने ARC-AGI बेंचमार्क परीक्षण में उत्कृष्ट स्तर हासिल किया, और यह उस बेंचमार्क को पार करने वाला पहला AI मॉडल बन गया, जिसने मानव स्तर के समस्या समाधान क्षमता के करीब प्रदर्शन किया। o3 श्रृंखला मॉडल ARC-AGI बेंचमार्क पर न्यूनतम प्रदर्शन 75.7% तक पहुंच सकता है, जबकि अधिक गणना संसाधनों के साथ, प्रदर्शन 87.5% तक बढ़ सकता है।

o3-mini मॉडल तर्क गति बढ़ाने और लागत को कम करने पर ध्यान केंद्रित करता है, जबकि मॉडल के प्रदर्शन को बनाए रखता है, जो विशेष रूप से प्रोग्रामिंग कार्यों के लिए उपयुक्त है। OpenAI ने जनवरी के अंत में o3-mini लॉन्च करने की योजना बनाई है, और इसके बाद पूर्ण o3 मॉडल को पेश किया जाएगा। हालांकि, o3 श्रृंखला मॉडल को सीधे सार्वजनिक रूप से जारी नहीं किया जाएगा, बल्कि पहले सुरक्षा परीक्षण किया जाएगा, लेकिन OpenAI ने पहले से ही सुरक्षा शोधकर्ताओं को o3 और o3-mini के पूर्वावलोकन के लिए पंजीकरण करने की अनुमति देना शुरू कर दिया है।

OpenAI का सबसे शक्तिशाली तर्क मॉडल o3 लॉन्च: AGI क्षमता में वृद्धि, मानव स्तर के करीब

प्रोग्रामिंग और गणितीय समस्या समाधान में, o3 मॉडल ने महत्वपूर्ण क्षमताएँ प्रदर्शित की हैं। SWE-bench Verified बेंचमार्क पर, o3 की सटीकता लगभग 71.7% है, जो o1 मॉडल से 20% से अधिक है। Competition Code में, o3 ने 2727 Elo स्कोर प्राप्त किया, जबकि o1 का स्कोर केवल 1891 था। इसके अलावा, o3 की प्रतियोगिता गणित पर सटीकता 96.7% है, और GPQA Diamond पर इसकी सटीकता 87.7% है, जो o1 से लगभग 10% अधिक है।

OpenAI ने एक नई सुरक्षा मूल्यांकन विधि - विचारशील संरेखण (deliberative alignment) की भी घोषणा की, जो एक नई पारदर्शी विधि है जो मॉडल को सुरक्षा मानकों को सीधे सिखाने के लिए है, और मॉडल को उत्तर देने से पहले स्पष्ट रूप से मानकों को याद करने और सटीक रूप से तर्क करने के लिए प्रशिक्षित किया जा सकता है। इस विधि का उपयोग OpenAI के o श्रृंखला मॉडल को संरेखित करने के लिए किया गया है और OpenAI की सुरक्षा नीति का उच्च सटीकता से पालन सुनिश्चित किया गया है।

वर्तमान में, OpenAI बाहरी सुरक्षा परीक्षण को आगे बढ़ा रहा है, और वेबसाइट पर प्रारंभिक पहुंच के लिए आवेदन खोला है। आवेदकों को ऑनलाइन फॉर्म भरना होगा और संबंधित जानकारी प्रदान करनी होगी। चयनित शोधकर्ताओं को o3 और o3-mini तक पहुंच प्रदान की जाएगी, ताकि वे उनकी क्षमताओं का अन्वेषण कर सकें और सुरक्षा मूल्यांकन में योगदान कर सकें।