क्रिस्पर व्हिस्पर ओपनएआई के व्हिस्पर मॉडल का एक उन्नत संस्करण है, जिसे तेज़, सटीक और शब्द-दर-शब्द ध्वनि पहचान के लिए डिज़ाइन किया गया है, जो सटीक शब्द-स्तर के टाइमस्टैम्प प्रदान करता है। मूल व्हिस्पर मॉडल की तुलना में, क्रिस्पर व्हिस्पर का उद्देश्य प्रत्येक बोले गए शब्द को शब्दशः ट्रांसक्राइब करना है, जिसमें फिलर शब्द, रुकावटें, हकलाना और गलत शुरुआत शामिल हैं। यह मॉडल टेड, एएमआई जैसे शब्दशः डेटासेट में पहले स्थान पर रहा है और इंटरस्पेच 2024 में इसे स्वीकार किया गया था।