कृत्रिम बुद्धिमत्ता प्रौद्योगिकी के तेजी से विकास के साथ, ध्वनि हमारे मशीनों के साथ संचार का मुख्य तरीका बन गया है। फ्रांस की स्टार्टअप कंपनी Mistral ने आधिकारिक रूप से अपना पहला ओपन-सोर्स ऑडियो मॉडल - Voxtral लॉन्च किया है, जिसका उद्देश्य बड़ी कंपनियों के बंद प्रणालियों के एकाधिकार को तोड़ना है और डेवलपर्स के लिए एक अधिक लचीला और आर्थिक विकल्प प्रदान करना है।

Mistral कहता है कि Voxtral पहला ओपन-सोर्स मॉडल है जो वास्तविक अनुप्रयोगों में "वास्तव में उपयोगी ध्वनि बुद्धिमत्ता" प्रदान कर सकता है। इसका मतलब यह है कि डेवलपर्स को बजट-मितव्यय ओपन-सोर्स प्रणालियों और दक्ष लेकिन बंद समाधानों के बीच कठिन चयन नहीं करना पड़ेगा। Voxtral के "आधे से कम मूल्य" के फायदे के साथ, यह कंपनियों के लिए एक अधिक आर्थिक विकल्प प्रदान करता है।

image.png

Mistral के अनुसार, Voxtral 30 मिनट तक के ऑडियो को टाइप कर सकता है। इसके बड़े भाषा मॉडल Mistral Small3.1 पर आधारित होने के कारण, उपयोगकर्ता अधिकतम 40 मिनट तक के ऑडियो सामग्री को समझ सकते हैं। उपयोगकर्ता ऑडियो सामग्री से संबंधित प्रश्न पूछ सकते हैं, सारांश बना सकते हैं, यहां तक कि ध्वनि निर्देशों को वास्तविक समय में कार्यों में बदल सकते हैं, जैसे API कॉल करना या विशिष्ट कार्य करना। साथ ही, Voxtral कई भाषाओं का समर्थन करता है, जिसमें अंग्रेजी, स्पैनिश, फ्रेंच, पुर्तगाली, हिंदी, जर्मन, डच और इटैलियन शामिल हैं।

Mistral द्वारा दो "ध्वनि समझ मॉडल" वेरिएंट प्रदान किए गए हैं। पहला है Voxtral Small, जिसमें 24 बिलियन पैरामीटर हैं, जो उत्पादन स्तर के डेप्लॉयमेंट के लिए उपयुक्त है और ElevenLabs Scribe, GPT-4o-mini और Gemini2.5Flash जैसे प्रतिस्पर्धी के साथ तुलना करता है। दूसरा है Voxtral Mini, जिसमें 3 बिलियन पैरामीटर हैं, जो स्थानीय और एज डेप्लॉयमेंट के लिए उपयुक्त है। एक अत्यधिक आर्थिक संस्करण है, जिसमें 3 बिलियन पैरामीटर हैं, जिसे Voxtral Mini Transcribe कहा जाता है, जो टाइपिंग स्थितियों के लिए अनुकूलित है, जिसका दावा है कि इसकी क्षमता OpenAI के Whisper से अधिक है, लेकिन इसकी कीमत उसके आधे से कम है।

उपयोगकर्ता Hugging Face से Voxtral के API को मुफ्त में डाउनलोड कर सकते हैं, या Mistral के चैटबॉट Le Chat में परीक्षण कर सकते हैं। कंपनी के अनुसार, API के एकीकरण की कीमत प्रति मिनट 0.001 डॉलर से शुरू होती है। इस घोषणा के एक महीने पहले Mistral द्वारा लॉन्च किए गए अनुमान मॉडल Magistral के समय पर हुई। ये मॉडल धीरे-धीरे समस्याओं को हल करके विश्वसनीयता में सुधार करते हैं।

यूरोप की शीर्ष बुद्धिमान कंपनियों में से एक के रूप में, Mistral हमेशा ओपन-सोर्स AI मॉडल के विकास के समर्थन में रहा है। एक महत्वपूर्ण बात यह है कि हाल ही में खबर है कि Mistral निवेशकों के साथ बातचीत कर रहा है, जिसके लिए उसे अधिकतम 1 बिलियन डॉलर के निवेश की योजना है, जिसमें अबू धाबी के MGX फंड शामिल हैं।