भारतीय स्टार्टअप Sarvam AI ने आर्टिफिशियल इंटेलिजेंस की वैश्विक दौड़ में मजबूत दस्तक दी है। कंपनी के Vision मॉडल ने अंतरराष्ट्रीय OCR बेंचमार्क में गूगल जेमिनी और अन्य प्रमुख AI मॉडल्स को पीछे छोड़कर तकनीकी जगत में हलचल मचा दी है।
Sarvam AI के को-फाउंडर प्रत्यूष कुमार के अनुसार, 5 फरवरी को जारी परिणामों में Sarvam Vision ने olmOCR-Bench में 84.3% सटीकता दर्ज की। वहीं OmniDocBench v1.5 में इसका स्कोर 93.28% रहा। यह बेंचमार्क किसी AI मॉडल की ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) क्षमता—यानी स्कैन डॉक्यूमेंट, हैंडराइटिंग, जटिल फॉन्ट और लेआउट समझने की योग्यता—को परखता है।
भारतीय भाषाओं पर खास पकड़
Sarvam Vision को विशेष रूप से भारतीय भाषाओं और लिपियों, खासकर देवनागरी, पर प्रशिक्षित किया गया है। यही वजह है कि यह मॉडल तकनीकी टेबल, गणितीय फॉर्मूले और जटिल दस्तावेज संरचनाओं को बेहतर ढंग से समझने में सक्षम बताया जा रहा है। मिश्रित भाषा वाले सरकारी फॉर्म, कानूनी दस्तावेज और क्षेत्रीय सामग्री प्रोसेसिंग में इसकी उपयोगिता अधिक मानी जा रही है।
विशेषज्ञों का मानना है कि यह भारतीय कंपनियों के लिए एक किफायती और स्वदेशी विकल्प साबित हो सकता है, खासकर डॉक्यूमेंट डिजिटाइजेशन और प्रोसेसिंग के क्षेत्र में।
Bulbul V3 ने भी खींचा ध्यान
कंपनी का टेक्स्ट-टू-स्पीच मॉडल Bulbul V3 भी चर्चा में है। दावा है कि भारतीय उच्चारण और आवाज़ों के मामले में इसने वैश्विक प्लेटफॉर्म ElevenLabs जैसे मॉडलों को बेंचमार्क में पीछे छोड़ा है।
सीमित दायरे में बढ़त
हालांकि, विशेषज्ञ यह भी स्पष्ट कर रहे हैं कि Sarvam AI की यह बढ़त फिलहाल विशिष्ट क्षेत्रों—जैसे OCR और टेक्स्ट-टू-स्पीच—तक सीमित है। ChatGPT और Gemini जैसे मॉडल जनरल-पर्पज़ AI हैं, जो कोडिंग, जटिल विश्लेषण, मेडिकल इमेजिंग और बहुआयामी बातचीत जैसे व्यापक कार्यों में सक्षम हैं।
Sarvam Vision अपेक्षाकृत छोटा मॉडल है, जिसमें लगभग 3 बिलियन पैरामीटर्स हैं, जबकि बड़े वैश्विक मॉडल्स के पैरामीटर्स की संख्या ट्रिलियन स्तर तक मानी जाती है। बड़े मॉडल्स के लिए भारी कंप्यूटिंग इंफ्रास्ट्रक्चर और हजारों GPUs की आवश्यकता होती है, जो भारत में अभी सीमित है।
क्या संकेत देती है यह सफलता?
तकनीकी जानकारों के मुताबिक, Sarvam AI की उपलब्धि यह दर्शाती है कि भारत में प्रतिभा और नवाचार की कमी नहीं है। यदि कंप्यूटिंग इंफ्रास्ट्रक्चर और निवेश में बढ़ोतरी होती है, तो भारतीय स्टार्टअप्स वैश्विक AI परिदृश्य में और बड़ी भूमिका निभा सकते हैं।
Vision और Bulbul की सफलता इस बात का संकेत है कि स्थानीय जरूरतों पर केंद्रित, भाषा-विशिष्ट समाधान भारत को AI की वैश्विक प्रतिस्पर्धा में नई पहचान दिला सकते हैं।
