वॉयस तकनीक का लोकतंत्रीकरण: आईआईएससी 9 भाषाओं में ओपन सोर्स तकनीक पर काम कर रहा है; 2 मिलियन डॉलर जुटाता है | इंडिया न्यूज – टाइम्स ऑफ इंडिया

बेंगलुरू: भारतीय विज्ञान संस्थान (आईआईएससी) के शोधकर्ताओं की एक टीम भारतीय भाषाओं में ओपन सोर्स वॉयस टेक्नोलॉजी पर काम कर रही है जो प्रौद्योगिकी का लोकतंत्रीकरण कर सकती है और स्पेक्ट्रम के लोगों तक पहुंच को सक्षम कर सकती है, जिसने परियोजना के पहले चरण के लिए $ 2 मिलियन जुटाए हैं।
परियोजना का उद्देश्य ओपन वॉयस डेटासेट विकसित करना है जिसका उपयोग मशीन लर्निंग एल्गोरिदम को स्वतंत्र रूप से सुलभ तरीके से प्रशिक्षित करने और ओपन-सोर्स एआई-आधारित समाधानों के निर्माण को सक्षम करने के लिए किया जा सकता है।
जबकि एलेक्सा, कोरटाना, सिरी, गूगल असिस्टेंट और अन्य जैसे डिजिटल सहायकों के साथ आवाज प्रौद्योगिकियों ने उल्लेखनीय प्रगति देखी है, शोधकर्ताओं ने बताया कि साक्षरता, कौशल की बाधाओं के कारण कम आय वाले क्षेत्रों के लोगों को इस तकनीकी क्रांति के लाभों से बाहर रखा जा रहा है। , गरीबी, लिंग और अन्य सामाजिक-आर्थिक पूर्वाग्रह।
“यह कम आय वाली महिलाओं के लिए विशेष रूप से सच है क्योंकि पहुंच, शिक्षा, अधिकार और सशक्तिकरण में मौजूदा लिंग अंतर उनके लिए डिजिटल विभाजन को और भी खराब कर देता है। इन बहिष्कृत समूहों की भाषाओं, बोलियों और लहजे को नए कृत्रिम बुद्धिमत्ता (एआई) और मशीन लर्निंग (एमएल) मॉडल के निर्माण में बड़े पैमाने पर नजरअंदाज कर दिया जाता है, ”आईआईएससी का बयान पढ़ा।
आईआईएससी शोधकर्ताओं की एक टीम के नेतृत्व में Prasanta Kumar Ghosh, एसोसिएट प्रोफेसर, इलेक्ट्रिकल इंजीनियरिंग विभाग, इन हाशिए की आबादी पर लक्षित स्थानीय भाषाओं में आवाज प्रौद्योगिकी के साथ इस डिजिटल विभाजन को पाटने के लिए आशान्वित हैं।
घोष की परियोजना का लक्ष्य नौ भारतीय भाषाओं – कन्नड़, भोजपुरी, मैथिली, मघाड़ी, हिंदी, छत्तीसगढ़ी, बंगाली, तेलुगू और मराठी – कृषि और वित्त के क्षेत्र में जो गरीब किसानों और महिलाओं के लिए अत्यधिक प्रासंगिक हैं।
“$ 2 मिलियन का लगभग 80% बिल से आ रहा है और मेलिंडा गेट्स फाउंडेशन और शेष जर्मन विकास सहयोग पहल (एफएआईआर फॉरवर्ड – सभी के लिए आर्टिफिशियल इंटेलिजेंस) से अनुदान है। हम 2022 के अंत तक परियोजना के पहले चरण को पूरा करने के लिए आश्वस्त हैं, ”घोष ने टीओआई को बताया।
आईआईएससी ने कहा कि फेयर फॉरवर्ड का निवेश इन नौ भाषाओं में टेक्स्ट-टू-स्पीच एप्लिकेशन के विकास के लिए वॉयस आर्टिस्ट से लगभग 1,000 घंटे की लिंग-संतुलित उच्च-गुणवत्ता वाली भाषण रिकॉर्डिंग के संग्रह का समर्थन करेगा।
घोष ने कहा कि दो भाषाओं में नमूने एकत्र करने का काम शुरू हो चुका है और अन्य भाषाओं पर भी जल्द ही काम शुरू किया जाएगा.
भारतीय भाषाओं में इस तरह की आवाज प्रौद्योगिकियों के निर्माण के लिए आवश्यक मौजूदा प्रशिक्षण डेटा सेट में से अधिकांश सार्वजनिक डोमेन में नहीं हैं और स्थानीय नवाचार की कमी है और यह अत्यधिक लाभदायक आर्थिक रूप से विकसित बाजारों में उपयोग की जाने वाली भाषाओं और उच्चारण पर भी केंद्रित है, जो शहरी और शिक्षित के प्रति पक्षपाती है। उपयोगकर्ताओं, शोधकर्ताओं ने जोड़ा।
“ओपन वॉयस डेटा का संग्रह, विशेष रूप से कम साक्षर और हाशिए की आबादी के लिए, स्थानीय एआई पारिस्थितिकी तंत्र को मजबूत करेगा और लाखों लोगों को उन सेवाओं तक पहुंचने में सक्षम करेगा जो वे अभी तक उपयोग करने में सक्षम नहीं हैं – चाहे वह कृषि, शिक्षा, स्वास्थ्य या अन्य क्षेत्रों में हो। , “शोधकर्ताओं ने कहा।
शोधकर्ताओं ने कहा कि भारत में क्षेत्रीय आवाज प्रौद्योगिकियों के विकास में नवाचार और अकादमिक गतिविधि को बढ़ावा देने के लिए भारतीय शिक्षाविदों, स्टार्ट-अप, शोधकर्ताओं और डेवलपर्स के लिए डेटासेट खुले तौर पर और स्वतंत्र रूप से उपलब्ध कराए जाएंगे, जो एक प्रौद्योगिकी पारिस्थितिकी तंत्र को सक्षम करने में महत्वपूर्ण होगा। जीवन बदलने वाली डिजिटल सेवाएं लाखों उपयोगकर्ताओं के लिए सुलभ हैं।

.