प्रोजेक्ट वाणी (Project Vaani) क्या है?

प्रोजेक्ट वाणी को भारतीय विज्ञान संस्थान (IISc), ARTPARK (AI and Robotics Technology Park), और गूगल द्वारा संयुक्त रूप से लागू किया जाएगा ताकि AI-आधारित भाषा मॉडल के निर्माण के लिए पूरे भारत से भाषण डेटा एकत्र किया जा सके जो विविध भारतीय भाषाओं को समझ सके। 

प्रोजेक्ट वाणी क्या है?

  • प्रोजेक्ट वाणी के तहत, 3 वर्षों में 773 जिलों के लगभग 1 मिलियन लोगों के भाषण सेट एकत्र करके पूरे भारत में उपयोग की जाने वाली विविध भाषाओं का मानचित्रण किया जाएगा।
  • इस परियोजना की अनुमानित लागत लगभग 30 से 40 मिलियन अमरीकी डालर है।
  • यह बेंगलुरु स्थित IISc और आर्टपार्क की भाशा एआई परियोजना का हिस्सा है जिसमें RESPIN (Recognizing Speech in Indian languages) और SYSPIN (Synthesizing Speech in Indian languages) शामिल है।
  • इस परियोजना में IISc और गूगल लगभग 1.5 लाख घंटे के भाषण की रिकॉर्डिंग करेंगे, जिसका एक हिस्सा स्थानीय लिपियों में लिप्यंतरित किया जाएगा।
  • यह परियोजना एक जिला-स्थिर दृष्टिकोण का उपयोग करती है, जिसमें प्रत्येक जिले से 1,000 से अधिक लोगों को बेतरतीब ढंग से चुनकर स्थानीय भाषणों को रिकॉर्ड करना शामिल है।

इस पहल के उद्देश्य क्या हैं?

  • इस परियोजना के मुख्य उद्देश्यों में से एक स्वचालित भाषण पहचान, भाषण से भाषण अनुवाद और प्राकृतिक भाषा समझ जैसी तकनीकों का विकास है।
  • इसका अंतिम लक्ष्य एक तकनीकी समाधान प्रदान करना है जो वर्तमान में प्रौद्योगिकी में मौजूद भाषाई बाधाओं को समाप्त कर सकता है और व्यापक श्रेणी के लोगों के लिए प्रौद्योगिकी की पहुंच में वृद्धि कर सकता है।
  • एक बार जब यह परियोजना पूरी तरह से पूरी हो जाएगी, तो एक कृत्रिम बुद्धि-आधारित भाषा मॉडल बनाने का प्रयास किया जाएगा जो भारत में उपयोग की जाने वाली विविध भाषाओं और बोलियों को समझ सके।

परियोजना की वर्तमान स्थिति क्या है?

  • पिछले कुछ महीनों में, पूरे भारत से लगभग 69 जिलों का भाषाई डेटा एकत्र किया गया है।
  • अब तक, लिंग और आयु-संतुलित तरीके से 841 विभिन्न पिन कोड से 30 से अधिक भाषाओं को कवर करते हुए, 150 घंटे से अधिक डेटा एकत्र किया गया है।

Categories:

Tags: , , , , ,

Advertisement

Leave a Reply

Your email address will not be published. Required fields are marked *