किस IIT ने भारती लिपि को पढ़ने के लिए ओसीआर सिस्टम का विकास किया?
उत्तर – IIT मद्रास
IIT मद्रास के अनुसंधानकर्ताओं ने भारती लिपि के लिए सरल ओसीआर सिस्टम विकसित किया, इस शोधकार्य का नेतृत्व प्रोफेसर वी. श्रीनिवास चक्रवर्ती द्वारा किया गया। इस प्रणाली के द्वारा भारती स्क्रिप्ट में लिखे गये दस्तावेजों को कंप्यूटर द्वारा पढ़ा जा सकता है।
भारती स्क्रिप्ट
भारती स्क्रिप्ट एक एकीकृत लिपि है, इसमें नौ भारतीय भाषाएँ शामिल हैं। इसमें देवनागरी, बंगाली, गुरुमुखी, गुजराती, ओड़िया, तेलुगु, कन्नड़, मलयालम तथा तमिल शामिल हैं। इसमें उर्दू और अंग्रेजी को शामिल नहीं किया गया है क्योंकि इनका ध्वन्यात्मक गठन काफी भिन्न है।
यह आवश्यक क्यों है?
कई यूरोपीय भाषाएँ (अंग्रेजी, फ्रेंच, जर्मन, इटालियन इत्यादि) रोमन लिपि का उपयोग एक आम लिपि के रूप में करती है, इस उन सभी देशों में संचार में आसानी होती है, जिन देशों में इस आम लिपि का उपयोग किया जाता है। इस प्रकार हमारे देश में विभिन्न भाषाएँ हैं, यदि हमारे देश में ही एक आम लिपि हो तो संचार बाधा काफी हद तक कम हो जायेगी।
ओसीआर (ऑप्टिकल करैक्टर रिकग्निशन) स्कीम)
यह सबसे पहले डॉक्यूमेंट को टेक्स्ट तथा नॉन-टेक्स्ट में विभाजित कर देता है। बाद में टेक्स्ट को पैराग्राफ, वाक्य, शब्द तथा वर्णों में विभाजित किया जाता है। प्रत्येक वर्ण को करैक्टर के रूप में ASCII अथवा Unicode में चिन्हित किया जाता है।