20 अगस्त 2009

प्राकृतिक भाषा संसाधन में ’मंत्रा’ मशीनी अनुवाद तन्त्र की भूमिका

गोविन्द प्रसाद
भाषा-प्रौद्योगिकी विभाग


प्राकृतिक भाषा जैसे हिन्दी, अंग्रेजी, आदि को कम्प्यूटर में संसाधित कर अनुवाद प्राप्त करने में भारत की प्रमुख मशीनी अनुवाद तन्त्रों में ‘मन्त्रा’ मशीनी (कम्प्यूटर) अनुवाद तन्त्र है जो अनुवाद करता है, वह भी कम्प्यूटर के माध्यम से, अर्थात मन्त्रा एक मशीन (कम्प्यूटर) साधित अनुवाद सिस्टम है जो अंग्रेजी भाषा से हिन्दी भाषा में अनुवाद करता है। इस अनुवाद तन्त्र को सी-डैक, पुणे ने सन् 1997 ई. में आरम्भ किया था, तथा सन् 1998-99 ई. में इसको यहां के AAI (एप्लाइड आर्टिफिसियल इटैजिजेन्स) ग्रुप द्वारा विकसित किया गया। इसका मुख्य उद्देश्य सरकारी सूचनाओं, संकल्पों, आदेशों आदि कार्यालयी साहित्य का अंग्रेजी से हिन्दी में अनुवाद करना था। इस अनुवाद तन्त्र में व्याकरणिक विश्लेषण सिद्धांत के रूप में सुप्रसिद्ध कम्प्यूटेशनल भाषाविज्ञानी प्रो0 अरविन्द जोशी (पेन्सिलवेनिया यूनिवर्सिर्टी, अमेरिका से पी-एच.डी.) के वृक्ष संलग्न व्याकरण(TAG) को आधार बनाया गया। इस अनुवाद तन्त्र में निर्विशिष्ट अंग्रेजी वाक्यों का (XTAG) के रूप में विश्लेषण होता है और उसके अनुसार हिन्दी में अनुवाद किया जाता है। इस समय सी-डैक, पुणे ने 'मन्त्रा' मशीनी अनुवाद सिस्टम को और अधिक विकसित करके 'मंत्राराजभाषा' नाम रख दिया है, क्योंकि इसको मन्त्रालय के राजभाषा विभाग द्वारा काफी आर्थिक सहयोग एवं प्रोजेक्ट (परियोजना) मिले हैं। 'मंत्राराजभाषा' के भी उन्न्त संस्करण विकसित हो चुके है जो मंत्राराजभाषा स्टैण्डअलोन, मंत्राराजभाषा इन्ट्रानेट और मंत्राराजभाषा इन्टरनेट है।
• मंत्रा राजभाषा स्टैण्डअलोन उन प्रयोक्ताओं के लिए विकसित किया गया है, जो विना नेट कनेक्टिविटी के अपने पर्सनल कम्प्यूटर पर भी अनुवाद सिस्टम का उपयोग कर सके ।
मंत्राराजभाषा स्टैण्डअलोन संस्करण डाउनलोन के लिए URC:http://www.mantra-rajbhasha.cdac.in/mantra rajbhasha पर उपलब्ध है।

इस सिस्टम में दस्तावेजों को एक मेज से दूसरी मेज तक ले जाने की आवश्यकता नहीं है। सभी अनुवादित दस्तावेज केन्द्रित डाटाबेस में संचित होते है जो सभी सम्बन्धित अधिकारियों को उपलब्ध होते है।
मन्त्रा राजभाषा इन्टरनेट संस्करण का डिजाइन और विकास थिन क्लाइ्रट आर्किटेक्चर पर आधारित है। इसमें सम्पूर्ण अनुवाद प्रक्रिया सर्वर पर होती है। इसलिए दूरवर्ती स्थानों में भी इन्टरनेट कनेक्शन उपलब्ध लो-एण्ड सिस्टम पर भी दस्तावेजों के अनुवाद करने के लिए इस सुविधा का उपयोग किया जा सकता है। अत: इससे सीमित एवं दूरवर्ता क्षेत्रों में भी सर्वर के जरिए राजभाषा की कार्यवाहियों का ऑनलाइन हिन्दी में अनुवाद हो सकेगा।

'मन्त्रा' मशीनी अनुवाद तन्त्र के उपर्युक्त जितने भी नये संस्करण आये हैं। उन सभी को सी-डैक, पुणे के aaI ग्रुप द्वारा विकसित किया गया है। अभी इस ग्रुप द्वारा मशीनी अनुवाद को सफल बनाने का कार्य जारी है। आरम्भ में यह भारत सरकार के मन्त्रालयों, कार्यालयों द्वारा जारी आदेशों, सूचनाओं आदि का अनुवाद करता था, लेकिन इस समय (वर्तमान में) यह राजभाषा और राजभाषा के प्रशासनिक, वित्त एवं कृषि क्षेत्र की दस्तावेजों आदि को अंग्रेजी से हिन्दी में अनुवाद करता है। यह अनुवाद तन्त्र कठिन वाक्यों का भी अंग्रेजी से हिन्दी मं अनुवाद करने में सक्षम है। चूकि मशीन मानव का स्थान नहीं ले सकती, क्योकि मशीन (कम्प्यूटर) को अभी भी ambigiuty (संदिग्धता) की समस्या के वजह से निर्णय लेने में कठिनाई होती है। फिर भी यह अनुवाद तन्त्र प्रशासनिक क्षेत्र में 92 प्रतिशत एवं प्रशासनिक क्षेत्र के इतर में 60-65 प्रतिशन अनुवाद करने में सक्षम है।
मन्त्रा मशीनी अनुवाद तन्त्र को एवं इसके जितने भी नए संस्करण आये हैं उनको विकसित करने में कम्प्यूटर विज्ञानियों, कम्प्यूटेशनल भाषाविज्ञानियों, भाषा वैज्ञानिकों एवं अनुवाद वैज्ञानिकों का संयुक्त प्रयास रहा है जिनमें प्रो. यज्ञनारायण, डॉ. हेमन्त दरबारी, प्रो. महेन्द्र कुमार सी. पाण्डेय आदि का योगदान महत्वपूर्ण रहा।
सी. डैक, पुणे का कहना है कि टेक्नालॉजी आपके घर तक पहुंचेगी आपको उस तक पहुंचने की आवश्यकता नहीं है।
मन्त्रा मशीनी अनुवाद सिस्टम को कम्प्यूटर वर्ल्ड स्मिथसोनियन अवार्ड से पुरस्कृत किया गया और इसको अमेंरिका के ऐतिहासिक राष्ट्रीय संग्रहालय में वर्ष 1999 के नवीन शोध के रूप में रखा गया है।

कोई टिप्पणी नहीं:

एक टिप्पणी भेजें