20 अगस्त 2009

मशीनी अनुवाद की समस्याएँ

राहुल.एन.म्हैस्कर
भाषा-प्रौद्योगिकी विभाग


पिछले छ: दशकों से मशीनी अनुवाद के लिए विश्व के कई देशों और संस्थानों, विश्वविद्यालयों में कार्य चल रहे है, परंतु आज तक पूर्ण या स्वचलित मशीनी अनुवाद संभव नहीं हो सका है। आज भी मानव सहयोगी मशीनी अनुवाद पर ही कार्य कर रहा है। सर्वप्रथम मशीनी अनुवाद के लिए शब्दकोश की सहायता से प्रयत्न किया गया था। यह कंप्यूटर वैज्ञानिकों द्वारा किया गया प्रथम मशीनी अनुवाद का प्रयत्न था। मशीनी अनुवाद मशीन द्वारा स्रोत भाषा से लक्ष्य भाषा में किया जाने वाला मात्र शब्दों का अनुवाद न होकर उस भाषा की प्रकृति के अनुसार संरचना तथा भाव का भी रूपांतरण है। शब्दकोश से किया जाने वाला मशीनी अनुवाद सजातीय भाषाओं के लिए कुछ हद तक सही परिणाम देता है। परंतु यह विजातीय भाषाओं के लिए बिल्कुल उपयोगी नहीं है। मशीनी अनुवाद ऐसा होना चाहिए जिससे सभी भाषाओं का अनुवाद सभी भाषाओं में होना चाहिए तभी मशीनी अनुवाद का उद्देश्य सफल होगा। कृत्रिम बुध्दि निर्माण द्वारा मशीन को मानव बुद्धि की तरह ही सृजनशील बनाने का कार्य चल रहा है जिससे स्वचालित मशीनी अनुवाद का उद्देश्य सफल हो सके। इस दिशा में भारत में किए गए कार्य में आई.आई.टी. हैदराबाद द्वारा निर्मित अनुसारक तथा सी-डैक पुणे निर्मित मंत्रा हिन्दी-अंग्रेजी मशीनी अनुवाद तंत्र काफी हद तक कारगार साबित हुआ है। फिर भी यह मानव सहयोगी ही है। अत: पूर्ण रूप से स्वचलित मशीनी अनुवाद के लिए कुछ कठिनाईयाँ है, जिन्हें यहां बताने का प्रयास किया जा रहा है।
1) कंप्यूटर में सृजनशीलता का अभाव :- कंप्यूटर एक मशीन मात्र है वह मानव की तरह सोच नहीं सकती जिसके कारण किसी भी भाषा की प्रकृति को वह नहीं समझ सकता मानव अपनी बुद्धि से अनेक समस्याओं का हल खुद ढूँढ़ लेता है लेकिन कंप्यूटर में यह क्षमता नहीं है।
2) विजातीय भाषाएँ :- मशीनी अनुवाद की एक समस्या है भाषाओं का विजातीय होना। हर भाषा की अपनी प्रकृति होती है और उसके अनुसार उसकी संरचना होती है। हिन्दी और अंग्रेजी दोनों विजातीय भाषाएं है जिसके कारण इनकी संरचना भिन्न है और इसके चलते मशीनी अनुवाद के लिए यह कठिनाईयाँ पैदा करती है।
3) सार्वभौमिक व्याकरण का अभाव :- चॉमस्की द्वारा अनेक सार्वभौमिक व्याकरणों का निर्माण किया गया परंतु आज भी मशीनी अनुवाद के लिए आवश्यक सार्वभौमिक अर्थात् सारी भाषाओं पर आधारित नियमों से संबद्ध एक व्याकरण उपलब्ध नहीं हो पाया है। इसके चलते मशीनी अनुवाद के लिए आवश्यक अनुप्रयोगों के विकास में शिथिलता है।
4) एक शब्द के अनेक पर्यायी शब्दों का होना :- एक शब्द के अनेक पर्यायी शब्द होने के कारण डाटाबेस में स्थापित किसी एक भाषा के शब्द का लक्ष्य भाषा में अनेक शब्दों का होना मशीन के लिए सही शब्द का चुनाव करना चुनौती है। और इसी वजह से गूगल वेब पर होने वाला मशीनी अनुवाद उपयुक्त नहीं कहा जा सकता।
5) भाशिक अनुप्रयोगों का अभाव :- मशीनी अनुवाद के लिए अनेक नियमों से संबद्ध भाषिक अनुप्रयोगों की जरूरत होती है। जैसे-संगणकीय कोश, संगणकीय व्याकरण, वर्तनी जांचक, जनरेटर, अभिज्ञानक और अंतरण सॉफ्टवेअर आदि। इन अनुप्रयोगों का प्रर्याप्त मात्रा में तथा पूर्ण रूप में विकास न होना भी मशीनी अनुवाद के लिए एक समस्या है।
6) कृत्रिम बुध्दि के विकास में देरी :- कृत्रिम बुध्दि विकास के द्वारा मशीन को मानव बुध्दि की तरह ही कृत्रिम बुद्धि प्रदान करने का कार्य चल रहा है जिसमें अनेक कंप्यूटर तथा भाषा वैज्ञानिक कार्य कर रहें है। इसके विकास से कंप्यूटर को मानव की तरह ही सृजनशीलता प्राप्त हो जाएगी। लेकिन इसमें देरी भी मशीनी अनुवाद की एक समस्या है।
7) संग्रहन क्षमता की कमी :- कंप्यूटर के विकास के साथ साथ ही उसकी संग्रहन क्षमता में भी वृध्दि हूई है। परंतु संपूर्ण भाषा की प्रकृति को इसमें कैद कर पाना आज भी संभव नहीं हो पाया है इसकी संग्रहन क्षमता आज भी कम है। जिससे सारे भाशिक अनुप्रयोंगों को एक ही स्मृति में रखना कठिन होता है। जिससे कंप्यूटर की तेजी में भी कमी आ जाती है।
8) भाषा वैज्ञानिकों का अभाव :- भाषा के नियमों को सृजित करने के लिए मुख्यत: भाषा वैज्ञानिकों की जरूरत होती है। लेकिन मशीनी अनुवाद के क्षेत्र में काम करने वालों में ज्यादातर कंप्यूटर वैज्ञानिक ही है न कि भाषा वैज्ञानिक जिससे इस कार्य को समस्याओं से जूझना पड़ रहा है।
निष्कर्षत: यह कहा जा सकता है कि उपर्युक्त समस्याओं को दूर किए जाने से मशीनी अनुवाद के लिए कंप्यूटर और भाषा वैज्ञानिकों द्वारा प्रयत्न किए जाने पर स्वचलित मशीनी अनुवाद जल्द ही सफल हो जाएगा। कृत्रिम बुध्दि का विकास इसी को पूर्ण करने का एक चरण है।

कोई टिप्पणी नहीं:

एक टिप्पणी भेजें