17 सितंबर 2009

इस अंक के सदस्य

सँपादक - अर्चना बलवीर
शब्द-संयोजन - हर्षा वडतकर
संपादक-मंडल - राहुल म्हैस्कर, नितिन रामटेके

संपादक के की-बोर्ड से

हिन्दी देश में सर्वाधिक बोली और प्रयोग की जाने वाली भाषा है। भारत के संविधान के अनुसार हिन्दी भाषा को संघ की राजभाषा का स्थान दिया गया है।आज से 60 वर्ष पहले 9 सितम्बर 1949 के दिन हिन्दी को राजभाषा का दर्जा दिया गया था, किन्तु राष्ट्र्भाषा प्रचार समिति वर्धा के अनुरोध पर सन् 1953 में पूरे भारत में 14 सितम्बर को प्रतिवर्ष हिन्दी दिवस के रूप में मनाया जाता है। भाषा सामाजिक व्यवहार के आदान–प्रदान का माध्यम है। विश्व में हजारों भाषाएं और बोलियां बोली जाती है, जिसमें अनेक दृष्टियां, जीवन–शैलियां और साहित्य अभिव्यक्त होते हैं। भाषा के माध्यम से मनुष्य अपने पूर्वजों के विचारों को जान पाता है और भविष्य निर्माण की रूपरेखा भी तैयार करता है। आधुनिक भाषा विज्ञान को तकनीकी के साथ जोड़ने से अनुप्रयुक्त भाषा विज्ञान का क्षेत्र व्यापक हुआ है जिसमें हम भाषा के विविध अनुप्रयोगों को देखते हैं। हमारा यह विशेषांक 14 सितम्बर के उपलक्ष्य में तैयार किया गया इसके अतिरिक्त हमने कई आलेखों को प्रयास पत्रिका में सम्मिलित किया है। भाषा मूलत: सामाजिक यथार्थ है जो सामाजिक उपकरणों एवं संदर्भों के साथ जुड़कर व्यावहारिक बनती है। भाषा विज्ञान की वह शाखा जो भाषा का इस दृष्टि से अध्ययन करती है वह समाजभाषा विज्ञान कहलाती है। समाजभाषा विज्ञान के अंतर्गत लेबाव के जीवन परिचय का वृतांत प्रस्तुत किया गया है। सूचना प्रौद्योगिकी के क्षेत्र में आज प्रौद्योगिकी अधिक उन्नत हो रही है। इस क्रम में सूचना भंडारण की एक आधुनिकतम पद्धति लोकप्रिय होती जा रही है जिसे यूनिकोड कहा जाता है। यूनिकोड आधारित कम्प्यूटरों में हर काम किसी भारतीय भाषा में किया जा सकता है। प्रत्येक वेबसाइट अलग–अलग फोंट का उपयोग होने के कारण सर्च इंजनों के लिए उनकी विषय–वस्तु को समझना होता है। यूनिकोड के प्रयोग से यही कार्य आसान हो गया है। यूनिकोड के उपयोग के साथ यूनिकोड की संकल्पना को इसमें स्पष्ट किया है। परंपरागत भाषाविज्ञान में जो कार्य मनुष्य की काफी मेहनत के बाद पूरा होता था वह कार्य आधुनिक भाषाविज्ञान के युग में कम्प्यूटर द्वारा करने का प्रयास किया जा रहा है यह परंपरागत बनाम आधुनिक भाषाविज्ञान की तुलना कर दिखाने की कोशिश इस अंक में की गयी। साथ ही साथ भारत में हिन्दी की तुलना में अंग्रेजी का अधिक प्रयोग होता है जबकि संघ की राजभाषा हिन्दी है तो भारत में हिन्दी भाषा की स्थिति की ओर पाठकों का ध्यान खींचने की कोशिश की गई है।
अर्चना बलवीर

विलियम लेबोव

विलियम लेबोव एक अमेरिकी भाषाविद् हैं। इन्हें व्यापक रूप से समाजभाषाविज्ञान का संस्थापक माना जाता है। इनका जन्म 4 दिसंबर 1927 को रदरफोर्ड, न्यू जर्सी में हुआ था। भाषायी परिवर्तन और विभिन्नता (Linguistic Change and Diversity) का अध्ययन करना इनका प्रमुख कार्य है। अपने लंबे एवं प्रतिष्ठित करियर में इन्होंने भाषाविज्ञान के अध्ययन को एक सैद्धांतिक स्वरूप प्रदान कर वैज्ञानिक अध्ययन पर जोर दिया था। लेबोव का अध्ययन 1948 में हावर्ड में हुआ था। सन् 1963 में एम.ए. परियोजना कार्य समाप्त किया, साथ ही उन्होंने मार्था दाख के बोली–भाषा में परिवर्तन पर अपना अध्ययन पूर्ण किया। तत्पश्चात् 1964 में कोलंबिया विश्वविद्यालय से पी–एच.डी. की उपाधि लेने से पूर्व 1949–61 में उन्होंने भाषाविज्ञान की ओर से एक औद्योगिक रसायनज्ञ के रूप में कार्य किया। उन्होंने 1966 में न्यूयार्क शहर में अंग्रेजी के सामाजिक स्तरीकरण पर लिखा। 1970 के दशक में Black English Vernacu पर लेबोव द्वारा किया गया अध्ययन काफी प्रभावशाली रहा है। उन्होंने BEV के संदर्भ में कहा कि BEV घटिया स्तिग्मातिजेद के रूप में नहीं होना चाहिए किंतु अपने ही व्याकरणिक नियमों के साथ अंग्रेजी के विभिन्न भाषिक रूपों का सम्मान किया जाना चाहिए। वे मानते हैं कि ब्लैक इंग्लिश वास्तव में अपनी व्याकरणिक प्रणाली के साथ एक वैध बोली है और स्कूलों में एक विदेशी भाषा के रूप में इसका व्यवहार किया जाना चाहिए। हालाँकि BEV के वक्ताओं ने तर्क दिया कि समाज में संपर्क स्थापित करने के लिए बड़े स्तर पर अमेरिकी अंग्रेजी सीखने के लिए लोगों को प्रोत्साहित किया जाना चाहिए।
कार्य– सन् 1971 में विलियम लेबोव ने पेनसिल्वेनिया विश्वविद्यालय में भाषाविज्ञान के प्रोफेसर बनने से पूर्व कुछ समय कोलंबिया में पढ़ाया। 1977 में वे भाषाविज्ञान प्रयोगशाला के निदेशक बने। उन्होंने अपने अध्ययन के लिए आँकड़ों को एकत्रित करने के लिए न्यूयार्क शहर में अंग्रेजी के भाषिक रूपों का उपयोग किया, जो कि न्यूयार्क में अंग्रेजी के सामाजिक स्तरीकरण (1966) के रूप में प्रकाशित है। उनका यह अध्ययन काफी प्रभावशाली रहा है। 2006 में उन्होंने अपने सह–लेखक शोरोन ऐश और चाल्र्स बोबर्ज के साथ मिलकर उत्तर अमेरिकी अंग्रेजी का एटलस प्रकाशित किया। 1979 में वे अमेरिका के भाषाई समाज के अध्यक्ष के रूप में सेवारत थे। वे राष्ट्रीय विज्ञान अकादमी के सदस्य थे। उन्होंने समाजभाषाविज्ञान और बोलीविज्ञान के विषय में अनुसंधान किया। अपने अनुसंधान में उन्होंनें भाषा के सामाजिक स्तरीकरण और भाषायी परिवर्तन–संचालन पर जोर दिया। बाद में उन्होंने संयुक्त राज्य अमेरिका में प्रयुक्त अंग्रेजी के ध्वनिविज्ञान में परिवर्तन का अध्ययन किया। साथ ही मूल एवं स्वर के sरिन्खला में बदलाव के पैटर्न का भी अध्ययन किया। (एक स्वर के स्थान पर दूसरा स्वर, दूसरे के स्थान पर तीसरा और फिर एक पूरी ाृंखला)। विलियम लेबोव द्वारा किये गये कुछ प्रमुख कार्य निम्नवत् हैं– Black English Vernacular (1970)
Sociolinguistic Patterns (1972)

Principals of Linguistic Change (vol.1 Internal Factors, 1994; vol.2 Social Factors,2001)
लेबोव के प्रसिद्ध छात्रों में John Baugh, Penelope Eckert, Gregory Guy, Beatrice Lavandera, John Myhill, Geoffrey Nunberg, Peter Patrick, Shana Poplack, John Rick fort, Deborah Schiffrin Malacah, Yaeger- Dror रहे है।
प्रस्तुति
मोहिनी मुरारका
एम.ए. हिन्दी (भाषा–प्रौद्योगिकी)

08 सितंबर 2009

इस अंक के सदस्य

सम्पादक - अर्चना बलवीर

शब्द-संयोजन -राहुल म्हैसकर, हर्षा वडतकर,

Website लिंक भाषाविज्ञान सम्बन्धी

- Anamika कुमारी
3rd Semester, Hindi L।T।
MGAHV वर्धा

हिन्दी दिवस या शोक दिवस

संतोष कुमार सिंह
एम। आई. एल. ई.
सबसे अधिक हैरानी और दु:ख होता है जब पूरे देश में 14 सितम्बर को हिन्दी दिवस मनाया जाता है। कार्यालयों, विद्यालयों तथा अन्य संस्थाओं में अजीब तमाशे का माहोेल होता है। 14 सितम्बर को देश के छोटे–बडे लगभग सभी हिन्दी संस्थाओं में इस उपलक्ष्य में आयोजन होता है। उनमें सरकारी या गैर सरकारी संस्थाओं के अंगे्रजी भक्त ही मुख्य अतिथि बनाए जाते है। जो अपने विचार हिन्दी के समर्थन में रखते तो है पर इनमें भी 70 प्रतिशत शब्द अंग्रेजी भाषा के ही होते हैं और तो और इन समारोह में पधारे कवियों और साहित्यकारों व अन्य को उपहार स्वरुप दिया जानेवाला उपहार भी अपने देश का नहीं बल्कि दूसरे देशों का बना होता है और अगली सुबह समाचार पत्रों में बडे–बडे अक्षरों में छपा होता है
‘‘संस्थान में हिन्दी दिवस का आयोजन सफल रहा।‘‘और हिन्दी दिवस की औपचारिकता पूरी हो जाती हैं। यह सब देख कथाकार भीष्म साहनी की एक कहानी ‘‘चीफ की दावत‘‘ के नायक की बूढी मॉं बहुत याद आती है। चीफ अमेरिकन है उसे दावत पर बुलाया गया है उसके साथ–साथ दप्तर के अन्य अफसर भी अपनी पत्नी सहित आते है। घर को पाश्चात्य शैली से जितना संभव है सजाया गया था पर पति–पत्नी बूढी मॉं को लेकर बेहद परेशान हैं, मॉं उनके आधुनिक वातावरण में कही फिट नही बैठती है। डरी सहमी मॉं पुत्र के हर आदेश का पालन करती हुई सबसे अलग एक कोने में छुपी बैठी है। पर अफसोस अमेरिकन बांॅस घर में घुमता फिरता , घर के रख रखाव की प्रशंसा करता हुआ उस कोने में पहुॅच जाता है। रात में मॉं के पीछे पडकर अपनी तरक्की का वासता देकर मॉं को फुलकारी बनाने के लिए तैयार कर लेता है। वह एक दिन मॉं की महत्ता का दिन बन जाता है।
क्या भारतवर्ष में हिन्दुस्तान में हिन्दी की ऐसी ही दशा होने वाली है? विदेशों की ओर गमन और अंग्रेजी का नमन हमें किस ओर ले जा रहा है अथवा ले जाएगा आज भी परीक्षा के परिणामों में गणित, विज्ञान और अंग्रेजी महत्वपूर्ण होते है जबकि हिन्दी के शत–प्रतिशत परिणाम की ओर किसी का ध्यान नही जाता। आज प्रत्यक्ष या अनौपचारिक रुप से लोग को राष्ट्रभाषा कह देते है। किन्तु संविधान के अनुसार हिन्दी राजभाषा है। यह भारतीयों की हीन भावना का ही परिणाम है कि देश मे हिन्दी की स्थिति बद से बदतर होती जा रही हैं।
खैर इस विषय को आगे बढाते हुए ‘‘यह कहना चाहता हूं कि भारत का राष्ट्रगान एक है, राष्ट्रध्वज एक हैं , राष्ट्रीय पशु एक हैं, राष्ट्रीय पक्षी एक है, तो हमारी राष्ट्रभाषा एक क्यों नहीं?
क्या हम अपनी राष्ट्रभाषा के विकास के द्वारा देश का विकास नही कर सकते हैं? देशवासी प्रतिवर्ष हिन्दी दिवस मनाते है और उसमें रोष और रुदन करते है कि हिन्दी का विकास होना चाहिए। क्या अर्थ है इसका ? अर्थात् सब कुछ ठीक नहीं है। सच कहा जाय तो ‘‘14 सितम्बर हिन्दी दिवस नहीं, बल्कि हिन्दी का शोक दिवस ही है’’ और इसका समाधान भारतेन्दु हरिश्चन्द्र की इन पंक्तियों में छिपा हुआ है–

‘‘निज भाषा उन्नति अहै, सब उन्नति को मूल।
बिन निज भाषा ज्ञान के, मिट न हिय को शूल।।‘‘

त्रुटि–विश्लेषण (भाषा–शिक्षण के सन्दर्भ में)

हर्षा वडतकर

भाषा विचारों को व्यक्त करने का मौखिक साधन है। हम अपने विचार भाषा के द्वारा दूसरे व्यक्ति तक पँहुचाते है। अपने विचारों को स्पष्ट एवं प्रभावी रूप से अभिव्यक्त करने के लिए भाषण में उच्चारणगत स्पष्टता होना अनिवार्य है। इसलिए भाषा सीखते समय भाषायी कौशलों का ध्यान रखा जाता है। भाषा की संरचना भिन्न होने से भाषा में समान और असमान तत्वों का होना स्वाभाविक है इसके कारण द्वितीय भाषा सीखने में कठिनाई होती है। इन कठिनाईयों को दूर करने के लिए भाषा शिक्षण में कई पद्धतियों का विकास किया गया जिसे द्वितीय भाषा सीखना आसान हो गया है जैसे व्यतिरेकी विश्लेषण, त्रुटि विश्लेषण आदि।
भाषायी अध्ययन में भाषा सीखते समय जो कठिनाईयाँ आती है उसे व्यतिरेकी विश्लेषण के अन्तर्गत रखा जाता है। अर्थात् इस पद्धति के द्वारा असमानताओं का अध्ययन किया जाता है और भाषा सीखने में होनेवाली भाषागत कठिनाईयों का पूर्वानुमान लगाया जाता है।
भाषा शिक्षण के सन्दर्भ में त्रुटि विश्लेषण पद्धति का विकास व्यतिरेकी विश्लेषण की प्रतिक्रिया के रूप में हुआ क्योंकि भाषा सीखने की प्रक्रिया को अगर प्रभावशाली बनाना है तो व्यतिरेकी विश्लेषण के साथ–साथ त्रुटि विश्लेषण होना जरूरी है। क्योंकि व्यतिरेकी विश्लेषण से भाषा शिक्षण की सभी त्रुटियों को नहीं पकड़ा जा सकता, त्रुटि विश्लेषण का तात्पर्य यह है कि अन्य भाषा अधिगम की प्रक्रिया में अध्येताओं द्वारा की जानेवाली त्रुटियों के अध्ययन हेतु अपनायी जानेवाली वह भाषावैज्ञानिक पद्धति जो अन्य भाषा शिक्षण को प्रभावशाली बनाती है। शिक्षार्थी द्वितीय भाषा सीखने के बाद जो गलती करता है जिसकी पुनरावृत्ति होती है उसे त्रुटि कहा जाता है। इसलिए त्रुटि विश्लेषण भाषा शिक्षण प्रक्रिया समाप्त होने के बाद की प्रक्रिया है। जबकि व्यतिरेकी विश्लेषण भाषा शिक्षण शुरू होने के पहले की प्रक्रिया है।


भाषा सीखते समय निम्नलिखित कारणों से त्रुटियॉं होती है:–
मातृभाषा व्याघात :
द्वितीय भाषा सीखने वाले छात्रों पर मातृभाषा का स्पष्ट प्रभाव दिखता है। क्योंकि शिक्षार्थी द्वितीय भाषा की ध्वनियों को अपनी पहली सीखी हुई भाषा के ध्वनियों के सन्दर्भ में ग्रहण करता है।
लक्ष्यभाषा की संरचनात्मक जटिलता :
भाषा की संरचना भिन्न होेने से द्वितीय भाषा सीखने वाले छात्र भाषा के कुछ स्तरों पर अधिकार प्राप्त नहीं कर पाते। इसलिए अन्य भाषा–भाषियों के लिए यह कठिनाई होती है।
उपयुक्त शिक्षण सामग्री अथवा शिक्षकों का अभाव होने के कारण छात्रों की भाषाओं में उच्चारणगत अशुद्धियाँ आती है। इसके अलावा उच्चारण मानक भाषा से थोड़ा भिन्न होता है।
छात्रों की मानसिक स्थिति ठीक न होने के कारण भी कई त्रुटियाँ हो सकती है। इसके अलावा विषय या शब्दावली से अपरिचित होने के कारण भी त्रुटियाँ होती है।

अंतत: त्रुटि विश्लेषण भाषा शिक्षण में अत्यंत उपयोगी पद्धति है। भाषायी अध्ययन में त्रुटियों पर नियंत्रण रखना आवश्यक है। छात्रों को भाषा का मानकीकरण, व्याकरणिक नियमावली का उल्लेख कोश एवं परिभाषित शब्दावली का निर्माण आदि का ज्ञान छात्रों को इस पद्धति द्वारा हो सकता है इसके अलावा भाषा शिक्षण के लिए आवश्यक पाठ्य सामग्री को तैयार किया जा सकता है। अनुवाद के क्षेत्र में छात्रों को प्रशिक्षण देने के लिए इस पद्धति द्वारा निकाले गए निष्कर्ष काम आ सकते हैं।

क्या ‘षाभा‘ भाषा है?

सुधिर जिंदे

मनुष्य एक सामाजिक प्राणी है। समाज में रहकर वह अपनी भौतिक तथा मानसिक जरुरतो ंको पूरा करने के लिए आपस में व्यवहार हेतु भाषा का प्रयोग करता है। इसका अर्थ यह है कि अपने विचारों के आदान प्रदान तथा अपनी भावनाओं को प्रदर्शित करने के लिए व्यक्ति समुदाय में भाषा का प्रयोग करता है। भाषा के बिना मनुष्य के सामाजिक जीवन की कल्पना हम नहीं कर सकते।
प््राश्न यह उठता है कि क्या वह सारे तत्व जो मानव समुदाय में सम्प्रेषण के लिए प्रयोग में लाए जाते है। उन सभी को हम भाषा कह सकते है? क्या हम उन प्रतीकों को भाषा कहे जो भाषा प्रयोग के दौरान प्रयुक्त होते है? भाषा की प्रकृति पर उठाये गये इन सवालों के जवाब के लिए हमे भाषा वास्तव में क्या है या फिर भाषाविज्ञान भाषा को किस दृष्टि से देखता है यह जानना आवश्यक सा बन जाता है। विभिन्न विद्वानों ने इसे विभिन्न रुपों में देखने और परिभाषित करने का प्रयास किया है।
सस्युर जिन्हे आधुनिक भाषाविज्ञान के जनक के रुप में देखा जाता है भाषा के मानवीय व्यवहार के अन्यतम उदाहरण के रुप में देखते है। अत: वे मानव व्यवहार के अन्य क्षेत्रों से काटकर उसे नही देखना चाहते थे। उन्होने भाषा को प्रतीकों की व्यवस्था के माध्यम से समझाया । उन्ही के शब्दों में,
‘‘भाषा प्रतीकों की व्यवस्था है जिसके सहारे हम विचारों को व्यक्त करते है। इसी कारण इस व्यवस्था तुलना लेखन पद्धति, गूंगे–बहरों द्वारा व्यवहृत वर्णमाला व्यवस्था , प्रतीकात्मक कर्मकांड विधान , शिष्टाचार के नियम , संकेत सैनिक चिन्हों के साथ करना संभव है। वस्तुत: इन विभिन्न क्षेत्रों के बीच भाषा की अपनी व्यवस्था
सबसे अधिक महत्वपूर्ण है।‘‘ भाषिक प्रतीकों के संदर्भ में पहले सस्युर ने यह सिद्ध किया कि अपनी प्रकृति में मूलत: वे यादृच्छिक है जो हर भाषा को भौतिक धरातल पर पाए जानेवाले प्रवाही तथ्य को अपने–अपने ढंग से भाषिक यथार्थ के रुप में विभाजित करती है। इन्ही दो तथ्यों के आधार पर उन्होने यह भी प्रमाणित किया है कि भाषिक प्रतीक अपने में कोई स्वनिष्ठ ईकाई नही होते बल्कि वे प्रतीकों को व्यवस्था का एक अंग बनकर ही सार्थकता पाते है।
भाषा केवल भाषिक प्रतीकों का जमघट नही वह भाषिक प्रतीकों की सार्थक व्यवस्था है। उनकी एक व्यवस्थित कडी है। भाषा भाषिक प्रतीकों की कडी तो होती है पर भाषिक प्रतीकों की हर कडी भाषा का दर्जा नही पाती । प्रत्येक मातृभाषा अपनी भाषा में प्रयुक्त प्रतीकों की इस व्यवस्था को ज्ञात या अज्ञात रुप में पहचानती है और उसके आधार पर उन भाषिक प्रतिकों को पहचानने में सक्षम होती है जो मान्य होते हैं। उदाहरण के लिए शब्द स्तर पर भाषिक प्रतीक ‘कमल‘ या ‘कलम‘ को हिन्दी भाषी मान्यता देता है पर इन्ही ध्वनियों के उस संयोजन को स्वीकार नहीं करता जो ‘मकल‘ या ‘लकम‘ को जन्म देता है। इस प्रकार वाक्य के स्तर पर भाषिक प्रतीक शब्दों की कडी के रुप में देखा जाता है। भाषा व्यवस्थाओं की व्यवस्था है और यह एक व्यवस्था के भीतर दूसरी व्यवस्था का ही परिणाम है कि जिसके आधार पर एक भाषा में स्वीकृत व्यवस्था के अलावा किए गए बदलाव को भाषा स्वीकार नहीं कर पाती उदाहरण के लिए अंग्रेजी भाषा की व्यवस्था को हम देख सकते है– जैसे
Ram said to hari that how was not studying hard.
Hard said to hari be was Ram not that studying.

उपयु‍र्क्त दोनो वाक्य व्यवस्थाओं को देखने के बाद हम यह कह सकते है कि भाषिक प्रतीक किसी विशिष्ट व्यवस्था में आने के बाद ही भाषिक प्रकार्य पूर्ण हो सकता है। अगर कोई भाषिक प्रतीक उस विशिष्ट भाषिक व्यवस्था के साथ न आकर अन्य व्यवस्था बनाते है
तो हम उसे भाषा नहीं कह सकते।

भाषिक प्रतीकों की व्यवस्था भाषा सापेक्ष होती है, और हर एक व्यवस्था कुछेक संरचनात्मक नियमों की अपेक्षा रखती है ये नियम ही भाषिक संरचना और इस संरचना के आधार बने भाषिक प्रतीकों की अभिरचना का निर्माण कर सकते है। भाषिक संरचना भाषिक प्रतीकों की व्यवस्था न होकर उनके प्रकार्यो की व्यवस्था होती है। किसी भाषा व्यवस्था में भाषिक प्रतीक अपने प्रकार्य को सिद्ध करने के बाद ही उस संरचना उस व्यवस्था का अंग बन सकती है। अंत में भाषा के विषय में हम यह कह सकते हैं कि, षाभा भाषा नहीं है, वह तभी भाषा बन सकती है जब वह समाज द्वारा स्वीकृत होगी।
_________________________________________________
पहली और सबसे बडी समाज सेवा
यदि हम अंग्रेजी के आदी नहीं हो गये होते, तो यह समझने में हमें देर नहीं लगती कि अंग्रेजी के शिक्षा का माध्यम होने से हमारी बौद्धिक चेतना जीवन से कट कर दूर हो गयी है, हम अपनी जनता से अलग हो गये हैं, जाति के सर्वश्रेष्ट विभागों का विकास रुक गया है और जो विचार हमें अंग्रेजी के माध्यम से मिले, उन्हें हम जनता में फैलाने नाकामयाब रहे हैं। पिछले साठ वर्षों से हमने विचित्र शब्दों को केवल रटना सईखा है, तथ्यपूर्ण ज्ञान पचाने के बदले हमने शब्दों का उच्चारण सीखा है। जो विरासत हमें अपने बाप-दादों से हासिल हुई, उसके आधार पर नव-निर्माण करने के बदले, हमने उस विरासत को भूलना सीखा है। इस दुर्गति की मिसाल सारी दुनिया के इतिहास में नहीं है। यह तो राष्ट्रीय शोक अथवा ट्रेजडी का विषय है।
आज की पहली और सबसे बडी समाज सेवा यह है कि हमारा अपनी देशी भाषाओं की ओर मुडें और हिन्दी को राष्ट्रभाषा के क्पद पर प्रतिष्ठित करें। हमें अपनी सभी प्रादेशिक कार्रवाईयां अपनी-अपनी भाषाओं से चलानी चाहिएं तथा हमारी राष्ट्रीय कार्रवाईयों की भाषा हिन्दी होनी चहिये। जब तक हमारे स्कूल और कालेज विभिन्न देशी भाषाओं में शिक्षा देना आरंभ नही करते, तब तक हमें आराम लेने का अधिकार नहीं है।
-महात्मा गांधी
_________________________________________________

भाषाविज्ञान के परंपरागत अनुप्रयोग बनाम आधुनिक अनुप्रयोग

राहुल एन. म्हैस्कर
व्याख्याता, भाषाविज्ञान विभाग,
डेक्कन कॉलेज, पुणे

भाषाविज्ञान भाषा का वैज्ञानिक अध्ययन प्रस्तुत करता है, जहां भाषा का सैद्धांतिक एवं व्यावहारिक अध्ययन किया जाता है । भाषाविज्ञान परंपरागत रूप से भाषा के विभिन्न आयामों का अध्ययन करता आ रहा है । इनमें जहां मानव द्वारा उच्चरित ध्वनियों का अध्ययन करने के लिए ध्वनि प्रजनक तंत्र ‘एम्प्लीफायर’ आदि का निर्माण किया जा रहा है । वहीं आज की आधुनिक प्रक्रिया में भाषाविज्ञान के नए आयाम संगणकीय भाषाविज्ञान द्वारा ध्वनि से संबंधित ‘प्रात’ आदि ध्वनि तरंग को स्पष्ट करने वाले तंत्र विकसित किए जा रहे है । जो वाक्–प्रौद्योगिकी के अन्तर्गत वाक्–अभिज्ञानक तथा सर्जक के रूप में विकसित किया जा रहा है । जिसके द्वारा वाक्–से–पाठ, पाठ–से– वाक् और स्वचलित वाक् अभिज्ञानक तंत्र भी विकसित किए जा रहे है ।
परंपरागत व्याकरण में भाषा के नियमों को एकसूत्रता में बांधा जाता था तथा भाषा को उन्ही नियमों द्वारा सीखने – सिखाने का कार्य भी चलता था लेकिन यह व्याकरण किसी एक भाषा के लिए ही उपयोगी था । इसलिए प्रसिद्ध भाषाविज्ञानी नोअम चोम्स्की द्वारा सार्वभौमिक व्याकरण बनाया गया लेकिन संगणक के इस जगत में यह व्याकरण भी संगणकीय व्याकरण में परिवर्तीत हो गया । जो मशीनी अनुवाद अनुप्रयोग विकास में उपयुक्त है । संगणकीय व्याकरण भाषा की सभी कोषीय इकाईयाँ तथा व्याकरणीक कोटियों को नियमों में बांधकर संगणक में उसे सृजित करता है तथा भाषा के प्रति संगणक की समझ को विकसित करता है । परंपरागत भाषाविज्ञान में भाषिक संरचना का विश्लेषण तथा सर्जन मानव खुद कोषीय इकाईयाँ एवं व्याकरणिक इकाईयों की सहायता से करता था। लेकिन आज के संगणकीय युग में यह कार्य मशीन द्वारा किया जाने लगा । मानव एक ही तरह की संरचना में भी कभी – कभी गलतियाँ कर देता है । लेकिन संगणक ऐसी गलतियाँ नहीं करता तथा संगणक बड़े से बड़े कार्य को भी एक मिनट के अंदर पूर्ण कर देता है।
केशनिर्माण का कार्य भी बहुत श्रमसाध्य एवं समयसाध्य है । शब्दों को एक क्रम में लाना तथा अलग–अलग कार्ड बनाकर उनमें सूचनाओं का संग्रह करना और फिर पुस्तक के रूप में प्रकाशित करना इसमें काफी श्रम और समय खर्च होता था। लेकिन संगणक इनमें से बहुत सारा कार्य खुद ही कर लेता है । जैसे – शब्दों का क्रम लगाना । इसलिए इसमें श्रम एवं समय की बचत होती है । परंपरागत कोश में जहाँ सालों लग जाते थे वहा आज कम समय में यह कार्य होता है इतना ही नहीं भी ले जाना आसान होता है । यह अध्ययन संगणकीय कोश निर्माण के रूप में किया जाता है । तथा इसे यहां से वहां ले जाना आसान होता है और बोझ भी नहीं होता यह अत्यंत उपयोग में सरल होता है ।
वर्तनी जाँच हेतु मनुष्य को काफी मेहनत करनी पड़ती है । एक–एक शब्द को जाँचना पड़ता है और संदिग्ध शब्दों को शब्दकोष में देखना पड़ता है । अगर जाँचकर्ता उस भाषा को जन्म से जानने वाला नहीं है तो उसे और भी अधिक परेशानियाँ होती है । इसमें श्रम के साथ – साथ समय भी काफी अधिक खर्च होता है । लेकिन आज की आधुनिक तकनीक में संगणक के द्वारा यह कार्य वर्तनी जाँचकर्ता के द्वारा किया जाता है । जिसे संगणक मानव द्वारा दिए गए नियमों, डाटाबेस और समझ के साथ अपने आप ठीक कर लेता है । इससे मानव श्रम तथा समय की काफी बचत हो रही है ।
अनुवाद का कार्य मानव द्वारा किए जाने पर एक ही पाठ का अनुवाद अलग–अलग मनुष्यों द्वारा अलग – अलग किया जाता है । साथ ही मानव जब अनुवाद का कार्य करता है, तो उसे कभी सही शब्द का चुनाव शब्दों को न जानना तथा वर्तनी आदि कई स्तरों पर मानव को काफी समय खर्च करना पड़ता है । मशीन इन स्तरों को आसानी से पार कर जाती है और मानव को आऊटपुट के रूप में एक बेहतर अनुवाद उपलब्ध कराता है।
निष्कर्षत: कहा जा सकता है कि परंपरागत भाषाविज्ञान के अनुप्रयोगों का स्थान आधुनिकीरण एवं बाजारीकरण के इस दौर में भाषाविज्ञान के क्षेत्र में नई योजनाओं के साथ भाशिक अध्ययन के लिए एवं मानव मषीन अंतरक्रिया के लिए नये–नये अनुप्रयोगों ने ले लिया है । भाषा शिक्षण के क्षेत्र में भी आज परंपरागत शिक्षा और शिक्षण प्रणाली का स्थान आज संगणक ने ले लिया है। इस तरह से भाषाविज्ञान संगणकीय भाषाविज्ञान के नाम से प्रचलित हुआ है ।

भाषाविज्ञान के परंपरागत अनुप्रयोग बनाम आधुनिक अनुप्रयोग

राहुल एन. म्हैस्कर
व्याख्याता, भाषाविज्ञान विभाग,
डेक्कन कॉलेज, पुणे

यूनिकोड-विश्वस्तरीय मानक

दिलीप कुमार सिंह
शोध छात्र, आई आई आई टी, हैदराबाद


सूचना प्रौद्योगिकी के क्षेत्र में हर पल प्रौद्योगिकी बदलती रहती है और पहले से अधिक उन्नत होती रहती है। इसी क्रम में हाल ही के वर्षों में सूचना भंडारण की एक आधुनिकतम पद्धति लोकप्रिय होती जा रही है जिसे यूनिकोड कहा जाता है। यह एक ऐसी तकनीकी है जिसकी मदद से हम बिना अंग्रेजी को जाने कम्प्यूटर की क्षमताओं को प्रयोग करने की स्थिति में आ रहे हैं। यह प्रोद्योगिकी एक आम कम्प्यूटर को विश्व की सभी भाषाओं में काम करने में सक्षम बना सकती है।

यूनिकोड का इतिहास
1987 मे जेरोक्स कंपनी के जो बेकर और एपल कंपनी के मार्क डेविस द्वारा यूनिवर्सल कैरेक्टर सेट के निर्माण पर अनुसंधान के साथ ही यूनिकोड की उत्पत्ति हुई। अगले वर्ष अगस्त में जो बेकर ने इंटरनेशनल/मल्टिलिंगुअल टेक्स्ट कैरेक्टर इनकोडिंग सिस्टम पर एक शोध पत्र प्रकाशित किया जिसमें प्रायोगिक रूप से यूनिकोड 88 शीर्षक के अंतर्गत 16 बिट कैरेक्टर माडल प्रस्तुत किया। उनका मूल 16 बिट डिजाईन वाला कैरेक्टर माडल इस विचारधारा पर आधारित था कि आधुनिक प्रयोग में आने वाली लिपियों और कैरेक्टरों को इनकोड किए जाने की आवश्यकता होगी। कैलीफोर्निया में स्थित यूनिकोड कांसर्टियम ने यूनिकोड स्टैंडर्ड को विकसित किया। इस कांसर्टियम द्वारा 1991 मे पहली बार दि यूनिकोड स्टैंडर्ड को प्रकाशित किया गया। इसका सबसे अद्यतन संस्करण यूनिकोड 5.0 सन 2007 मे प्रकाशित हुआ। करीब करीब सभी आधुनिक लिपियों को यूनिकोड के अंतर्गत समाहित किया गया है।

यूनिकोड
यूनिकोड प्रत्येक अक्षर के लिए एक विशेष संख्या प्रदान करता है चाहे कोई भी प्लेटफार्म (प्रोग्राम) अथवा कोई भी भाषा हो। ऐपल, एच.पी., आई.बी.एम., जस्ट सिस्टम, माइक्रोसाफ्ट, ओरैकल, सैप, सन, साईबेस, यूनिसिस जैसी उद्योग जगत की दिग्गज कंपनियों ने यूनिकोड स्टैण्डर्ड अपनाया है। यूनिकोड की आवश्यकता आधुनिक मानदंडों जैसे एक्स.एम.एल., जावा, जावास्क्रिप्ट, एल.डी.ए.पी., कोर्बा 3.0, ड्ब्ल्यू.एम.एल. के लिए होती है और यह आई.एस.ओ./आई.ई.सी. 10646 को लागू करने का आधिकारिक तरीका है।
मूल रूप से कम्प्यूटर केवल संख्याओं से संबंध रखते हैं। ये प्रत्येक अक्षर और वर्ण के लिए एक संख्या निर्धारित करके अक्षर और वर्ण संग्रहीत करते हैं। यूनिकोड के आविष्कार से पहले ऐसी संख्या देने के लिए सैकडों संकेत लिपि प्रणालियां थी। किसी एक संकेत लिपि में पर्याप्त अक्षर नहीं हो सकते हैं। उदाहरण के लिए-यूरोपीय संघ को अकेले ही अपने सभी भाषाओं को कवर करने के लिए अनेक विभिन्न संकेत लिपियों की आवश्यकता होती है। अंग्रेजी जैसी भाषा के लिए भी, सभी अक्षरों, विरामचिन्हों और सामान्य प्रयोग के तकनीकी प्रतीकों हेतु एक ही संकेत लिपि पर्याप्त नहीं थी।
ये संकेत लिपि प्रणालियां परस्पर विरोधी भी हैं। इसीलिए, दो संकेत लिपियां दो विभिन्न अक्षरों के लिए, एक ही नंबर प्रयोग कर सकती हैं, अथवा समान अक्षर के लिए विभिन्न नम्बरों का प्रयोग कर सकती हैं। किसी भी कम्प्यूटर (विशेष रूप से सर्वर) को विभिन्न संकेत लिपियां संभालनी पड़ती है; फिर भी जब दो विभिन्न संकेत लिपियों अथवा प्लेटफॉर्म (कम्प्यूटर) । प्लेटफॉर्मों के बीच डाटा भेजा जाता है तो उस डाटा के हमेशा खराब होने का जोखिम रहता है।
परम्परागत फोंट की ही तरह से यूनिकोड फोंट भी सिर्फ डेटा स्टोरेज संबंधी एनकोडिंग मानक ही हैं लेकिन यूनिकोड फोंट के प्रयोग से कम्प्यूटरों की कार्य प्रणाली में और उनके इस्तेमाल के तौर-तरीकों में क्रांतिकारी बदलाव आ गया है क्योंकि डेटा ही कम्प्यूटरों के संचालन का केन्द्र बिन्दु है। कम्प्यूटर से कुछ भी काम लेने के लिए पहले हमें उसमें कुछ इनपुट डालना पडता है तभी वांछित आउटपुट प्राप्त होता है। इन दोनों प्रक्रियाओं (इनपुट और आउटपुट) में जिन सूचनाओं (डाटा) का प्रयोग होता है उसे कम्प्यूटर पर अंकों के रूप में स्टोर किया जाता है क्योंकि वह सिर्फ अंकों की भाषा जानता है और वह भी सिर्फ दो अंकों ‘शून्य और एक’ की भाषा। इन दो अंकों को अलग-अलग तरीकों पारस्परिक संयोजन करके भिन्न-भिन्न डेटा को कम्प्यूटर में रखा जा सकता है। मिसाल के तौर पर 01000001 का अर्थ अंग्रेजी का कैपिटल ‘ए’ अक्षर और 00110001 से तात्पर्य ‘1’ का अंक है।
एनकोडिंग एक ऐसी प्रणाली है जो अक्षर या पाठ्य सामग्री और कम्प्यूटर पर स्टोर किए जाने वाले बाइनरी डिजिट्स के बीच सामंजस्य बिठाती हैं। एनकोडिंग में निर्धारित कोड के द्वारा कम्प्यूटर यह तय करता है कि किस बाइनरी कोड के लिए कौन सा अक्षर या अंक प्रदर्शित किया जाए। किस एनकोडिंग में कितने बाइनरी अंक प्रयुक्त होते हैं, इस पर उसकी क्षमता और नामकरण निर्भर होते हैं। उदाहरणार्थ- लोकप्रिय एस्की एनकोडिंग को 7 बिट एनकोडिंग कहा जाता है क्योंकि इसमें हर संकेत या सूचना के भंडारण के लिए ऐसे सात बाइनरी डिजिट्स का प्रयोग होता है। एस्की एनकोडिंग के तहत इस तरह के १२८ अलग-अलग संयोजन संभव हैं यानी इस एनकोडिंग का प्रयोग करने वाला कम्प्यूटर १२८ अलग-अलग अक्षरों या संकेतों को समझ सकता है। अब तक कंप्यूटर इसी सीमा में बंधे हुए थे और इसीलिए भाषाओं के प्रयोग के लिए उन भाषाओं के फोंट पर सीमित थे जो इन संकेतों को कंप्यूटर स्क्रीन पर अलग-अलग ढंग से प्रदर्शित करते हैं। यदि अंग्रेजी का फोंट इस्तेमाल करें तो ०१०००००१ संकेत को ए अक्षर के रूप में दिखाया जाएगा। लेकिन यदि हिंदी फोंट का प्रयोग करें तो यही संकेत ग, च या किसी और अक्षर के रूप में प्रदर्शित किया जाएगा।
यूनिकोड एक १६ बिट की एनकोडिंग व्यवस्था है, यानी इसमें हर संकेत को संग्रह और अभिव्यक्त करने के लिए सोलह बाइनरी डिजिट्स का इस्तेमाल होता है। इसीलिए इसमें ६५५३६ (यूनिकोड 5.0.0 में लगभग 99000) अद्वितीय संयोजन संभव हैं। इसी वजह से यूनिकोड हमारे कंप्यूटर में सहेजे गए डेटा को फोंट की सीमाओं से बाहर निकाल देता है। इस एनकोडिंग में किसी भी अक्षर, अंक या संकेत को सोलह अंकों के अद्वितीय संयोजन के रूप में सहेज कर रखा जा सकता है। चूंकि किसी एक भाषा में इतने सारे अद्वितीय अक्षर मौजूद नहीं हैं इसलिए इस स्टैंडर्ड (मानक) में विश्व की लगभग सारी भाषाओं को शामिल कर लिया गया है। हर भाषा को इन हजारों संयोजनों में से उसकी वर्णमाला संबंधी आवश्यकताओं के अनुसार स्थान दिया गया है। इस व्यवस्था में सभी भाषाएं समान दर्जा रखती हैं और सहजीवी हैं। यानी यूनिकोड आधारित कम्प्यूटर पहले से ही विश्व की हर भाषा से परिचित है (बशर्ते ऑपरेटिंग सिस्टम में इसकी क्षमता हो)। भले ही वह हिंदी हो या पंजाबी, या फिर उड़िया। इतना ही नहीं, वह उन प्राचीन भाषाओं से भी परिचित है जो अब बोलचाल में इस्तेमाल नहीं होतीं, जैसे कि पालि या प्राकृत। और उन भाषाओं से भी जो संकेतों के रूप में प्रयुक्त होती हैं, जैसे कि गणितीय या वैज्ञानिक संकेत।

यूनिकोड से बदलती दुनिया
यूनिकोड का प्रयोग कई संचालन प्रणालियों, सभी आधुनिक ब्राउजरों और कई अन्य उत्पादों में होता है। यूनिकोड स्टैंडर्ड की उत्पति और इसके सहायक उपकरणों की उपलब्धता, हाल ही के अति महत्वपूर्ण विश्वव्यापी सॉफ्टवेयर टेक्नोलॉजी रुझानों में से हैं।
यूनिकोड को ग्राहक-सर्वर अथवा बहु-आयामी उपकरणों और वेबसाइटों में शामिल करने से, परंपरागत उपकरणों के प्रयोग की अपेक्षा खर्च में अत्यधिक बचत होती है। यूनिकोड से एक ऐसा अकेला सॉफ्टवेयर उत्पाद अथवा अकेला वेबसाइट मिल जाता है, जिसे री-इंजीनियरिंग के बिना विभिन्न प्लैटफॉर्मों, भाषाओं और देशों में उपयोग किया जा सकता है। इससे डाटा को बिना किसी बाधा के विभिन्न प्रणालियों से होकर ले जाया जा सकता है।
यूनिकोड के प्रयोग से सबसे बड़ा लाभ यह हुआ है कि एक कंप्यूटर पर दर्ज किया गया पाठ (टेक्स्ट) विश्व के किसी भी अन्य यूनिकोड आधारित कम्प्यूटर पर खोला जा सकता है। इसके लिए अलग से उस भाषा के फोंट का इस्तेमाल करने की अनिवार्यता नहीं है क्योंकि यूनिकोड केंद्रित हर फोंट में सिद्धांतत: विश्व की हर भाषा के अक्षर मौजूद हैं। कंप्यूटर में पहले से मौजूद इस क्षमता को सिर्फ एक्टिवेट (सक्रिय) करने की जरूरत है जो विंडोज एक्सपी, विंडोज २०००, विंडोज २००३, विंडोज विस्ता, मैक एक्स १०, रेड हैट लिनक्स, उबन्तु, लिनक्स आदि ऑपरेटिंग सिस्टम्स के जरिए की जाती है। विश्व भाषाओं की यह उपलब्धता सिर्फ देखने या पढ़ने तक ही सीमित नहीं है। हिंदी जानने वाला व्यक्ति यूनिकोड आधारित किसी भी कम्प्यूटर में टाइप कर सकता है, भले ही वह विश्व के किसी भी कोने में क्यों न हो। सिर्फ हिंदी ही क्यों, एक ही फाइल में, एक ही फोंट का इस्तेमाल करते हुए आप विश्व की किसी भी भाषा में लिख सकते हैं। इस प्रक्रिया में अंग्रेजी कहीं भी आड़े नहीं आती। विश्व भर में चल रही भूमंडलीकरण की प्रक्रिया में सूचना प्रौद्योगिकी का यह अपना अलग ढंग का योगदान है।
यूनिकोड आधारित कम्प्यूटरों में हर काम किसी भी भारतीय भाषा में किया जा सकता है, बशर्ते ऑपरेटिंग सिस्टम या कंप्यूटर पर इन्स्टॉल किए गए सॉफ्टवेयर यूनिकोड व्यवस्था का पालन करें। मिसाल के तौर पर माइक्रोसॉट के ऑफिस संस्करण, सन माइक्रोसिस्टम्स के स्टार ऑफिस या फिर ओपनसोर्स पर आधारित ओपनऑफिस.ऑर्ग जैसे सॉफ्टवेयरों में आप शब्द संसाधक (वर्ड प्रोसेसर), तालिका आधारित सॉफ्टवेयर (स्प्रैडशीट), प्रस्तुति संबंधी सॉफ्टवेयर (पावर-प्वाइंट आदि) तक में हिंदी और अन्य भाषाओं का बिल्कुल उसी तरह प्रयोग कर सकते हैं जैसे कि अब तक अंग्रेजी में किया करते थे। यानी न सिर्फ टाइपिंग बल्कि शॉर्टिंग, इन्डेक्सिंग, सर्च, मेल मर्ज, हेडर-फुटर, फुटनोट्स, टिप्पणियां (कमेंट) आदि सब कुछ। कंप्यूटर पर फाइलों के नाम लिखने के लिए भी अब अंग्रेजी की जरूरत नहीं रह गई है। यदि आप अपनी फाइल का नाम हिंदी में 'मेरीफाइल.doc' भी रखना चाहें तो इसमें को अड़चन नहीं है। इंटरनेट पर भी अब यूनिकोड का मानक खूब लोकप्रिय हो रहा है और धीरे-धीरे लोग पुरानी एनकोडिंग व्यवस्था की सीमाओं से निकल कर यूनिकोड अपनाने की दिशा में बढ़ रहे हैं। गूगल,bing, विकीपीडिया, एमएसएन आदि इसके उदाहरण हैं जिनमें हिंदी में काम करना उसी तरह संभव है जैसे कि अंग्रेजी में। यूनिकोड आधारित भारतीय भाषाओं की वेबसाइटों की विषय वस्तु (कॉन्टेंट) का सर्च इंजनों द्वारा भी सहेजा जाता है यानी विश्व स्तर पर उनकी उपस्थिति और दायरा बढ़ता है। फिलहाल सर्च इंजनों पर हिंदी और अन्य भारतीय भाषाओं की वेबसाइटों की स्थिति दयनीय है क्योंकि हर वेबसाइट में अलग-अलग फोंट का इस्तेमाल होने के कारण सर्च इंजनों के लिए उनकी विषय वस्तु को समझना संभव नहीं है। यूनिकोड के प्रयोग से यही काम उनके लिए बहुत आसान हो जाता है।

यूनिकोड-विश्वस्तरीय मानक


दिलीप कुमार सिंह
शोध छात्र, आई आई आई टी, हैदराबाद


सूचना प्रौद्योगिकी के क्षेत्र में हर पल प्रौद्योगिकी बदलती रहती है और पहले से अधिक उन्नत होती रहती है। इसी क्रम में हाल ही के वर्षों में सूचना भंडारण की एक आधुनिकतम पद्धति लोकप्रिय होती जा रही है जिसे यूनिकोड कहा जाता है। यह एक ऐसी तकनीकी है जिसकी मदद से हम बिना अंग्रेजी को जाने कम्प्यूटर की क्षमताओं को प्रयोग करने की स्थिति में आ रहे हैं। यह प्रोद्योगिकी एक आम कम्प्यूटर को विश्व की सभी भाषाओं में काम करने में सक्षम बना सकती है।

यूनिकोड का इतिहास
1987 मे जेरोक्स कंपनी के जो बेकर और एपल कंपनी के मार्क डेविस द्वारा यूनिवर्सल कैरेक्टर सेट के निर्माण पर अनुसंधान के साथ ही यूनिकोड की उत्पत्ति हुई। अगले वर्ष अगस्त में जो बेकर ने इंटरनेशनल/मल्टिलिंगुअल टेक्स्ट कैरेक्टर इनकोडिंग सिस्टम पर एक शोध पत्र प्रकाशित किया जिसमें प्रायोगिक रूप से यूनिकोड 88 शीर्षक के अंतर्गत 16 बिट कैरेक्टर माडल प्रस्तुत किया। उनका मूल 16 बिट डिजाईन वाला कैरेक्टर माडल इस विचारधारा पर आधारित था कि आधुनिक प्रयोग में आने वाली लिपियों और कैरेक्टरों को इनकोड किए जाने की आवश्यकता होगी। कैलीफोर्निया में स्थित यूनिकोड कांसर्टियम ने यूनिकोड स्टैंडर्ड को विकसित किया। इस कांसर्टियम द्वारा 1991 मे पहली बार दि यूनिकोड स्टैंडर्ड को प्रकाशित किया गया। इसका सबसे अद्यतन संस्करण यूनिकोड 5.0 सन 2007 मे प्रकाशित हुआ। करीब करीब सभी आधुनिक लिपियों को यूनिकोड के अंतर्गत समाहित किया गया है।

यूनिकोड
यूनिकोड प्रत्येक अक्षर के लिए एक विशेष संख्या प्रदान करता है चाहे कोई भी प्लेटफार्म (प्रोग्राम) अथवा कोई भी भाषा हो। ऐपल, एच.पी., आई.बी.एम., जस्ट सिस्टम, माइक्रोसाफ्ट, ओरैकल, सैप, सन, साईबेस, यूनिसिस जैसी उद्योग जगत की दिग्गज कंपनियों ने यूनिकोड स्टैण्डर्ड अपनाया है। यूनिकोड की आवश्यकता आधुनिक मानदंडों जैसे एक्स.एम.एल., जावा, जावास्क्रिप्ट, एल.डी.ए.पी., कोर्बा 3.0, ड्ब्ल्यू.एम.एल. के लिए होती है और यह आई.एस.ओ./आई.ई.सी. 10646 को लागू करने का आधिकारिक तरीका है।
मूल रूप से कम्प्यूटर केवल संख्याओं से संबंध रखते हैं। ये प्रत्येक अक्षर और वर्ण के लिए एक संख्या निर्धारित करके अक्षर और वर्ण संग्रहीत करते हैं। यूनिकोड के आविष्कार से पहले ऐसी संख्या देने के लिए सैकडों संकेत लिपि प्रणालियां थी। किसी एक संकेत लिपि में पर्याप्त अक्षर नहीं हो सकते हैं। उदाहरण के लिए-यूरोपीय संघ को अकेले ही अपने सभी भाषाओं को कवर करने के लिए अनेक विभिन्न संकेत लिपियों की आवश्यकता होती है। अंग्रेजी जैसी भाषा के लिए भी, सभी अक्षरों, विरामचिन्हों और सामान्य प्रयोग के तकनीकी प्रतीकों हेतु एक ही संकेत लिपि पर्याप्त नहीं थी।
ये संकेत लिपि प्रणालियां परस्पर विरोधी भी हैं। इसीलिए, दो संकेत लिपियां दो विभिन्न अक्षरों के लिए, एक ही नंबर प्रयोग कर सकती हैं, अथवा समान अक्षर के लिए विभिन्न नम्बरों का प्रयोग कर सकती हैं। किसी भी कम्प्यूटर (विशेष रूप से सर्वर) को विभिन्न संकेत लिपियां संभालनी पड़ती है; फिर भी जब दो विभिन्न संकेत लिपियों अथवा प्लेटफॉर्म (कम्प्यूटर) । प्लेटफॉर्मों के बीच डाटा भेजा जाता है तो उस डाटा के हमेशा खराब होने का जोखिम रहता है।
परम्परागत फोंट की ही तरह से यूनिकोड फोंट भी सिर्फ डेटा स्टोरेज संबंधी एनकोडिंग मानक ही हैं लेकिन यूनिकोड फोंट के प्रयोग से कम्प्यूटरों की कार्य प्रणाली में और उनके इस्तेमाल के तौर-तरीकों में क्रांतिकारी बदलाव आ गया है क्योंकि डेटा ही कम्प्यूटरों के संचालन का केन्द्र बिन्दु है। कम्प्यूटर से कुछ भी काम लेने के लिए पहले हमें उसमें कुछ इनपुट डालना पडता है तभी वांछित आउटपुट प्राप्त होता है। इन दोनों प्रक्रियाओं (इनपुट और आउटपुट) में जिन सूचनाओं (डाटा) का प्रयोग होता है उसे कम्प्यूटर पर अंकों के रूप में स्टोर किया जाता है क्योंकि वह सिर्फ अंकों की भाषा जानता है और वह भी सिर्फ दो अंकों ‘शून्य और एक’ की भाषा। इन दो अंकों को अलग-अलग तरीकों पारस्परिक संयोजन करके भिन्न-भिन्न डेटा को कम्प्यूटर में रखा जा सकता है। मिसाल के तौर पर 01000001 का अर्थ अंग्रेजी का कैपिटल ‘ए’ अक्षर और 00110001 से तात्पर्य ‘1’ का अंक है।
एनकोडिंग एक ऐसी प्रणाली है जो अक्षर या पाठ्य सामग्री और कम्प्यूटर पर स्टोर किए जाने वाले बाइनरी डिजिट्स के बीच सामंजस्य बिठाती हैं। एनकोडिंग में निर्धारित कोड के द्वारा कम्प्यूटर यह तय करता है कि किस बाइनरी कोड के लिए कौन सा अक्षर या अंक प्रदर्शित किया जाए। किस एनकोडिंग में कितने बाइनरी अंक प्रयुक्त होते हैं, इस पर उसकी क्षमता और नामकरण निर्भर होते हैं। उदाहरणार्थ- लोकप्रिय एस्की एनकोडिंग को 7 बिट एनकोडिंग कहा जाता है क्योंकि इसमें हर संकेत या सूचना के भंडारण के लिए ऐसे सात बाइनरी डिजिट्स का प्रयोग होता है। एस्की एनकोडिंग के तहत इस तरह के १२८ अलग-अलग संयोजन संभव हैं यानी इस एनकोडिंग का प्रयोग करने वाला कम्प्यूटर १२८ अलग-अलग अक्षरों या संकेतों को समझ सकता है। अब तक कंप्यूटर इसी सीमा में बंधे हुए थे और इसीलिए भाषाओं के प्रयोग के लिए उन भाषाओं के फोंट पर सीमित थे जो इन संकेतों को कंप्यूटर स्क्रीन पर अलग-अलग ढंग से प्रदर्शित करते हैं। यदि अंग्रेजी का फोंट इस्तेमाल करें तो ०१०००००१ संकेत को ए अक्षर के रूप में दिखाया जाएगा। लेकिन यदि हिंदी फोंट का प्रयोग करें तो यही संकेत ग, च या किसी और अक्षर के रूप में प्रदर्शित किया जाएगा।
यूनिकोड एक १६ बिट की एनकोडिंग व्यवस्था है, यानी इसमें हर संकेत को संग्रह और अभिव्यक्त करने के लिए सोलह बाइनरी डिजिट्स का इस्तेमाल होता है। इसीलिए इसमें ६५५३६ (यूनिकोड 5.0.0 में लगभग 99000) अद्वितीय संयोजन संभव हैं। इसी वजह से यूनिकोड हमारे कंप्यूटर में सहेजे गए डेटा को फोंट की सीमाओं से बाहर निकाल देता है। इस एनकोडिंग में किसी भी अक्षर, अंक या संकेत को सोलह अंकों के अद्वितीय संयोजन के रूप में सहेज कर रखा जा सकता है। चूंकि किसी एक भाषा में इतने सारे अद्वितीय अक्षर मौजूद नहीं हैं इसलिए इस स्टैंडर्ड (मानक) में विश्व की लगभग सारी भाषाओं को शामिल कर लिया गया है। हर भाषा को इन हजारों संयोजनों में से उसकी वर्णमाला संबंधी आवश्यकताओं के अनुसार स्थान दिया गया है। इस व्यवस्था में सभी भाषाएं समान दर्जा रखती हैं और सहजीवी हैं। यानी यूनिकोड आधारित कम्प्यूटर पहले से ही विश्व की हर भाषा से परिचित है (बशर्ते ऑपरेटिंग सिस्टम में इसकी क्षमता हो)। भले ही वह हिंदी हो या पंजाबी, या फिर उड़िया। इतना ही नहीं, वह उन प्राचीन भाषाओं से भी परिचित है जो अब बोलचाल में इस्तेमाल नहीं होतीं, जैसे कि पालि या प्राकृत। और उन भाषाओं से भी जो संकेतों के रूप में प्रयुक्त होती हैं, जैसे कि गणितीय या वैज्ञानिक संकेत।

यूनिकोड से बदलती दुनिया
यूनिकोड का प्रयोग कई संचालन प्रणालियों, सभी आधुनिक ब्राउजरों और कई अन्य उत्पादों में होता है। यूनिकोड स्टैंडर्ड की उत्पति और इसके सहायक उपकरणों की उपलब्धता, हाल ही के अति महत्वपूर्ण विश्वव्यापी सॉफ्टवेयर टेक्नोलॉजी रुझानों में से हैं।
यूनिकोड को ग्राहक-सर्वर अथवा बहु-आयामी उपकरणों और वेबसाइटों में शामिल करने से, परंपरागत उपकरणों के प्रयोग की अपेक्षा खर्च में अत्यधिक बचत होती है। यूनिकोड से एक ऐसा अकेला सॉफ्टवेयर उत्पाद अथवा अकेला वेबसाइट मिल जाता है, जिसे री-इंजीनियरिंग के बिना विभिन्न प्लैटफॉर्मों, भाषाओं और देशों में उपयोग किया जा सकता है। इससे डाटा को बिना किसी बाधा के विभिन्न प्रणालियों से होकर ले जाया जा सकता है।
यूनिकोड के प्रयोग से सबसे बड़ा लाभ यह हुआ है कि एक कंप्यूटर पर दर्ज किया गया पाठ (टेक्स्ट) विश्व के किसी भी अन्य यूनिकोड आधारित कम्प्यूटर पर खोला जा सकता है। इसके लिए अलग से उस भाषा के फोंट का इस्तेमाल करने की अनिवार्यता नहीं है क्योंकि यूनिकोड केंद्रित हर फोंट में सिद्धांतत: विश्व की हर भाषा के अक्षर मौजूद हैं। कंप्यूटर में पहले से मौजूद इस क्षमता को सिर्फ एक्टिवेट (सक्रिय) करने की जरूरत है जो विंडोज एक्सपी, विंडोज २०००, विंडोज २००३, विंडोज विस्ता, मैक एक्स १०, रेड हैट लिनक्स, उबन्तु, लिनक्स आदि ऑपरेटिंग सिस्टम्स के जरिए की जाती है। विश्व भाषाओं की यह उपलब्धता सिर्फ देखने या पढ़ने तक ही सीमित नहीं है। हिंदी जानने वाला व्यक्ति यूनिकोड आधारित किसी भी कम्प्यूटर में टाइप कर सकता है, भले ही वह विश्व के किसी भी कोने में क्यों न हो। सिर्फ हिंदी ही क्यों, एक ही फाइल में, एक ही फोंट का इस्तेमाल करते हुए आप विश्व की किसी भी भाषा में लिख सकते हैं। इस प्रक्रिया में अंग्रेजी कहीं भी आड़े नहीं आती। विश्व भर में चल रही भूमंडलीकरण की प्रक्रिया में सूचना प्रौद्योगिकी का यह अपना अलग ढंग का योगदान है।
यूनिकोड आधारित कम्प्यूटरों में हर काम किसी भी भारतीय भाषा में किया जा सकता है, बशर्ते ऑपरेटिंग सिस्टम या कंप्यूटर पर इन्स्टॉल किए गए सॉफ्टवेयर यूनिकोड व्यवस्था का पालन करें। मिसाल के तौर पर माइक्रोसॉट के ऑफिस संस्करण, सन माइक्रोसिस्टम्स के स्टार ऑफिस या फिर ओपनसोर्स पर आधारित ओपनऑफिस.ऑर्ग जैसे सॉफ्टवेयरों में आप शब्द संसाधक (वर्ड प्रोसेसर), तालिका आधारित सॉफ्टवेयर (स्प्रैडशीट), प्रस्तुति संबंधी सॉफ्टवेयर (पावर-प्वाइंट आदि) तक में हिंदी और अन्य भाषाओं का बिल्कुल उसी तरह प्रयोग कर सकते हैं जैसे कि अब तक अंग्रेजी में किया करते थे। यानी न सिर्फ टाइपिंग बल्कि शॉर्टिंग, इन्डेक्सिंग, सर्च, मेल मर्ज, हेडर-फुटर, फुटनोट्स, टिप्पणियां (कमेंट) आदि सब कुछ। कंप्यूटर पर फाइलों के नाम लिखने के लिए भी अब अंग्रेजी की जरूरत नहीं रह गई है। यदि आप अपनी फाइल का नाम हिंदी में 'मेरीफाइल.doc' भी रखना चाहें तो इसमें को अड़चन नहीं है। इंटरनेट पर भी अब यूनिकोड का मानक खूब लोकप्रिय हो रहा है और धीरे-धीरे लोग पुरानी एनकोडिंग व्यवस्था की सीमाओं से निकल कर यूनिकोड अपनाने की दिशा में बढ़ रहे हैं। गूगल,bing, विकीपीडिया, एमएसएन आदि इसके उदाहरण हैं जिनमें हिंदी में काम करना उसी तरह संभव है जैसे कि अंग्रेजी में। यूनिकोड आधारित भारतीय भाषाओं की वेबसाइटों की विषय वस्तु (कॉन्टेंट) का सर्च इंजनों द्वारा भी सहेजा जाता है यानी विश्व स्तर पर उनकी उपस्थिति और दायरा बढ़ता है। फिलहाल सर्च इंजनों पर हिंदी और अन्य भारतीय भाषाओं की वेबसाइटों की स्थिति दयनीय है क्योंकि हर वेबसाइट में अलग-अलग फोंट का इस्तेमाल होने के कारण सर्च इंजनों के लिए उनकी विषय वस्तु को समझना संभव नहीं है। यूनिकोड के प्रयोग से यही काम उनके लिए बहुत आसान हो जाता है।