20 अगस्त 2009

अब तक के संपादक

अंक-३, जुलाई- अमित

अंक-२, मई- ुषमा

अंक -१, अप्रैल- चंदन

अंक– मई 09 के सदस्य

संपादक- सुषमा

संपादन मण्डल- गुंजन शर्मा, अम्ब्रीश त्रिपाठी, मोहिनी मुरारका

शब्द-संयोजन- कमला देवी, रणजीत भारती, अनामिका

छायांकन- संदीप वर्मा

संपादक के की-बोर्ड से…

किसी भी पत्रिका की दिशा उसके पाठकों के मानस से तय होती है, कि वह पत्रिका की विषय-वस्तु के बारे में क्या मत प्रस्तुत करते हैं। ’प्रयास’ के पिछले अंक में पाठकों की मिली-जुली प्रतिक्रिया से जो चीज उभरकर सामने आयी, वह यह कि आम पाठकवर्ग पत्रिका को सिर्फ भाषा-प्रौद्योगिकी की नियमावली में ही केन्द्रित हो जाने को लेकर सशंकित दिखता है। ऐसा नहीं है, कि प्रौद्योगिकी सृजनात्मकता साथ लिए नहीं होती है या उसके विशेषज्ञ सिर्फ ऑकड़ों की जुबानी या कम्प्यूटर की भाषा के बाहर कुछ नहीं सोचते। नॉम चॉमस्की जैसा प्रख्यात भाषाविद् जब राजनीति या अन्तर्राष्ट्रीय जगत को लेकर कोई टिप्पणी करता है, तो संपूर्ण वैश्विक जगत तो क्या उसका अगुवा अमेरिका का भी ध्यानाकर्षित करती है। प्रयास का गत अंक जहां भाषा प्रौद्योगिकी विभाग के दायरे में सीमित था, वहीं इस बार हमने इसमें विश्वविद्यालय में मौजूद विभिन्न ज्ञानानुशासनों के लेखकों के आलेखों को भी जगह दी है। हम उम्मीद करते हैं, कि भाषा से संबंधित सामाजिक व राजनीतिक पहलुओं पर विश्वविद्यालय के छात्रों के बीच एक सतत् आकादमिक बहस का वातावरण बनें और 'प्रयास' उन विचारों के अंकन का माध्यम। इन्हीं अपेक्षाओं के साथ मैं 'प्रयास' के संपादक मण्डल को धन्यवाद देना चाहूंगी, जिसने पत्रिका को समय पर आपके सम्मुख लाने में महती भूमिका निभायी। इसी विश्वास व उम्मीद के साथ कि 'प्रयास' एक अकादमिक हस्तक्षेप की संवाहक बनेगा, इसका यह द्वितीय अंक आपके सामने प्रस्तुत है......
सुषमा

मनोभाषाविज्ञान

मोहिनी अ. मुरारका
एम.ए., भाषा-प्रौद्योगिकी विभाग



सूक्ष्म दृष्टि से यदि देखा जाए तो भाषा की केवल बाह्य संरचना ही नहीं होती; अपितु आंतरिक संरचना भी होती है। बाह्य संरचना में जहाँ हम भाषा का ध्वनि, शब्द, रूप का वाक्यपरक अध्ययन करतें हैं, वहीं आंतरिक संरचना का संबंध मनुष्य की मानसिक प्रक्रिया से जुड़ा होता है। मनुष्य की मन:स्थिति का अध्ययन मनोविज्ञान में किया जाता है।
चॉमस्की ने ‘रूपान्तरक प्रजनक व्याकरण’ सिद्धांत में बाह्य संरचना की अपेक्षा आंतरिक संरचना पर विचार करना अधिक आवश्यक समझा और यही मनोभाषाविज्ञान का आधार बना। सच तो यह है कि बोलते और सुनते समय आंतरिक संरचना ही प्रमुख होती है क्योंकि दोनों स्थितियों में हमारा मस्तिष्क ही क्रियाशील रहता है अर्थात् भाषाविज्ञान की वह शाखा जिसका अनुप्रयोग मनोविज्ञान के आधार पर हो, मनोभाषाविज्ञान है।
आसगुड के अनुसार मनोभाषाविज्ञान का संबंध भाषा या वाक्यों के बोधन से उत्पन्न होने वाली प्रक्रिया है। जॉनसन लेयर्ड ने भी ठीक इसी प्रकार का मत रखा जिससे स्पष्ट होता है कि मनोविज्ञान का संबंध भाषा के प्रायोगिक पक्ष से है। इसलिए मनोभाषाविज्ञान, भाषाविज्ञान का अनुप्रयुक्त पक्ष कहलाता है। हम जो कुछ भी सुनते हैं, उसका अर्थ कैसे ग्रहण करते हैं? हम जो कुछ भी बोलते हैं उसकी संरचना का निर्माण और निर्धारण कैसे होता है? कोई शिशु जब भाषा सीखता है तो जटिल रूप सहज ढंग से कैसे सीख जाता है? बोलते, सुनते समय उसके मस्तिष्क में किस प्रकार की प्रक्रिया चलती है? इन सभी प्रश्नों के उत्तर हमें मनोभाषाविज्ञान की परिधि में ही जान सकते हैं। इसलिए मनोभाषाविज्ञान भाषिक क्षमता से प्रयुक्त व्यवहार का अध्ययन करता है। इसका ज्ञान मानव की संचयन और अनुस्मरण क्षमता द्वारा होता है और यह दोनों क्षेत्र मनोविज्ञान के अंतर्गत आते हैं। इसलिए मनोभाषाविज्ञान भाषाविज्ञान का अनिवार्य पक्ष है।

प्राकृतिक भाषा संसाधन में ’मंत्रा’ मशीनी अनुवाद तन्त्र की भूमिका

गोविन्द प्रसाद
भाषा-प्रौद्योगिकी विभाग


प्राकृतिक भाषा जैसे हिन्दी, अंग्रेजी, आदि को कम्प्यूटर में संसाधित कर अनुवाद प्राप्त करने में भारत की प्रमुख मशीनी अनुवाद तन्त्रों में ‘मन्त्रा’ मशीनी (कम्प्यूटर) अनुवाद तन्त्र है जो अनुवाद करता है, वह भी कम्प्यूटर के माध्यम से, अर्थात मन्त्रा एक मशीन (कम्प्यूटर) साधित अनुवाद सिस्टम है जो अंग्रेजी भाषा से हिन्दी भाषा में अनुवाद करता है। इस अनुवाद तन्त्र को सी-डैक, पुणे ने सन् 1997 ई. में आरम्भ किया था, तथा सन् 1998-99 ई. में इसको यहां के AAI (एप्लाइड आर्टिफिसियल इटैजिजेन्स) ग्रुप द्वारा विकसित किया गया। इसका मुख्य उद्देश्य सरकारी सूचनाओं, संकल्पों, आदेशों आदि कार्यालयी साहित्य का अंग्रेजी से हिन्दी में अनुवाद करना था। इस अनुवाद तन्त्र में व्याकरणिक विश्लेषण सिद्धांत के रूप में सुप्रसिद्ध कम्प्यूटेशनल भाषाविज्ञानी प्रो0 अरविन्द जोशी (पेन्सिलवेनिया यूनिवर्सिर्टी, अमेरिका से पी-एच.डी.) के वृक्ष संलग्न व्याकरण(TAG) को आधार बनाया गया। इस अनुवाद तन्त्र में निर्विशिष्ट अंग्रेजी वाक्यों का (XTAG) के रूप में विश्लेषण होता है और उसके अनुसार हिन्दी में अनुवाद किया जाता है। इस समय सी-डैक, पुणे ने 'मन्त्रा' मशीनी अनुवाद सिस्टम को और अधिक विकसित करके 'मंत्राराजभाषा' नाम रख दिया है, क्योंकि इसको मन्त्रालय के राजभाषा विभाग द्वारा काफी आर्थिक सहयोग एवं प्रोजेक्ट (परियोजना) मिले हैं। 'मंत्राराजभाषा' के भी उन्न्त संस्करण विकसित हो चुके है जो मंत्राराजभाषा स्टैण्डअलोन, मंत्राराजभाषा इन्ट्रानेट और मंत्राराजभाषा इन्टरनेट है।
• मंत्रा राजभाषा स्टैण्डअलोन उन प्रयोक्ताओं के लिए विकसित किया गया है, जो विना नेट कनेक्टिविटी के अपने पर्सनल कम्प्यूटर पर भी अनुवाद सिस्टम का उपयोग कर सके ।
मंत्राराजभाषा स्टैण्डअलोन संस्करण डाउनलोन के लिए URC:http://www.mantra-rajbhasha.cdac.in/mantra rajbhasha पर उपलब्ध है।

इस सिस्टम में दस्तावेजों को एक मेज से दूसरी मेज तक ले जाने की आवश्यकता नहीं है। सभी अनुवादित दस्तावेज केन्द्रित डाटाबेस में संचित होते है जो सभी सम्बन्धित अधिकारियों को उपलब्ध होते है।
मन्त्रा राजभाषा इन्टरनेट संस्करण का डिजाइन और विकास थिन क्लाइ्रट आर्किटेक्चर पर आधारित है। इसमें सम्पूर्ण अनुवाद प्रक्रिया सर्वर पर होती है। इसलिए दूरवर्ती स्थानों में भी इन्टरनेट कनेक्शन उपलब्ध लो-एण्ड सिस्टम पर भी दस्तावेजों के अनुवाद करने के लिए इस सुविधा का उपयोग किया जा सकता है। अत: इससे सीमित एवं दूरवर्ता क्षेत्रों में भी सर्वर के जरिए राजभाषा की कार्यवाहियों का ऑनलाइन हिन्दी में अनुवाद हो सकेगा।

'मन्त्रा' मशीनी अनुवाद तन्त्र के उपर्युक्त जितने भी नये संस्करण आये हैं। उन सभी को सी-डैक, पुणे के aaI ग्रुप द्वारा विकसित किया गया है। अभी इस ग्रुप द्वारा मशीनी अनुवाद को सफल बनाने का कार्य जारी है। आरम्भ में यह भारत सरकार के मन्त्रालयों, कार्यालयों द्वारा जारी आदेशों, सूचनाओं आदि का अनुवाद करता था, लेकिन इस समय (वर्तमान में) यह राजभाषा और राजभाषा के प्रशासनिक, वित्त एवं कृषि क्षेत्र की दस्तावेजों आदि को अंग्रेजी से हिन्दी में अनुवाद करता है। यह अनुवाद तन्त्र कठिन वाक्यों का भी अंग्रेजी से हिन्दी मं अनुवाद करने में सक्षम है। चूकि मशीन मानव का स्थान नहीं ले सकती, क्योकि मशीन (कम्प्यूटर) को अभी भी ambigiuty (संदिग्धता) की समस्या के वजह से निर्णय लेने में कठिनाई होती है। फिर भी यह अनुवाद तन्त्र प्रशासनिक क्षेत्र में 92 प्रतिशत एवं प्रशासनिक क्षेत्र के इतर में 60-65 प्रतिशन अनुवाद करने में सक्षम है।
मन्त्रा मशीनी अनुवाद तन्त्र को एवं इसके जितने भी नए संस्करण आये हैं उनको विकसित करने में कम्प्यूटर विज्ञानियों, कम्प्यूटेशनल भाषाविज्ञानियों, भाषा वैज्ञानिकों एवं अनुवाद वैज्ञानिकों का संयुक्त प्रयास रहा है जिनमें प्रो. यज्ञनारायण, डॉ. हेमन्त दरबारी, प्रो. महेन्द्र कुमार सी. पाण्डेय आदि का योगदान महत्वपूर्ण रहा।
सी. डैक, पुणे का कहना है कि टेक्नालॉजी आपके घर तक पहुंचेगी आपको उस तक पहुंचने की आवश्यकता नहीं है।
मन्त्रा मशीनी अनुवाद सिस्टम को कम्प्यूटर वर्ल्ड स्मिथसोनियन अवार्ड से पुरस्कृत किया गया और इसको अमेंरिका के ऐतिहासिक राष्ट्रीय संग्रहालय में वर्ष 1999 के नवीन शोध के रूप में रखा गया है।

कम्प्यूटर में देवनागरी का प्रयोग एवं उपयोगिता

गिरीश पाण्डेय
लीला प्रभारी, म.ग.अ.हि.वि, वर्धा



देवनागरी लिपि में लिखी गयी हिन्दी को राजभाषा हिन्दी के रूप में माना गया है। देवनागरी एक वैज्ञानिक लिपि है। कोई भी लिपि वैज्ञानिक लिपि तब कही जाती है जब उसमें प्रत्येक सार्थक ध्वनि के लिए कोई न कोई लिपि चिन्ह हो। देवनागरी में लगभग हर सार्थक ध्वनि के लिए एक लिपि चिन्ह है अत: हम कह सकते हैं कि देवनागरी एक वैज्ञानिक लिपि है। इस तथ्य को देखते हुए हम यह कह सकते हैं कि हिन्दी कम्प्युटर के लिए और कम्प्युटर हिन्दी के लिए काफी उपयोगी सिध्द हो सकते हैं। हिन्दी के ही सन्दर्भ में कहें तो देवनागरी लिपि की कुछ और खास बातें हैं जो इस प्रकार हैं।

1- लिपि चिन्हों के नाम ध्वनि के अनुरूप :- देवनागरी की सबसे अधिक महत्वपूर्ण शक्ति यह है कि जो लिपि चिन्ह जिस ध्वनि का द्योतक है उसका नाम भी वही है। जैसे आ, ओ, क, ब, थ आदि। इस प्रकार लिपि चिन्हों की ध्वनि शब्दों में प्रयुक्त होने पर भी वही रहती है। दुनिया की अन्य किसी भी लिपि में इतना सामर्थ्य नहीं है।
2- एक ध्वनि के लिए एक लिपि चिन्ह :- (अधिक नहीं) श्रेष्ठ लिपि में यह गुण होना आवश्यक है। यदि एक ध्वनि के लिए एक से अधिक लिपि चिन्ह होंगे तो उस लिपि के प्रयोक्ता के सामने एक बड़ी कठिनाई यह आयेगी कि वह किस चिन्ह का प्रयोग कहाँ करें। कुछ अपवादों को छोड़ कर देवनागरी में एक ध्वनि के लिए एक लिपि चिन्ह है। जबकी अंग्रेजी एवं अन्य भाषाओं में ऐसा नहीं है। उदा. के लिए C से स और क दोनों का अच्चारण किया जाता है। इसी तरह क के लिए K व C दोनो का प्रयोग किया जाता है। उदाहरण के लिए City, cut, Kamala, coock आदि।
3- लिपि चिन्हो की प्रर्याप्तता :- विश्व की अधिकांश लिपियों में चिन्ह प्रर्याप्त नहीं हैं। जैसे-अंग्रेजी में 40 से अधिक ध्वनियों के लिए 26, लिपि चिन्हों से काम चलाया जाता है। जैसे त, थ, द, ध आदि के लिए अलग-अलग लिपि-चिह्न नहीं है, जबकि देवनागरी लिपि में इस दॄष्टि से कोई कमीं नहीं है।
हिन्दी में कम्प्युटर का प्रयोग :-
कम्प्युटर में नागरी उपयोग का श्रेय इलेकट्रानिक आयोग, नई दिल्ली के डॉ. ओम विकास को है। डॉ. वागीश शुक्ल ने अपनी किताब ''छदं-छदं पर कुमकुम'' को महात्मागांधी अन्तरराष्ट्रीय हिन्दी विश्वविद्यालय विद्यालय के प्रकाशन के रूप में प्रकाशित किया है।
इस पुस्तक के प्रकाशन में डोनाल्ड नुथ द्वारा अविस्कारित ''टेक टाईप सेटिंग सिस्टम'' और लेसली लैम्पोर्ट ¼Leslie Lanport½ के स् Latex Marco System का प्रयोग किया है। साथ ही सयुक्ताक्षरों के लिए देवनाग पैकेज (जोकि वेलथुइस द्वारा बनाया गया है) का उपयोग किया है।
अन्य बहुत सारे हिन्दी के साफ्टवेयर हैं, जो आज-कल बाजार में भरे पड़े है। जैसे- प्रकाशक, श्रीलिपि, आईलिपि, जिस्ट, मात्रा, अंकुर, आकृति, सुलिपि, अक्षर फार विन्डोज, माया फोनटिक टुल, चित्रलेखा, अनुवाद आओ हिन्दी पढ़े, गुरू और आंग्लभारती आदि

राजभाषा हिन्दी में कम्प्युटर की उपयोगिता :-
1 मानकीकरण में मद्द मिलेगी :- कम्प्युटर के प्रयोग से हिन्दी के मानकीकरण में सहायता मिलेगी। उदा. के लिए पुराने हिन्दी के टाइपराइटरों में चन्द्रबिन्दु (अनुनाशिक) की जगह बिन्दु (अनुस्वार) से ही काम चलाया जाता था। कम्प्युटर के आ जाने से इस समस्या का समाधान हो गया है।
2. टाइपराइटर पर 92 अक्षर से ज्यादा सम्मिलत करना सम्भव नहीं है।
3. हिन्दी के प्रचार प्रसार में :- मशीन ट्रान्सलेशन एवं इलेम्ट्रानिक हिन्दी शब्द कोश के माध्यम से अहिन्दी भाषियों को भी हिन्दी आसानी से सिखाया जा सकता है।
4. दुर्लभ ग्रथों को सुरक्षित रखने में :- कम्प्युटर के माध्यम से हम दुर्लभ ग्रथों को स्कैन करके साफ्ट कॉपी बनाकर सैकडों वर्षो तक सुरक्षित रख सकते है।

मणिपुरी भाषा की वर्तमान स्थिति

थोकचोम कमला देवी
भाषा-प्रौद्योगिकी विभाग



जिसको हम वैश्वीकरण के नाम से जानते हैं आज उसके कारण समूचा संसार एक बदली हुई प्रक्रिया के रूप में दिखाई दे रहा है। इसमें हर एक चीज मशीनीकरण की ओर अग्रेषित होती जा रही है। वर्तमान समय में कई भाषाएँ वैश्वीकरण के कारण लुप्त होने की स्थिति में हैं।
भारत के उत्तर-पूर्व में सात राज्यों- आसाम, मणिपुर, नागालेंड, अरूणाचलप्रदेश, मिजोराम, त्रिपुरा, मेघालय बहनों की तरह और सिक्किम भाई के रूप में बसे हैं। इन राज्यों में मूल रूप से तीन भाषा-परिवार मिलते हैं-भारत ईरानी, साइनो तिब्बती तथा आस्ट्रिक। मणिपुर की भाषा (मीतैलोन) साइनो तिब्बती परिवार के उप-कुल तिब्बती बर्मी के अंतर्गत आती है। मणिपुरी की लिपि को मीतै मयेक (मीतै लिपि) कहा जाता है। अब तक उन्नतीस भाषाएँ तथा बोलियाँ और अलग अलग उन्नतीस मातृभाषाएँ उपलब्ध है। मणिपुरी भाषा ही इस राज्य की संपर्क भाषा है। विश्व में इस भाषा को बोलनेवालों की संख्या 3.3 मिलियन है और इनमें से 1.6 मिलियन मणिपुरी तथा मणिपुरी मुस्लिम है। संपर्क भाषा के रूप में 700000 मणिपुर के नागा और कुकी जनजातियाँ बोलते है। बाकी के 500,000 भारत के अन्य राज्यों-असाम, त्रिपुरा और बंगाल में बोली जाती है। 400,000 म्यान्मार के मंडले, यांगुन तथा कलेम्यो में और 100,000 बंगलादेश के ढाका और सिल्हेत में बोली जाती है। उत्तर पूर्वी भाषाओं में से कई भाषाएँ लुप्त होने की स्थिति में है और इनको बचाना भाषवैज्ञानिकों का एक महत्त्वपूर्ण दायित्व है। इस बात को ध्यान में रखते हुए मेघालय की राजधानी शीलांग में स्थित नोर्थ ईस्ट हील युनिवर्सिटि के भाषाविज्ञान विभाग और सी.आई.आई.एल. मैसूर द्वारा 18-21मार्च 2009 को पहला अंतरराष्ट्रीय संगोष्ठी को आयोजित किया गया है। इस संगोष्ठी का मुख्य उद्देश्य था “World languages & North east languages : convergence,enrichment or death ?” । न सिर्फ पूर्वोत्तर राज्यों की भाषाओं को बल्कि विश्व की और कई भाषाएँ भी लुप्त हो रही हैं। यूनेस्को के अनुसार विश्व भर में 750 भाषाएँ लुप्त हो चुकी है और 6000 भाषाएँ खतरे में हैं। इसलिए भाषा विस्थापन के साथ साथ अनुरक्षण की भी आवश्यकता है।

खेल-कूद की भाषा और अनुवाद

ओमप्रकाश प्रजापति
अनुवाद एवं निर्वचन विद्यापीठ



खेलों के प्रति रूचि प्रारम्भ से ही रही है। यह रूचि बालक में ही हो, ऐसी बात नहीं है। हर आयु के पुरुष-स्त्री खेल के प्रति हमेशा आकृष्ट हुए हैं। महाभारत में आचार्य द्रोण द्वारा पांडु और कुरू पुत्रों के खेल-खेल में दी गई अनेक शस्त्र तथा मल विधाओं रथ दौड़ आदि प्रतियोगिताओं के वर्णन को खेल-समाचारों का आदि रूप कहें तो अतिशयोक्ति नहीं है।
पाश्चात्य-साहित्य में भी खेल-रिपोर्ताज के अनुसार के उदाहरण मिलते हैं। सुप्रसिध्द यूनानी लेखक होमर (850 ई.पू.) ने इडियट की 23वीं पुस्तक में औडसियस और एजाक्स के मल्ल युद्ध का वर्णन रोमांचक शैली में प्रस्तुत किया है। वर्जिल (70ई.पू.) ने एनियट में भी मल युध्द का रोमांचक तथा सुन्दर वर्णन किया है। यूनान के ओलम्पिक खेलों के प्रारम्भ से वहाँ खेलों की व्यवस्थित परम्परा चली आ रही है। रोम सभ्यता के उत्कर्ष से रथ और घुड़दौड़ की प्रतियोगिता को विशेष प्रोत्साहन मिला।
राजनीति के पश्चात खेल-जगत ही ऐसा क्षेत्र है जिससे सम्बद्ध समाचारों में पाठकों की विशेष रूचि होती है। युवा व विद्यार्थी समुदाय खेल-समाचारों में बेहद दिलचस्पी रखते हैं। विद्यालयों, महाविद्यालयों और विश्वविद्यालयों में खेल सम्बन्धी कार्यक्रम प्रतिदिन आयोजित किए जाते हैं। खेल संवाददाता के लिए ये सभी केन्द्र खेल-समाचार संकलन के स्त्रोत हैं। इनमें नगर स्तरीय, राज्य स्तरीय एवं राष्ट्रीय स्तर की अनेक खेल-प्रतियोगिताएँ शामिल हैं।
एक समय था कि खेल कूद को समाज हेय दृष्टि से देखता था। इतना ही नहीं बड़े बूढ़े कहा करते थे।
पढ़ोगे लिखोगे बनोगे नवाब।
खेलोगे कूदोगे होंगे खराब।
किन्तु अब वह स्थिति नहीं है। नवाब और मंत्रियों के बेटे (नवाब पटौदी, कीर्ति आजाद) भी अपने को आगे बढ़ाने के लिए खेलों की शरण लेते हैं समाचारों में चाहे वे पत्रिकाओं और समाचार पत्रों में हो या रेडियो पर या टेलीवीजन पर खेलकूद को सुनिश्चित स्थान दिया जाता है। अब तो लगता है कि आधुनिक युग को शायद सूत्र ही बन गया है। खेल में हिट, तो सब जगह फिट।
खेलों के प्रकार-
खेल मुख्यतया दो प्रकार के होते हैं। एक 'इनडोर' तथा दूसरा 'आउटडोर' इनडोर छत के नीचे कमरे में बिना किसी मैदान के खेले जाते हैं। शतरंज कैरमबोर्ड, चौपड़, बिलियार्ड आदि इसी श्रेणी में आते हैं। फूटबाल, क्रिकेट, बालीबाल, तैराकी, पर्वतारोहरण आदि 'आउटडोर' खेल मैदान में खेले जाने वाले कहलाते हैं।
खेल समाचारों की भाषा, शब्दावली व शीर्षक-
खेल समाचारों की भाषा चलती हुई होनी चाहिए उसमें गति हो जिससे पाठक के मन पर अनुकूल प्रभाव पड़े। भाषा-जन-साधारण की हो, चालू शब्दों और मुहावरों से भरपूर तथा भारीपन से कोसों दूर हो। शब्दों को आत्मसात करते समय इस बात का ध्यान रखना होगा कि उसका प्रयोग हिन्दी-व्याकरण के अनुरूप किया जाए चाहे शब्द किसी भाषा का क्यों न हो? उदाहरणार्थ- क्रिकेट में प्रयुक्त अंग्रेजी 'रन' शब्द है। इस शब्द को बड़ी आसानी से पचाया जा सकता है इसका अनुवाद कई लोग दौड़ करते है। वास्तव में 'रन' का जो अर्थ है। उसे दौड़ों में नहीं बॉटा जा सकता है। हमें अपनी भाषा में अन्य भाषाओं के प्रचलित शब्दों को लेने में कभी संकोच नहीं करना चाहिए 'रन' शब्द इतना प्रचलित हो चुका है कि इसके अनुवाद की आवश्यकता नहीं है।
शब्दों के अनुवाद करते समय हमें इस बात का ध्यान रखना चाहिए कि पाठक खेल समाचार पढ़ते समय किसी 'शब्दकोश' को लेकर नहीं बैठता यदि किसी नए शब्द का प्रयोग किया जाए तो कुछ समय तक अवश्य ही उसके मूल शब्द को कोष्ठक में दे देना चाहिए। अनुवादित शब्द भी ऐसे होने चाहिए जो सही और उपयुक्त हो।
खेल समाचार लेखन के दो रूप होते हैं एक तो यह कि आप डेस्क पर बैठे-बैठे समाचार एजेंसी की रपट का अनुवाद कर डालें। दूसरा यह कि स्वयं मैदान में जाकर स्वतंत्र रूप से रपट तैयार करें। अधिकांश हिन्दी पत्रों में समाचार एजेंसियों की रपट का अनुवाद ही होता है।
'शीर्षक' का सिद्धांत खेल समाचारों पर लागू होता है जो अन्य समाचारों पर खेल समाचारों में मुख्यत: परिणाम का महत्त्व होता है। पाठक भी पहले उसी को जानना चाहता है। अत: शीर्षक इस प्रकार होने चाहिए जो समाचार के सार को विस्स्थापित कर दे।
शार्टकार्नर- अनुवादक को एक बात का ध्यान रखना चाहिए कि यदि किसी पारिभाषिक अर्थ से हिन्दी शब्द प्रचलित हो तो वही दे जैसे- 'गोलकीपर' की तुलना 'गोली’ और 'सिक्सर' की तुलना 'छक्का' के लिए यदि दो शब्द प्रचलित हो तो अधिक प्रचलित और मानक शब्द प्रयोग करें अपेक्षाकृत कम प्रचलित और अमानक का नहीं। किसी नए स्वनिर्मित ऐसे हिन्दी शब्द का प्रयोग कभी न करें तो पाठक के लिए अवरोधगम्य हैं।
विशिष्ट प्रयोग- बहुत से लोग समझते हैं कि खेलकूद की भाषा होती है, किन्तु वास्तविकता यह नहीं है। यह भाषा भी सर्जनात्मक निजात्मक तथा अलंकारिक होती है। अनुवादक ऐसी भाषा में अनुवाद करके समाचार को अधिक जीवंत और प्रभावी बना सकता है। नवभारत टाइम्स, हिन्दुस्तान तथा जनसत्ता खेल-कूद के पन्ने की भाषा की तुलना से तो यह स्पष्ट हो जाता है कि एक ही बात को आकर्षक और प्रभावी ढंग से भी कहा जा सकता है और सपाट तथा नीरस ढंग से भी। अनुवादक को जितना हो सके सर्जनात्मक भाषा का प्रयोग करना चाहिए।

मशीनी अनुवाद की समस्याएँ

राहुल.एन.म्हैस्कर
भाषा-प्रौद्योगिकी विभाग


पिछले छ: दशकों से मशीनी अनुवाद के लिए विश्व के कई देशों और संस्थानों, विश्वविद्यालयों में कार्य चल रहे है, परंतु आज तक पूर्ण या स्वचलित मशीनी अनुवाद संभव नहीं हो सका है। आज भी मानव सहयोगी मशीनी अनुवाद पर ही कार्य कर रहा है। सर्वप्रथम मशीनी अनुवाद के लिए शब्दकोश की सहायता से प्रयत्न किया गया था। यह कंप्यूटर वैज्ञानिकों द्वारा किया गया प्रथम मशीनी अनुवाद का प्रयत्न था। मशीनी अनुवाद मशीन द्वारा स्रोत भाषा से लक्ष्य भाषा में किया जाने वाला मात्र शब्दों का अनुवाद न होकर उस भाषा की प्रकृति के अनुसार संरचना तथा भाव का भी रूपांतरण है। शब्दकोश से किया जाने वाला मशीनी अनुवाद सजातीय भाषाओं के लिए कुछ हद तक सही परिणाम देता है। परंतु यह विजातीय भाषाओं के लिए बिल्कुल उपयोगी नहीं है। मशीनी अनुवाद ऐसा होना चाहिए जिससे सभी भाषाओं का अनुवाद सभी भाषाओं में होना चाहिए तभी मशीनी अनुवाद का उद्देश्य सफल होगा। कृत्रिम बुध्दि निर्माण द्वारा मशीन को मानव बुद्धि की तरह ही सृजनशील बनाने का कार्य चल रहा है जिससे स्वचालित मशीनी अनुवाद का उद्देश्य सफल हो सके। इस दिशा में भारत में किए गए कार्य में आई.आई.टी. हैदराबाद द्वारा निर्मित अनुसारक तथा सी-डैक पुणे निर्मित मंत्रा हिन्दी-अंग्रेजी मशीनी अनुवाद तंत्र काफी हद तक कारगार साबित हुआ है। फिर भी यह मानव सहयोगी ही है। अत: पूर्ण रूप से स्वचलित मशीनी अनुवाद के लिए कुछ कठिनाईयाँ है, जिन्हें यहां बताने का प्रयास किया जा रहा है।
1) कंप्यूटर में सृजनशीलता का अभाव :- कंप्यूटर एक मशीन मात्र है वह मानव की तरह सोच नहीं सकती जिसके कारण किसी भी भाषा की प्रकृति को वह नहीं समझ सकता मानव अपनी बुद्धि से अनेक समस्याओं का हल खुद ढूँढ़ लेता है लेकिन कंप्यूटर में यह क्षमता नहीं है।
2) विजातीय भाषाएँ :- मशीनी अनुवाद की एक समस्या है भाषाओं का विजातीय होना। हर भाषा की अपनी प्रकृति होती है और उसके अनुसार उसकी संरचना होती है। हिन्दी और अंग्रेजी दोनों विजातीय भाषाएं है जिसके कारण इनकी संरचना भिन्न है और इसके चलते मशीनी अनुवाद के लिए यह कठिनाईयाँ पैदा करती है।
3) सार्वभौमिक व्याकरण का अभाव :- चॉमस्की द्वारा अनेक सार्वभौमिक व्याकरणों का निर्माण किया गया परंतु आज भी मशीनी अनुवाद के लिए आवश्यक सार्वभौमिक अर्थात् सारी भाषाओं पर आधारित नियमों से संबद्ध एक व्याकरण उपलब्ध नहीं हो पाया है। इसके चलते मशीनी अनुवाद के लिए आवश्यक अनुप्रयोगों के विकास में शिथिलता है।
4) एक शब्द के अनेक पर्यायी शब्दों का होना :- एक शब्द के अनेक पर्यायी शब्द होने के कारण डाटाबेस में स्थापित किसी एक भाषा के शब्द का लक्ष्य भाषा में अनेक शब्दों का होना मशीन के लिए सही शब्द का चुनाव करना चुनौती है। और इसी वजह से गूगल वेब पर होने वाला मशीनी अनुवाद उपयुक्त नहीं कहा जा सकता।
5) भाशिक अनुप्रयोगों का अभाव :- मशीनी अनुवाद के लिए अनेक नियमों से संबद्ध भाषिक अनुप्रयोगों की जरूरत होती है। जैसे-संगणकीय कोश, संगणकीय व्याकरण, वर्तनी जांचक, जनरेटर, अभिज्ञानक और अंतरण सॉफ्टवेअर आदि। इन अनुप्रयोगों का प्रर्याप्त मात्रा में तथा पूर्ण रूप में विकास न होना भी मशीनी अनुवाद के लिए एक समस्या है।
6) कृत्रिम बुध्दि के विकास में देरी :- कृत्रिम बुध्दि विकास के द्वारा मशीन को मानव बुध्दि की तरह ही कृत्रिम बुद्धि प्रदान करने का कार्य चल रहा है जिसमें अनेक कंप्यूटर तथा भाषा वैज्ञानिक कार्य कर रहें है। इसके विकास से कंप्यूटर को मानव की तरह ही सृजनशीलता प्राप्त हो जाएगी। लेकिन इसमें देरी भी मशीनी अनुवाद की एक समस्या है।
7) संग्रहन क्षमता की कमी :- कंप्यूटर के विकास के साथ साथ ही उसकी संग्रहन क्षमता में भी वृध्दि हूई है। परंतु संपूर्ण भाषा की प्रकृति को इसमें कैद कर पाना आज भी संभव नहीं हो पाया है इसकी संग्रहन क्षमता आज भी कम है। जिससे सारे भाशिक अनुप्रयोंगों को एक ही स्मृति में रखना कठिन होता है। जिससे कंप्यूटर की तेजी में भी कमी आ जाती है।
8) भाषा वैज्ञानिकों का अभाव :- भाषा के नियमों को सृजित करने के लिए मुख्यत: भाषा वैज्ञानिकों की जरूरत होती है। लेकिन मशीनी अनुवाद के क्षेत्र में काम करने वालों में ज्यादातर कंप्यूटर वैज्ञानिक ही है न कि भाषा वैज्ञानिक जिससे इस कार्य को समस्याओं से जूझना पड़ रहा है।
निष्कर्षत: यह कहा जा सकता है कि उपर्युक्त समस्याओं को दूर किए जाने से मशीनी अनुवाद के लिए कंप्यूटर और भाषा वैज्ञानिकों द्वारा प्रयत्न किए जाने पर स्वचलित मशीनी अनुवाद जल्द ही सफल हो जाएगा। कृत्रिम बुध्दि का विकास इसी को पूर्ण करने का एक चरण है।

आधुनिक भाषाविज्ञान के स्वरूप

आधुनिक भाषाविज्ञान के स्वरूप
धनजी प्रसाद
एम.ए. हिंदी (भाषा-प्रौद्योगिकी)
पिछले अंक में आधुनिक भाषाविज्ञान के स्वरूप की चर्चा करते हुए हमने देखा कि पाणिनी आदि के समय में संस्कृत का व्याकरणिक अध्ययन हुआ। पहले यूरोपिय देशों में भाषाओं का ऐतिहासिक अध्ययन होता था। सस्यूर के आने के पश्चात वर्णनात्मक भाषाविज्ञान का उदय हुआ। सर विलियम जोन्स के द्वारा तुलनात्मक भाषाविज्ञान के बीज बोए गए। इस प्रकार आधुनिक भाषाविज्ञान की वर्णनात्मक, ऐतिहासिक और तुलनात्मक, तीनों शाखाओं की बात करते हुए हमने इसके व्यवहारिक अनुप्रयोगों की बात की।
वर्तमान में अनुप्रयुक्त भाषाविज्ञान के रूप में भाषाविज्ञान की एक नई शाखा का उदय हुआ है। इसमें के वैज्ञानिक अध्ययन से प्राप्त ज्ञान के व्यवहारिक अनुप्रयोगों की बात की जाती है। अनुप्रयुक्त भाषाविज्ञान की चर्चा मुख्य रूप से तीन संदर्भों में की जा सकती है, जिन्हें हम निम्न प्रकार से समझ सकते हैं_
1. भाषाशिक्षण का संदर्भ
2. ज्ञान का संदर्भ
3. विद्या का संदर्भ
भाषाशिक्षण का संदर्भ_वैश्वीकरण के वर्तमान परिवेश में बहुभाषिकता (या कम से कम द्विभाषिकता) एक मूल आवश्यकता बन गई है। अत: विभिन्न उद्देश्यों की पूर्ति के लिए हम अन्य भाषाओं को सीखते हैं। इस उद्देश्य की कम समय में तथा अधिकाधिक पूर्ति के लिए एक व्यवस्थित भाषा शिक्षण की आवश्यक्ता होती है। अपनी प्रथम भाषा में भी दक्षता हासिल करने के लिए भाषा शिक्षण का सहयोग लिया जा सकता है।
भाषा अधिगम के चार कौशल हैं- सुनना, बोलना, पढना और लिखना। इन चारों कौशलों में शिक्षार्थी को अधिक से अधिक निपुण बनाना ही भाषा शिक्षण का उद्देश्य है।
किसी भी भाषा के शिक्षण के लिए आधार भाषा (l1) और लक्ष्य भाषा (l2) का विवरण उपलब्ध कराना, पाठ्य सामग्री निर्माण, शिक्षण और परिक्षण तथा त्रुटि विश्लेषण में भाषाविज्ञान का योगदान अपेक्षित है।
ज्ञान का संदर्भ- इसके अंतर्गत हम अन्य शास्त्रों में भाषाविज्ञान के ज्ञान का उपयोग करते हैं। जैसे- भाषा का समाजशास्त्र (sociology of language)| इसमें भाषा के संदर्भ में समाज का अध्ययन किया जाता है। यहाँ ध्यान देना चाहिए कि ’समाजभाषाविज्ञान’ (sociolinguistics) में समाज के संदर्भ में भाषा का अध्ययन किया जाता है। भाषा के समाजशास्त्र भाषा के आधार पर समाज की संरचना का अध्ययन किया जाता है। जैसे- एकभाषी समाज, बहुभाषी समाज आदि। इसके अतिरिक्त इसमें विभिन्न भाषा समुदायों का अध्ययन किया जाता है और साथ ही इन भाषाओं की उस समाज में भूमिका का भी अध्ययन किया जाता है।
विद्या का संदर्भ- इसमें भाषा के वैज्ञानिक अध्ययन ज्ञान का उपयोग भाषा से जुडे हुए विविध क्षेत्रों में किया जाता है। इसके प्रमुख उपक्षेत्रों को निम्न प्रकार से समझ सकते हैं -
विद्या का संदर्भ
अनुवाद विज्ञान (translation)
कोशविज्ञान (lexicography)
शैली विज्ञान(stylistics)
भाषा नियोजन (language arrengement)
वाक्दोष चिकित्सा (speech therepy)
अनुवाद विज्ञान में श्रोत भाषा की सामग्री का लक्ष्य भाषा में अनुवाद किया जाता है। अत: एक सफल अनुवादक को दोनो भाषाओं की संरचना (रूपिम, शब्द/पद, पदबंध, उपवाक्य, वाक्य, पाठ) का ज्ञान होना चाहिए। इसके लिए भाषाविज्ञान उपयोगी होता है।
कोशविज्ञान (lexicography) शब्दकोश निर्माण का शास्त्र है। शब्दविज्ञान (lexicology) शब्दों का अध्ययन है। कोशविज्ञान के कई संदर्भों जैसे- कोश में कितने शब्द हों, शब्द चयन का आधार, कोश के प्रकार तथा प्रयोजन का निर्धारण, एक प्रविष्टि से संबंधित सभी सूचनाएँ आदि के लिए भाषाविज्ञान अत्यन्त ही उपयोगी है।
शैली विज्ञान(stylistics)- इसमें किसी पाठ का भाषावैज्ञानिक विष्लेषण किया जाता है।
भाषा नियोजन (language arrengement)_ इसमें भाषा, बोली तथा भाषाई अस्मिता का विवेचन तथा वर्णन किया जाता है।
वाक्दोष चिकित्सा (speech therepy) में व्यक्तियों में होने वाले भाषा संबंधी विकारों का अध्ययन किया जाता है।
वर्तमान में तीव्र गति से हो रहे तकनीकी विकास ने भाषा अध्ययन को भी प्रभावित किया है। इसी कारण भाषा और प्रौद्योगिकी अथवा तकनीकी के अंतरानुशासित (interdisciplinary) कोर्सों जैसे- भाषा प्रौद्योगिकी, संगणक के साथ संगणकीय भाषाविज्ञान (computational linguistics) और यांत्रिकी के क्षेत्र में भाषा अभियांत्रिकी (language engineering) आदि क्षेत्रों का विकास हुआ है।
इस प्रकार आधुनिक भाषाविज्ञान अपने अनुप्रयुक्त पक्ष के साथ एक अत्यंत ही महत्वपूर्ण और प्रभावशाली ज्ञान की शाखा के रूप में उभरकर सामने आया है।

03 अगस्त 2009

जुलाई अंक के सदस्य

संपादन मंडल - रंजीत भारती (एम.ए. द्वि. छमाही भाषा-प्रौद्योगिकी विभाग),
गोबिन्द प्रसाद (भाषा-प्रौद्योगिकी विभाग),

शब्द-संयोजन - करुणा निधि (भाषा-प्रौद्योगिकी विभाग),
थोकचोम कमला देवी (भाषा-प्रौद्योगिकी विभाग)
छायांकन - अम्ब्रीश त्रिपाठी (भाषा-प्रौद्योगिकी विभाग)

संपादक - अमितेश्वर कुमार पाण्डेय (पी-एच.डी. हिन्दी भाषा-प्रौद्योगिकी विभाग)

संपादक के की-बोर्ड से ...

कहा जाता है कि मनुष्य को भाषा ने ही अन्य प्राणियों से अलग और श्रेष्ठ बनाया है। भाषा की शक्ति को कोई नकार नहीं सकता। फिर भी यह प्रश्न उठता है कि मनुष्यों के बीच भाषा आयी कहाँ से ? इस प्रश्न के उत्तर में ज्यादा गहराई तक न जाकर मोटे तौर यह कहा जा सकता है कि भाषा समाज से उत्पन्न हुई है। समाज अर्थात् मनुष्यों से उत्पन्न । भाषा के विकास के साथ ही समाज का विकास होता रहा है।
नए समाज की संकल्पना और अभिजात्य व लोक-समाज की पहचान का माध्यम भी भाषा ही बनी। प्रजातंत्र की प्रसिद्ध परिभाषा के अनुसार भाषा के संदर्भ में भी कहा जा सकता है कि ’भाषा समाज की, समाज के लिए और समाज द्वारा निर्मित है।’ इस बात को आज इक्कीसवीं सदी में प्रमाणित करने की जरूरत नहीं है जब मीडिया, विज्ञापनों आदि की भाषा आज हम सबके सामने है और इनकी भाषा पर निरंतर विचार-विमर्श होता रहता है। इस सदी में तो भाषा को प्रौद्योगिकी ने और भी आगे ले जाकर नए शोध और विमर्श का विषय बना दिया है। हमारी सबसे बड़ी संपर्क भाषा हिन्दी के साथ अन्य भारतीय भाषाओं का भी विकास प्रौद्योगिकी के माध्यम से और भी तेजी से हो रहा है जिसमें भाषाविद तथा प्रौद्योगिकी विशेषज्ञ एक साथ मिलकर हिंदी भाषा को एक नया आयाम प्रदान कर रहे हैं। चाहे अनुवाद का क्षेत्र हो जहाँ MATRA 2 ने google translator को पीछे छोड़ दिया है या भाषा से संबंधित अन्य क्षेत्र जैसे सूचना प्रद्यौगिकी क्षेत्र की प्रमुख कंपनी विप्रो इंफोटेक ने आतंकवाद और अपराध से लड़ने के लिए एक नया सॉफ्टवेयर विकसित किया है। यह सॉफ्टवेयर हिन्दी और अंग्रेजी दोनों भाषाओं में काम करेगा।) इसके अलावा
ब्लॉग, शिक्षा आदि सभी में आज हिंदी की पकड़ बनती जा रही है। इसकी एक प्रमुख वजह हिन्दी की अंतरराष्ट्रीय लोकप्रियता भी है।
आज इंटरनेट से संबंधित क्षेत्रों में अनेक विकल्प हिंदी के लिये मिल जाते हैं। इस दक्षता को हासिल करने के लिए अनेक कार्यक्रम लगभग एक दशक पहले शुरू किए गए जिसका सकारात्मक प्रभाव आज हम सबके सामने है। आज भी अनेक शोध कार्य इस क्षेत्र में जारी हैं। भाषा और प्रौद्योगिकी से जुड़े भविष्य के भाषाविदों से और भी आगे काम करने की उम्मीद है जो इस देश की भाषा और संस्कृति को एक नई पहचान और ऊंचाई पर ले जाएगें ।
इस अंक में भाषा और प्रौद्योगिकी से जुड़े विभिन्न क्षेत्रों पर लेख उपलब्ध हैं। सुप्रसिद्ध भाषाविद सपीर की उपलब्धियों के साथ अमरकोश और थिसॉरस को लेकर उसके तकनिकी पक्ष की बातें मिलेंगी तो भौतिक ध्वनिविज्ञान, शब्द, पद और भाषाविज्ञान से जुड़े इंटरनेट पर उपलब्ध सामग्रियों के लिंक भी मिलेंगे। आशा है इस अंक से आपको कुछ विशेष जानकारी प्राप्त होगी…
अमितेश्वर

भाषा और प्रौद्योगिकी से संबंधित लिंक

- प्रवीण, सौरभ
www.grammar.agoodplace4all.com ऑनलाइन हिन्दी ग्रामर
www.takneek.com हिन्दी में प्रौद्योगिकी की जानकारी से संबंधित
www.epatra.com हिन्दी में ई-मेल के लिए
www.unicode.org कैरेक्टर स्तरीय मानकीकरण से संबंधित
http://dir।yahoo.com/Social_Science/linguistics_and_human_languages/
http://applij।oxfordjournals।org
http://www.ielanguages.com/linguist.html

Semantic Net Based Hindi Information Retrivel System*

(आर्थीय-तंत्र आधारित हिन्दी सूचना प्रत्यानयन-प्रणाली)
-अरिमर्दन कुमार त्रिपाठी
Information Retrieval is one of the most challenging and enormous fields of Natural Language Processing. In the present social scenario 'information' is treated as not only knowledge but also as constituents of power in its context with its own property.In this corpus, which represents natural language into language oriented computational behaviors; syntax is the key feature for information point of view, which can be covered through some punctuation marks, available in the texts. For retrieving information from any text, the supportive database of a hierarchically mapped semantic net should be prepared in concerned languages, and the corpus should be POS and syntactically tagged.The role of a semantic net is central in this process, therefore it's database will be normalized. The result query will cover all the probable results despite mistakes committed by humans, like spelling and orthographic variations (etc.). In real time processing, the first query will go into the semantic net, then it will match the relevant text according to that query. That is why a hierarchically mapped and normalized database will be more helpful to get results with sorted frame.Although in this model preprocessing is required within the certain adopted framework at several levels, such as tagging, normalizing and hierarchical mapping of data as per its use and role in society. In its result, however, there is no need of post processing; the result will be indexed according to the mapped hierarchy so that output will be relevant and well matched to queries.In this model, stemming and ambiguity resolution of a given query will be helpful in matching. Codification of stop words will increase the speed of system processing.
*Abstract of M.Phill. Research work

कार्पस : एक संकल्पना

कु. हर्षा रा. वडतकर
मनुष्य की प्रवृत्ति खोजी, जिज्ञासु और किसी भी असंभव चीज को संभव बनाने की ओर लगी रहती है। उसने हमेशा ही अपने सोच को मूर्त रूप देने की कोशिश की है। आज कंप्युटर से हर क्षेत्र में काम हो रहे हैं। सरल शब्दों में कहे तो कंप्यूटर मनुष्य के सहायक की भूमिका निभा रहा है।
प्रौद्योगिकी का लक्ष्य भाषा को माध्यम बनाकर भाषा विश्लेषण करना, भाषा के अनछुए पक्षों को उद्धाटित करना तथा भाषिक सिध्दांत को समृध्द बनाना है। विभिन्न सामाजिक संदर्भ, सास्कृतिक परिवेश और विषय-भेद के कारण भाषा विषमरूपी होती है। भाषा के इस विषमरूपी प्रकृति को समझने के लिए विद्वानों ने कभी 'रजिस्टर', 'शैली', 'उपकोड' आदि संकल्पनाओं को अपने भाषा सिध्दांत में स्थान दिया है । इसी कड़ी में 'कार्पोरा' की संकल्पना 19 वीं शताब्दी के अंत में प्रचलन में आयी । प्रौद्योगिकी के अंतर्गत हम भाषा और संगणक से संबंधित कार्यों का वर्णन करते है। जैसे मशीनी अनुवाद, लेक्सिकन, टैगर, जेनरेटर, कॉर्पस निर्माण आदि।
मै अपने आलेख में तीन प्रश्नों को लेकर बात करूंगी जिसकी जिज्ञासा इस क्षेत्र से संबंध रखने वाले सभी के मन में होती है। सर्वप्रथम, आज की स्थिति में प्रचलित संकल्पना ’कार्पोरा’ क्या है? इसकी आवश्यकता क्यों पड़ी है? तथा इसकी महत्व एवं उपयोगिता कितनी है? ’कॉर्पस’ कार्पोरा का बहुवचन रूप है। कार्पोरा में किसी भाषा के शब्द तथा वाक्यों को संग्रहित कर ग्राहय/पठनीय रूप में रखा जाता है जिससे मनुष्य मदद लेता है। अगर कार्पोरा उपलब्ध नही है तो हमें उस भाषा के अलग-अलग उपकरण बनाने के लिए प्रत्येक समय डेटा इकट्ठा करना पड़ता है। हम कार्पोरा की सहायता से समय की बचत तथा उपकरणों के निर्माण प्रक्रिया में तेजी ला सकते हैं।
कार्पोरा में लिखित तथा वाचिक डेटा द्वारा उपकरण बनाए जाते हैं जो अधिक सार्थक तथा उपयोगी होते हैं। इसमें इकट्ठा किये गये डेटा में आम लोगों की बातचीत तथा अलग-अलग समय पर एक व्यक्ति द्वारा प्रयोग में लायी जानेवाली भाषा एवं शब्दावली में बदलाव आदि की जानकारी होती हैं। एक अच्छे कार्पोरा से कई तरह के उपकरण बनाए जा सकते हैं जो मशीनी अनुवाद में प्रयोग किये जा सकते हैं। उदहारण के लिए वर्तनी जांचक, लेक्सिकन टैगर, मशीनी व्याकरण , जेनरेटर आदि।
कार्पोरा दो प्रकार में मौजूद होते हैं। लिखित कार्पोरा में भाषा के लिखित रूप जैसे साहित्य, समाचार पत्र, कहानी, उपन्यास आदि में प्रयोग की जानेवाली भाषा को रखते हैं तथा वाचीक रूप में सामान्य जनता के बीच सामान्य बोलचाल की भाषा को रिकार्ड करते हैं जिसमें व्याकरण का ध्यान नहीं रखा जाता। उदाहरण के लिए स्कूल का कार्पोरा, बाजार का कार्पोरा आदि।
अंतत: हम देखते हैं कि मशीनी अनुवाद की शुरूआत ही कॉर्पस निर्माण से होती है जिसमें कार्पोरा के उपकरण उपयोगी साबित होते हैं। इन उपकरणों में Pos Tagger , Chunker , Spell Checker , Lexicon आदि आते हैं।

भाषा का लोकार्पण

मनीष
हिन्दी तुलनात्मक साहित्य विभाग
मानव के सामाजिक-ऐतिहासिक विकास की प्रक्रिया से गुजरते हुए हम पाते हैं कि मानव-सभ्यता को विकसित/स्थापित करने हेतु जो भी आविष्कार/खोज हुए हैं उनमें भाषा का आविष्कार सर्वथा एक महत्वपूर्ण घटना है। भाषा का विकास नैसर्गिक रूप में हुआ है, प्रक्रिया में यह प्रकृति और मानव के सामूहिक प्रयत्न का परिणाम है। तब यह मात्र संकेत स्तर पर थी। कालान्तर में इसे ध्वनि मिली, ध्वनि समूह मिले और मिला ध्वनि-चिह्न यानि 'लिपि'।
समाज की आवश्यकताओं के अनुरूप भाषा का विकास होता रहा, जब जैसा समाज, समाज की जैसी आवश्यकता , भाषा का वैसा और उतना विकास। मानव के समाजिकीकरण के आरंभिक कबीलाई अवस्था में प्रत्येक कबीले/समुदाय की अपनी एक खास भाषा, भाषिक ध्वनि-संकेत, शब्द, शैली होती थी जिसे उसी समुदाय के लोग बोलते-समझते थे। एक कबिलाई समाज के दूसरे कबिलाई समाज से परस्पर मिलने-जुलने से उनकी भाषा का आदान-प्रदान हुआ जिससे एक नई सशक्त भाषा विकसित हुई। इसी प्रक्रियाओं से गुजरते हुए लोक-भाषाएं शिष्ट-भाषाओं में तब्दील हुईं।
यह जगजाहिर है कि लोकभाषा ही शिष्ट भाषा की जननी है। अपनी कृत्रिमता के कारण जब कभी शिष्ट/साहित्यिक भाषा में रूखापन आया है या उसकी संवेदनक्षमता में गिरावट आई है, लोकभाषा ने उसे संजीवनी रस पिलाया है, उसे नई चेतना, नया आयाम दिया है।
लोकभाषा, लोकजीवन की भाषा है। यह बहता नीर है। व्याकरण के कूल-किनारों को तोड़ती हुई इसकी सतत् प्रवाहमयी धारा में नैसर्गिक संगीत है, निष्कलुषता है जिससे जन मानस को सदैव ही आत्मिक तृप्ति मिलती रही है।
आज जिसे सभ्य और शिष्ट समाज, सरकार, शिक्षण-संस्थान, कोर्ट-कचहरी की भाषा कहा जाता है, वह उस समाज की भाषा है जो सुविधाभोगी है, सभ्यता के भूमि, जल, आकाश, अग्नि, हवा जैसे अन्य अनेक साधनों की तरह 'भाषा' का भी दोहन (प्रयोग) करने के लिए स्वतंत्र है। किंतु वह समाज, जिसे भौतिक जीवन की बुनियादी सुविधाएं भी प्राप्त नहीं हैं, उनकी भाषा (लोकभाषा) में शब्दों (ध्वनि-प्रतिकों) की प्राय: कमी दिखाई पड़ती है। उनके जीवन की आवश्यकता थोड़े-से ही नपे-तुले शब्दों के प्रयोग से पूरी हो जाती है। लोक जीवन के अध्ययन से स्पष्ट होता है कि वहाँ भाव, कल्पना, विचार अथवा दैनिक आवश्यकताएं अत्यन्त सीमित हैं।
लोकजीवन में प्रचलित अनेक नाम आज भी छोटे-छोटे ध्वनि-संकेतों के रूप में मिलते हैं। ये शब्द/नाम समाज की सीमित आवश्यकताओं के अनुरूप बनाए गए होंगे, जिनके अवशेष आज भी भाषा में सुरक्षित हैं। उदाहरणार्थ- खेत, अनाज, अन्न, बीया, बीज, घर, दुआर, अंगना, हाट, बैल, गाई, बोझा, खुरपी, हसुआ, टोकरी, कुदार, लाठी, चुल्हा, चौका, ओसारा, दीया, बाती आदि। लोकजीवन में संक्षिप्तता बरतने का इससे अच्छा उदाहरण और क्या हो सकता है कि पिता के लिए भी 'बाबू', चाचा के लिए भी 'बाबू', बच्चे के लिए भी 'बाबू' और मालिक के लिए भी 'बाबू' शब्द का प्रयोग होता है।

लोकजीवन की भाषा की एक और विशेषता है कि इसके शब्द प्राय: अनेकार्थी नहीं होते। इन शब्दों से प्राय: एक ही अर्थ का बोध होता है। जहॉं शब्द अनेकार्थी होते हैं वहॉं प्रोक्ता को विविध संदर्भों में अर्थ ग्रहण करने का सहज विकल्प होता है। लोकभाषा के शब्द बहुधा रूढ़ या रूढ़ार्थक होते हैं। यहां यौगिक और योगरूढ़ शब्द नहीं मिलते। उदाहरणार्थ लोकभाषा में बहुप्रचलित शब्द 'अनाज', 'फर', 'गाछ' आदि को लें। अनाज एक बहुअर्थी रूढ़ शब्द है। इसके भिन्न-भिन्न भेद/प्रभेद हैं, यथा- धान, गेहूँ, जौ, अरहर, चना, मूँग, मक्का आदि। मानक हिंदी में प्रचलित 'फल' शब्द के समानार्थ लोकभाषा का 'फर' शब्द है।
लेकिन जीवन में आधुनिकता का समावेश होने के कारण परंपरा से लोक में प्रचलित शब्दों की जगह नए शब्द आ गए हैं जिनसे पुराने प्रचलित शब्दों का लोप होता जा रहा है। आटाचक्की के कारण जाँता-चक्की का 'पिसान' अब ’आटा’ में बदल गया है। जैसे- गेहूँ का आटा, चावल का आटा, दाल का आटा ,मक्का का आटा आदि। इसी तरह बिजली के बल्ब की चकाचौंध में दीया, दीपक, डिबिया, दीप जैसे शब्द लूप्त होते जा रहे हैं।
लोकजीवन के रंजक शब्द 'लालटेन', 'सुगापंखी', 'धानी', 'धूसर', 'जामुनी', 'चितकाबर' आदि जैसे शब्द भी अब सुनने में नहीं आते।
यह अलग बात है कि शिष्ट भाषा का कोश निरंतर 'लोकभाषा' के शब्द-भंडार से भरता जा रहा है, फिर भी आवश्यकता है कि भाषावैज्ञानिक दृष्टि से 'लोक' और लोकभाषा की संरचना का तात्विक अध्ययन किया जाए।

साइबर आतंक

अंजनी कुमार राय
प्रणाली विशेषज्ञ (लीला)
इंटरनेट प्रयोग करते समय आप कितने सुरक्षित हैं?
Entiding ई-मेल का विषय और फोटो आपके सुरक्षा तंत्र को हानि पहुँचा सकते हैं। ऐसी कोई चीज नहीं है जिससे आपका कंप्यूटर सुरक्षित रह सके । दुनिया में संघटनात्मक अपराध में दिनोंदिन बढ़ोत्तरी हो रही है। जिससे हमला और अधिक पैना एवं आधुनिक होता जा रहा है।
यह केवल वायरस, ट्रोजन या वार्म (प्रोगामिंग कीड़े) की बात नहीं है जो आपके कंप्यूटर सिस्टम को हानि पहुँचा सकते हैं।बल्कि जब आप इंटरनेट से जुड़े होते हैं तब आप बहुत तरह के आघात को खुला आमंत्रण देते हैं। हैकर आपके सिस्टम से सीधे सम्पर्क कर सकते हैं। विशेषज्ञों का कहना है कि साइबर आतंकवादी कंप्यूटर को अधिग्रहण (हैक) कर लेते हैं और ट्रोजन के जरिए ईमेल भेजते हैं। ट्रोजन पुराने तरीके से धोखा देने वाला एक तरीका है जिसके जरिए एक प्रोग्राम को लोड किया जाता है और इसके जरिए हैकर आपके कंप्यूटर तक बड़ी आसानी से पहुंच बना सकते हैं। हैकर आपके कंप्यूटर पर आए हुए मेल और आपके द्वारा भेजे गए सभी मेल पर अपनी नजर रख सकता है। इसके अलावा आप किस वेबसाइट को देखते हैं और आप जो भी लेन-देन करते हैं इसके बारे में भी हैकर को जानकारी मिल जाती है और आपको पता भी नहीं चलता।
Malicious website- यह आपकी व्यक्तिगत जानकारी ले सकते हैं। जैसे क्रेडिट कार्ड की जानकारी, पासवर्ड, सॉफ्टवेयर पीसी में घुसकर बहुत कुछ आपके जानकारी के बिना कर सकते हैं क्योंकि कंप्यूटर सॉफ्टवेयर एवं इंटरनेट भविष्य में बहुत धनी एवं कठिन होते जा रहे हैं। सभी को सतर्क रहने की जरूरत है। खासकर जब आप कोई ऑनलाईन लेनदेन बैंक में और शॉपिंग करने के दौरान कर रहें हैं।
1990 के दशक में वेब पेज को सर्फ करने में खतरा नहीं था क्योंकि उस समय बहुत साधारण किस्म का वेब पेज हुआ करता था। परंतु अभी के समय में वेब पेज कठिन होता है जिसमें प्रत्यारोपित वीडियो, जावा स्क्रीप्ट पी.एच.पी. कोड और भी बहुत सारी अंतरंग (interective) सुविधाएं होती हैं। प्रोग्रामिंग की गलतियाँ एवं लूप होल्स जिसके कारण इस तरह के वेबसाइट को हमलावर (attacker) अपने हाथों में लेकर व्यक्तिगत जानकारी को हासिल कर लेता है या अपने सॉफ्ट्वेयर को आपके पीसी में स्थापित करता है। इन सबसे बचने के लिए आत्म रक्षा एवं सुरक्षा के पहलू को जानने की जरूरत है।
यदि आप कोई ई-मेल जो कि अपरिचित स्रोत से प्राप्त करते हैं जिसमें आपसे कहा जाता है कि आप इस लिंक पर क्लिक करके लड़की को नग्न अवस्था में देख सकते हैं। आजकल बहुत लोग इस बात को जानते हैं कि इस तरह के लिंक को क्लिक करने से वायरस का आघात हो सकता है। लेकिन अभी भी बहुत से इंटरनेट यूजर हैं जो इस बात से अनभिज्ञ हैं।
तब आप क्या करें जब एक ई-मेल ज्ञात स्रोत से प्राप्त हो। जैसे कि आपके बैंक से एक ई-मेल आता है, जिसमें बैंक का ग्राफिक, पहचान चिह्न (logo) हो और आपसे कहे कि पिन या पासवर्ड को पुनः स्थापित करने के लिए क्लिक करें। यह लिंक आपको आपके बैंक के वेबपेज पर ले जाएगा। आपको लगेगा जो पेज खुला है जिसमें वेरीसाइन (verisign) के सुरक्षा सर्टिफिकेट का लोगो मौजूद है। तब आप अपना पहले का आई-डी और पासवर्ड देते हैं। साथ ही आप हमलावर को इस बात का मौका भी देते हैं कि वो आपका खाता पूर्णतया खाली कर दे या आपके दिए गए नंबर से ऑनलाइन खरीदारी कर सके।
पहले बताए गए हमला विधि को जो ई-मेल आपके बैंक से आया है और कहता है कि आप अपनी व्यक्तिगत जानकारी दें। इस प्रकार का हमला पब्लिसिंग कहलाता है। इसकी जानकारी लगभग सभी लोगों को दिनोंदिन हो रही है जिसके कारण हमलावार ने एक नया और पैना रास्ता निकाला है जिसे cross-site scripting (xss) कहते हैं। इसमें हमलावर प्रत्यारोपित लिंक में कोड जोड देते हैं। यह कोड वेब एप्लिकेशन को अपने तरिके से चलाता है। इस प्रक्रिया में सर्वर में कोई परिवर्तन नहीं होता बल्कि आपके सामने आने वाले पेज का परिवर्तन होता है। सामान्यता ये आपको दूसरे पेज पर ले जाते हैं जो हमलावर द्वारा तैयार किए गए होते हैं। इस तरह के हमलों को रोकने के लिए कंप्यूटर सुरक्षा विशेषज्ञ नए सॉफ्ट्वेयर की प्रोग्रामिंग में लगे रहते हैं। तबतक इन हमलों से बचने के लिए इलाज के बजाए रोकथाम का उपाय ही बेहतर रास्ता नजर आता है।
... शेष अगले अंक में

एडवर्ड सपीर


करुणा निधि

एडवर्ड सपीर का जन्म सन्‌ 1884 ई. में लीओबार्क पोलैंड (Leobark Poland) स्थित पश्च्मि पोमेरेनिआ (Western Pomerania) के लाएन्बर्ग (Lauenburg), में हुआ था। वे लिथुआनियन ज्यूज के वंशक थे जिन्होंने पहले इंग्लैड में प्रवास किया और फिर सन्‌ 1889 में संयुक्त राज्य अमेरिका में आकर रहे। अंतिम के पाँच वर्षों में ये न्यूयार्क सीटी के निम्न पूर्वी क्षेत्र में आकर बस गए। उस समय सपीर की उम्र मात्र दस वर्ष की थी। वे प्रारंभ से ही अकादमिक रूप से एक मेहनती छात्र रहे जिसके फलस्वरूप उन्हें चौदह वर्ष की अल्पायु में ही पुलित्जर छात्रवृत्ति प्रदान की गई जो न्यूयार्क के हॉरेस मैन स्कूल में पढ़ने के लिए योग्य छात्रों को प्रदान की जाती है। वर्तमान में यह विद्यालय देश के सर्वाधिक लोकप्रिय और उच्चकोटी के विद्यालयों में गणनीय है। बावजूद इसके इन्होंने पब्लिक स्कूल में ही पठन-पाठन का निर्णय लिया। सन्‌ 1901 ई. में कोलम्बिया विश्वविद्यालय में नामांकित होने के उपरांत इन्होंने पुरस्कृत छात्रवृत्ति का लाभ उठाया।
20 वर्ष की आयु में तीन वर्षीय स्नातक डिग्री लेने के उपरांत इन्होंने भाषाई संबंधी, जर्मनिक एवं भारतीय वाङ्‍मीमांसा को अपने अध्ययन में केन्द्रीय रूप से स्थान दिया जो तत्कालीन समय में उपलब्ध भाषाई-अध्ययन का सैद्धांतिक क्षेत्र था। स्नाकोत्तर डिग्री कार्यक्रम के अंतर्गत इस अध्ययनक्रम को बढ़ाते हुए इन्होंने नृतत्त्वविज्ञान के सिद्धांतों के आलोक में भाषाविज्ञान के सिद्धांतों का विश्लेषण किया और फ्रैन्ज बाओज के साथ कुछ पाठ्‍यक्रमों का निर्माण भी किया। बाओज ने सपीर में भाषावैज्ञानिक की उभरती प्रतिभा को पहचाना एवं उन्हें प्रोत्साहित किया।
सन्‌ 1905 ई. में “Herder’s essay on the origin of language” शीर्षक पर शोध-प्रबंध के साथ सपीर ने अपनी स्नाकोत्तर डिग्री पूरी की। भाषाई क्षेत्र में उपस्थित तथ्यों और भाषिक विश्लेषण के अनेक अवसर से प्रभावित होकर इन्होंने बाओज के मार्गदर्शन में स्नाकोत्तर अध्ययन को प्रगतिशील रखा। इसी वर्ष बाओज ने इन्हें वास्को और विस्‌राम चिनुक पर प्रथम फिल्ड वर्क के लिए भेजा। सन्‌ 1906 के लगभग एक वर्ष के फिल्ड वर्क के दौरान ये ओरेगन (oregen) की दो भाषा ताकेल्मा (Takelma) और कास्ता कोस्ता (casta costa) पर अपने शोध-प्रबंध के लिए सामग्री-संकलन कर वापस लौटे। शोध-प्रबंध लिखने के पूर्व ही ये बाओज के पूर्व छात्र एल्फ्रेड क्रोयबर (Alfred Kroeber) जो कैलिफोर्नियन भारतीयों की भाषा एवं संस्कृति के सर्वेक्षण के प्रभारी थे, के निर्देशन में कैलिफोर्निया विश्वविद्यालय में शोध-सहायक के रुप में नियुक्त हुए।
सन्‌ 1908 ई. में इन्हें पेन्सिल्वेनिया विश्वविद्यालय में शिक्षण और शोध के क्षेत्र में फेलोशिप से पुरस्कृत हुए जहाँ ये काटाब्बा (Catabba) में कार्यरत थे। कोलम्बिया विश्वविद्यालय द्वारा इन्हें सन्‌ 1909 ई. में पी.एच.डी. की उपाधि प्रदान की गई परंतु उस समय भी ये अपने छात्रों के साथ भाषा संबंधित कार्य में संलग्न रहे।
सपीर पेन्सिल्वेनिया विश्वविद्यालय में अमेरिकन भाषाओं के विश्लेषण से जुड़े रहे तथा इसी विश्वविद्यालय में अपने दूसरे वर्ष के कार्यकाल में दक्षिणी पेउत (Paiute) एवं होपी व क्षेत्रीय विधियों में स्नातक छात्रों को प्रशिक्षित करते हुए निर्देशक के रूप कार्यरत रहे। सन्‌ 1910 ई. में इन्होंने भूगर्भीय सर्वेक्षण, खनिज संकाय के नृतत्त्वविज्ञान विभाग में प्रथम मुख्य एंथ्रोपोलॉजिस्ट के रूप में पदभार संभाला। इसी वर्ष ओटावा में इनका विवाह हुआ और अपनी पत्नी के साथ वहीं रहने लगे। सोलह वर्षों तक इस पद पर कार्यरत रहते हुए इन्होंने उत्तरी, पश्चमी एवं पूर्वी कनाडा के बहुसंख्यक भाषाओं, यथा- नूटका, वैनुकरणीय भाषा, त्लाइंगित, उत्तरी पश्चमि प्रशांती भाषा, एलबेट्रा (Albetra) में सार्सी और उत्तरी कनाडा के कुचिक (Kutchik) और इंग्लिक (Inglik) भाषा पर कार्य किया।
सपीर की पत्नी लंबे समय से शारीरिक एवं मानसिक रूप से अस्वस्थ रहने के कारण सन्‌ 1914 ई. में सपीर को उनके तीन बच्चों के साथ अकेला छोड़ कर चली बसी। उनकी मदद करने उनकी माँ आई। इस दौरान इन्होंने अपने कोलम्बिया एवं पेन्सिलवेनिया में बिताए पूर्व अध्ययनकाल की कमी बौद्धिक रूप से महसूस की। बावजूद इसके इन्होंने भाषावैज्ञानिक कार्य को जारी रखा। फिर भी ओटावा में बिताए वर्षों में ही इन्होंने अपने महत्तम कार्य संपन्न किये। इनका यह कार्य 1921 के रूपरेखा से संबंधित था जिसमें इन्होंने अमेरिकन भाषाओं को उनके छ: भाषा परिवार में वर्गीकृत किया जिसका वर्णन उनके प्रसिद्ध ग्रंथ “Language: An introduction to the study of speech” में मिलता है। यह उनके जीवनकाल की एकमात्र पुस्तक थी जिसमें उन्होंने भाषाविज्ञान के सांस्कृतिक एवं समाजवैज्ञानिक सिद्धांतों को अत्यंत उच्च कोटि लेखन द्वारा प्रस्तुत किया। इस ग्रंथ में इन्होंने स्वनिम तथा रूपस्वनिमिकी का समावेश किया और अपनी ओर से भाषाविश्लेषण कर एक प्रदर्श (model) प्रस्तुत किया। लेकिन इस ग्रंथ की विशेषता इस बात में है कि इन्होंने भाषा और संस्कृति के संबंध पर बल दिया तथा भाषा के रूप पक्ष (form) के वर्णन में सौंदर्य और सुघड़ता का समावेश किया। आगे चलकर ब्लूमफील्ड और सस्यूर ने इनके अध्ययन को नवीन रूप प्रदान किया। 1920 ई. के प्रारंभ में ये लिंग्विस्टिक सोसायटी ऑफ अमेरिका को बनाने में व्यस्त रहे। इस बीच उन्होंने Language नामक जर्नल निकाला एवं ओटावा में कुछ वर्षों तक कविता लेखन, आलोचना एवं संगीत कला का आस्वाद लिया। परंतु इनका अधिकांश समय छात्रों को विधि और सिद्धांत द्वारा प्रशिक्षित करने में व्यतीत होता था।
इस प्रकार 1925 ई. में उन्नति की दिशा में अग्रसर होते हुए इन्हें शिकागो विश्वविद्यालय की ओर से अध्यक्ष पद के लिए नौकरी का प्रस्ताव आया जो समाजभाषाविज्ञान मे सशक्त संकायों को उन्नत करने में प्रयत्नशील था। इन्होंने स्वयं को इक्लेक्टिक एवं अंतरानुशासिक महत्त्वों में एक गंभीर विचारक के रूप में देखा तथा इसी बौद्धिक उत्साह के साथ इस क्षेत्र से जुड़ गए। दो वर्षों के अंदर ही ये नृतत्त्वविज्ञान एवं सामान्य भाषाविज्ञान के प्रोफेसर के रूप में पदासीन हुए। साथ ही विवरणात्मक भाषाविज्ञान जिसमें ह्‌यूपा और नवाजों पर आधारित क्षेत्रीय कार्य भी सम्मिलित थे, का निरंतर विकास करते रहे तथा सर्वाधिक महत्त्व का विषय जो मानव के संस्कृति और व्यक्तिगत मनोविज्ञान से संबंधित था, का सैद्धांतिक विवरण प्रस्तुत किया। साथ ही स्वतंत्र अनुशासन भूगर्भशास्त्र और नृतत्त्वविज्ञान एवं समाजविज्ञान के विस्तृत संदर्भ में भाषाविज्ञान की भूमिका प्रस्तुत की। लिंग्विस्टिक सोसायटी ऑफ अमेरिका की स्थापना एवं उसकी पत्रिका के द्वारा इन्होंने संयुक्त राज्य में भाषावैज्ञानिक क्षेत्र में मजबूत आधार स्तंभ खड़ा किया।
सन्‌ 1927 ई. में पुनर्विवाह कर पत्नी एवं बच्चों के साथ एक सुखद एवं सामाजिक जीवन व्यतीत करने लगे जिसमें इन्हें अत्यंत गंभीरता से अपने संबंधित विषय पर विचार करने का लंबा अवसर मिला। शिकागो में अध्यक्ष पद पर रहते हुए ज्यादा समय नहीं हुआ था कि इसी बीच 1931 ई. में उन्हें येल (Yale) में नृतत्त्वविज्ञान एवं भाषाविज्ञान के प्रामाणिक प्रोफेसर के पद से अलंकृत किया गया। यह एक सम्मानीय पद था जिसके साथ सुखद भविष्य को लेकर अनेक अपेक्षाएँ जुड़ी थीं। फलस्वरूप इन्होंने वचनबद्ध एवं दृढ़ संकल्प के साथ अध्ययन-अध्यापन कार्य प्रारंभ किया, जिसमें शिकागो के छात्र उनके साथ मिलकर वहीं एक “संकाय” की स्थापना की जो ‘Sapirian method and theory’ के लिए समर्पित था। सन्‌ 1937 ई. के मध्य वे लिंग्विस्टिक सोसायटी ऑफ अमेरिका के समर संस्था में अध्यापन करने लगे जिसके दौरान उन्हें दिल का दौरा पड़ा। अस्वस्थ अवस्था में भी वे शिक्षण क्षेत्र से जुड़े रहे। दूसरी बार दिल का दौरा पड़ने के उपरांत, उन्हें अस्पताल में भर्ती किया गया। परंतु फरवरी 1939 ई. में 55 वर्ष की आयु में ही दिल की बीमारी के चलते उनका देहांत हो गया।
सपीर बेन्जिमिन लीवोर्फ के गुरु थे, जिन्होंने (लीवोर्फ ने) येल (Yale) में उनके संरक्षण में अध्ययन किया और उनके अस्वस्थ अवस्था में छात्रों को पढ़ाया। वोर्फ ने होपी भाषा पर भी महत्त्वपूर्ण कार्य किया एवं भाषा और विचार के संबंधों पर प्रस्तुत सपीर के विचार को अपने विचारों द्वारा संशोधित कर नए आवरण में प्रस्तुत किया। परिणामस्वरूप यही विचार कालांतर में “Sapir-Whorf hypothesis” या वोर्फ के शब्दों मे “Principle of Linguistics relativity” नाम से प्रतिपादित हुआ।

थिसॉरस

गोबिन्द प्रसाद
भाषा-प्रौद्योगिकी विभाग
थिसॉरस एक तरह का शब्दकोश है। यह ग्रीक शब्द ‍“थिसरस” से बना है जिसका अर्थ ’कोश’ होता है। यह आम प्रचलित शब्दकोश से काफी भिन्न होता है तथा भिन्न पद्धति पर निर्मित होता है। अगर शब्दकोश ’शब्द’ को परिभाषा देता है तो थिसॉरस ’परिभाषा’ (संकल्पना) को शब्द देता है। यह अव्यक्त को व्यक्त, अमूर्त को मूर्त और निराकार को साकार करता है क्योंकि भावों अथवा संप्रत्ययों और विचारों के साकार रूप शब्द ही होते हैं। शब्दकोश की अपेक्षा थिसॉरस में शब्दों का नहीं, शब्द-समूहों का संकलन किया जाता है। यह संकलन आकारादिक्रम से न कर के भावक्रम से किया जाता है। संसार के जितने पदार्थ हैं, जितने विचार हैं, जितनी मान्यताएँ, धर्म अथवा देवी-देवता हैं, संदेह, अन्वेषण, कालक्रम अथवा भविष्य की कल्पना है, सबका वर्गीकरण किया जाता है। फिर उन सबको एक के बाद एक इस तरह रखा जाता है कि एक भाव से दूसरे भाव तक की यात्रा सहज और स्वाभाविक रहे। हर भाव का अपना एक शब्द समूह होता है। इसमें भाव विशेष की अभिव्यक्ति देने वाले अधिकाधिक शब्दों को संकलित किया जाता है। संज्ञा, सर्वनाम, विशेषण, क्रिया-विशेषण आदि शब्द-समूह पर्यायवाची शब्दों के समूह नहीं होते अपितु एक जैसी वस्तुओं के शब्द-समूह होते हैं।
पहला आधुनिक थिसॉरस 1852 ई. में अंग्रेजी में प्रकाशित हुआ जिसका नाम है- ’रोजेत थिसॉरस’ (Roget’s thesauras)। इसके रचयिता पीटर मार्क रोजेत हैं। डॉ. रोजेत प्रसिद्ध वैज्ञानिक और रॉयल सोसायटी के महासचिव थे। रोज परिवर्तित होती आधुनिक विज्ञान और प्रौद्योगिकी संबंधी विचारों को शब्द प्रदान करने में थिसॉरस बड़ी अहम भूमिका निभाते हैं। अंग्रेजी भाषा में आज अनेक थिसॉरस मौजूद हैं जो संसार भर में अंग्रेजी भाषा में सही और बेहतर प्रयोग में सहायक हो रहें हैं।
यदि संस्कृत भाषा की बात की जाए तो इसमें अमरसिंह द्वारा रचित ’अमरकोश’ को आधुनिक थिसॉरस की श्रेणी में रखा जाता है। अमरकोश को नामलिंगानुशासन और तीन काण्डों में होने के कारण ’त्रिकाण्ड’ भी कहते हैं। 10,000 पारिभाषिक शब्दों का कोश होने के कारण यह संस्कृत कोशों में सर्वाधिक प्रचलित एवं मह्त्त्वपूर्ण है।
हिंदी में थिसॉरस अब तक अरविंद कुमार द्वारा संपादित समांतर कोश में प्रकाशित हुआ है। यह हिंदी भाषा का पहला थिसॉरस माना जाता है। हालॉंकि अब तक हिंदी में कई थिसॉरस प्रकाशित हो जाने चाहिए क्योंकि पिछले एक दशक से हिंदी को जिस प्रकार तकनीकी पक्ष से जोड़ा जा रहा है, उस हिसाब से देखा जाए तो हिंदी में अब तक कई थिसॉरस होने चाहिए। लेकिन ऐसा नहीं हुआ है। हिंदी का यह दुर्भाग्य तो नहीं लेकिन रूचि का अभाव अवश्य माना जा सकता है।

ध्वनियों के भौतिक अध्ययन का संक्षिप्त इतिहास

-धनजी प्रसाद
भाषा-प्रौद्योगिकी विभाग
भाषाविज्ञान में ध्वनि को भाषा-अध्ययन की सामग्री कहा गया है। भाषिक ध्वनियों का अध्ययन करने वाली भाषाविज्ञान की शाखा का नाम ध्वनिविज्ञान है। ध्वनिविज्ञान में भाषिक ध्वनियों का अध्ययन उनके उच्चारण, संवहन तथा श्रवण के आधार पर किया जाता है। जब भाषिक ध्वनियों का अध्ययन उनके संवहन के आधार पर किया जाता है तो इसे भाषिक ध्वनियों का भौतिक अध्ययन कहते हैं। यह अध्ययन ध्वनिविज्ञान की जिस शाखा के अंतर्गत किया जाता है उसे ’भौतिक-ध्वनिविज्ञान’ कहते हैं।
ध्वनिविज्ञान में भाषिक ध्वनियों का संवहन और श्रवण के आधार पर अध्ययन बहुत कम हुआ है। अत: जब हम भाषा ध्वनियों के भौतिक अध्ययन कि बात करते हैं तो इसमें सामग्री की कमी स्वाभाविक रूप से नजर आती है। जब बात इसके इतिहास की हो, तो वह बहुत ही संक्षिप्त है जिस पर हम एक नजर इस प्रकार डाल सकते हैं।
विश्व में ध्वनि तरंगों का आरम्भिक अध्ययन संगीत के क्षेत्र में ही हुआ। महान गणितज्ञ पाइथागोरस ने ध्वनि तरंगों के संदर्भ में ’हार्मोनिक ओवरटोन सीरीज’ को गणितीय अनुपातों के आधार पर प्रस्तुत किया था। अरस्तु (384-322 ई.पू.) ने कहा कि ध्वनि द्वारा वायु के संकुचन और विस्तार में एक कण के दूसरे कण से टकराने पर तरंग की उत्पत्ति होती है। 20 ई. पू. रोमन गृहशिल्पी (architect) तथा इंजिनियर विट्रूवियस ने नाटकघरों के निर्माण में भौतिक ध्वनि तरंगों की विशेषताओं (properties) जैसे- व्याघात (interface), गूंज (echoes) और कम्पन के महत्त्व की बात की। इससे गृहशिल्प भौतिकी (architectural acoustics) की बात शुरू हुई।
वैज्ञानिक क्रान्ति के बाद ध्वनि तरंगों के भौतिक स्वरूप के अध्ययन में तेजी आई। गैलीलियो (1564-1642) और मर्सने (1582-1648) ने कम्पन करती हुई तरंग के संदर्भ में नियमों को प्रस्तुत किया।
19वीं शताब्दी में जर्मन विद्वान हेमहोल्ट (helmholtz) ने शरीरवैज्ञानिक भौतिक स्वनविज्ञान (physical acoustics) पर काम किया। इसी समय इंग्लैण्ड के लार्ड रेली (Lord Rayleigh) ने ’द थियरी आफ़ साउंड’ लिखा।
20वीं शताब्दी में आवाज की रिकार्डिंग और टेलिफोन ने ध्वनि अध्ययन को नई दिशा प्रदान की। जलीय भौतिक ध्वनिविज्ञान (underwater acoustics) का प्रयोग विश्व युद्धों के दौरान किया गया। वर्तमान में ’अल्ट्रासोनिक आवृत्ति सीमा’ (ultrasonic frequency range) ने चिकित्सा और उद्योग के क्षेत्र में इसके नये-नये प्रयोगों को बढ़ावा दिया है। इलेक्ट्रानिक्स और कम्प्यूटिंग ने इसके अध्ययन को स्पष्टता तथा शुद्धता प्रदान की है। इसके अतिरिक्त अनेक नये-नये यन्त्रों का अविष्कार हुआ है जो इस अध्ययन में मील के पत्थर साबित हुए हैं।

शब्द और पद

-प्रवीण कुमार पाण्डेय
भाषा-प्रौद्योगिकी विभाग
उच्चारण की दृष्टि से भाषा की लघुत्तम इकाई ध्वनि है। ध्वनियों के मेल से शब्द बनते हैं, लेकिन शब्द बनाने के लिऐ इन्हें सार्थक या अर्थ बोधक की क्षमता से युक्त होना चाहिए। ध्वनि सार्थक ही हो यह जरूरी नहीं है, जैसे- अ,क,प,त इत्यादि। ये ध्वनियां हैं, लेकिन सार्थक नहीं है। किन्तु कल, कब, चल आदि ये शब्द हैं क्योंकि इनमें सार्थकता है अर्थात् अर्थ देने की क्षमता है और ऐसे शब्द भाषा की सार्थक इकाई हैं। व्यवहारिक दृष्टि से भी अर्थ के स्तर पर भाषा की लघुत्तम सार्थक इकाई को भी शब्द कहते हैं, जो कोश मे मिलता है। इस प्रकार हम कह सकते हैं कि सार्थक स्वतंत्र ध्वनि समूहों को शब्द कहा जाता है। किन्तु सार्थक होने पर भी शब्द को वाक्य में ज्यों का त्यों प्रयोग नहीं कर सकते हैं। प्रयोग को उपयुक्त बनाने के लिये शब्दों में कुछ व्याकरणिक परिवर्तन करना पड़ता है जैसे- शब्दों में विभक्ति चिह्न (ने,को,से इत्यादि) लगाने पड़ते हैं। विभक्ति का अर्थ है- विभाजन अर्थात् जिससे शब्द के अर्थ का विभाजन हो सके और यह मालूम हो जाए कि शब्द से कौन-सा अर्थ निकल रहा है जैसे- वह घर आना। इससे यह स्पष्ट नहीं हो रहा है कि वक्ता क्या कहना चाहता है ? अपने घर में या किसी और के घर में ? वह कौन सा लिंग हैं ? और यह किस वचन में है ? इस प्रकार शब्द से परिचित होने पर भी हमें उसका अर्थ स्पष्ट नहीं हो पाया । इसका कारण यह है कि शब्द में विभक्ति चिह्न नहीं लगा है। लेकिन इसमें विभक्ति चिह्न लग जाने पर अर्थ स्पष्ट हो जाएगा। जैसे- वह घर से आया/आयी / वह घर में आया/आयी ।
इस प्रकार इन तीन शब्द से कई अर्थ बन सकते हैं और जब शब्द में विभक्ति चिह्न लगाते हैं, तो वह वाक्य में प्रयुक्त होने योग्य हो जाता है। उसे ही ’पद’ कहते हैं। इसका तात्पर्य यह है कि शब्द दो प्रकार के होते हैं- विभक्ति चिह्न रहित और विभक्ति चिह्न युक्त । विभक्ति चिह्न रहित शब्द ‘शब्द’ कहलाते हैं तथा विभक्ति चिन्ह युक्त शब्द ‘पद’ होते हैं अर्थात् बिना पद के वाक्य नहीं बन सकते। संस्कृत व्याकरण में भी कहा गया है कि ‘अपदं न प्रयुंजीत’। अर्थात् पद बनाये बिना शब्द का प्रयोग नहीं करना चाहिए। यहाँ ‘शब्द का प्रयोग’ का मतलब वाक्य में प्रयोग से है। अष्टाध्यायी में पाणिनी ने पद को ‘सुप्ति‘ङन्तं पदं’ कहा है अर्थात् सुप और तिङ प्रत्ययों से युक्त शब्द को पद कहते हैं। इसमें सुप प्रत्यय नाम के साथ लगता है और तिङ आख्यात के साथ लगता है। नाम संज्ञा, सर्वनाम, तथा विशेषण को कहते हैं और आख्यात क्रिया को कहते हैं।
इस प्रकार हम देखतें है कि शब्द और पद को अलग करने वाला तत्व विभक्ति चिह्न ही है जो वाक्य में अहम भूमिका निभाता है।