मुंबई विद्यापीठातील उपयोजित मानसशास्त्र विभागाने मराठी भाषेचे कॉर्पस विकसित केले आहे. मराठी भाषा गौरव दिनाचे औचित्य साधून हे कॉर्पस प्रदर्शित करण्यात आले आहे. विभागातील प्रा. डॉ. विवेक बेल्हेकर आणि त्यांच्या संशोधक चमूने संस्कृती, भाषा आणि व्यक्तिमत्त्व या विषयावर संशोधन करून हा कॉर्पस विकसित केला आहे. कॉर्पस म्हणजे एखाद्या विषयाच्या लिखाणातील जवळपास सर्व शब्दांचा संग्रह, शब्द मोजणी कॉर्पसमध्ये प्रत्येक शब्द किती वेळा वापरला आहे, याची माहिती असते.
मुंबई विद्यापीठात विकसित केलेल्या मराठी भाषेच्या कॉर्पसमध्ये प्रत्येक शब्दाचा वापर प्रत्येक दशकात किती वेळा होतो याची माहिती आहे. यासाठीचे ॲप्लिकेशन डॉ. विवेक बेल्हेकर आणि राधिका भार्गव यांनी विकसित केले असून त्यातून उपलब्ध शब्दांची माहिती आलेखाच्या स्वरूपात प्राप्त होते. भारतात भाषांची मोठी विविधता आहे. मराठी ही देशातील सर्वाधिक बोलल्या जाणाऱ्या भाषांपैकी आहे. मराठी भाषेचे ८३ दशलक्षहून अधिक भाषिक आहेत. विभागामार्फत करण्यात येत असलेल्या या विविध भारतीय भाषांमध्ये, बोलीभाषेतील व्यक्तिमत्त्व दर्शवणाऱ्या शब्दांचा वापर करून मानसशास्त्रीय घटकांच्या रचनेचा अभ्यास केला जातो.
हा अभ्यास मनो-भाषिक दृष्टिकोन म्हणून ओळखला जातो. या संशोधनासाठी एखाद्या भाषेतील कोणते शब्द किती वेळा वापरले जातात, याची माहिती महत्त्वाची असते. गुगल एन-ग्रामने ही माहिती अनेक भाषांसाठी उपलब्ध करून दिली असली तरी त्यात भारतीय भाषांचा समावेश नाही. त्यामुळे मराठी आणि हिंदीच्या मानस-भाषिक अभ्यासासाठी डॉ. विवेक बेल्हेकर आणि त्यांच्या पीएचडीच्या विद्यार्थिनी राधिका भार्गव यांनी मराठी आणि हिंदी कॉर्पस विकसित केला आहे.
एल्साव्हीअरच्या ‘अप्लाईड कॉर्पस लिंग्विस्टिक्स’ या जर्नलमध्ये मराठी आणि हिंदी भाषेसाठी कॉर्पसचा शोधनिबंध नुकताच प्रसिद्ध झाला असून यातून तयार झालेला कॉर्पस हा संशोधकांच्या वापरासाठी खुला करून देण्यात आला आहे. या कामाचा वापर भाषाशास्त्र, सामाजिक शास्त्रे, मजकूर खणन (टेक्स्ट मायनिंग), यंत्र-शिक्षण इत्यादी विविध क्षेत्रांतील संशोधक करू शकतात. या संदर्भातील अधिक काम मुंबई विद्यापीठाच्या उपयोजित मानसशास्त्र विभागात सुरू असून लवकरच अधिक उपयोगी भाषिक विश्लेषणाची साधने संशोधक आणि सर्वसामान्यांना उपलब्ध करून दिली जाणार आहेत.
- डॉ. विवेक बेल्हेकर, भाषा संशोधक
वेबॲपवर माहिती उपलब्ध
भाषा आणि संस्कृतीबद्दल संशोधन प्रश्नांची उत्तरे देण्यासाठी याद्वारे डेटा सेट उपलब्ध झाला आहे. डेटा सेट हा ओएसएफ या खुल्या डेटा रिपॉजिटरीवर उपलब्ध करून देण्यात आला आहे. (लिंक https://osf.io/vd3xz/). वापरकर्त्यांसाठी इंडियन लँग्वेजेस वर्ड कॉर्पस (आयएलडब्ल्यूसी) नावाचे वेबॲप विकसित करण्यात आले असून https://indianlangwordcorp.shinyapps.io/ILWC/ या लिंकवर वेबॲप उपलब्ध आहे. या ॲपमध्ये जर एखादा शब्द मिळाला नाही तर ते नोंदवण्याची सोयसुद्धा उपलब्ध करून देण्यात आली आहे.
सकाळ+चे सदस्य व्हा
Read Marathi news and watch Live TV. Breaking news from Maharashtra, India, Pune, Mumbai, Politics, Entertainment, Sports, Lifestyle at SaamTV. Get Live Marathi news on Mobile. Download the Saam Tv app for Android and IOS.