Mumbai University News Saam Digital
मुंबई/पुणे

Mumbai University : मुंबई विद्यापीठात मराठी भाषेचा कॉर्पस विकसीत, काय आहे कॉपर्स? कसा होतो उपयोग? जाणून घ्या

Mumbai University News : मुंबई विद्यापीठातील उपयोजित मानसशास्त्र विभागाने मराठी भाषेचे कॉर्पस विकसित केले आहे. मराठी भाषा गौरव दिनाचे औचित्य साधून हे कॉर्पस प्रदर्शित करण्यात आले आहे.

Sandeep Gawade

Mumbai University

मुंबई विद्यापीठातील उपयोजित मानसशास्त्र विभागाने मराठी भाषेचे कॉर्पस विकसित केले आहे. मराठी भाषा गौरव दिनाचे औचित्य साधून हे कॉर्पस प्रदर्शित करण्यात आले आहे. विभागातील प्रा. डॉ. विवेक बेल्हेकर आणि त्यांच्या संशोधक चमूने संस्कृती, भाषा आणि व्यक्तिमत्त्व या विषयावर संशोधन करून हा कॉर्पस विकसित केला आहे. कॉर्पस म्हणजे एखाद्या विषयाच्या लिखाणातील जवळपास सर्व शब्दांचा संग्रह, शब्द मोजणी कॉर्पसमध्ये प्रत्येक शब्द किती वेळा वापरला आहे, याची माहिती असते.

मुंबई विद्यापीठात विकसित केलेल्या मराठी भाषेच्या कॉर्पसमध्ये प्रत्येक शब्दाचा वापर प्रत्येक दशकात किती वेळा होतो याची माहिती आहे. यासाठीचे ॲप्लिकेशन डॉ. विवेक बेल्हेकर आणि राधिका भार्गव यांनी विकसित केले असून त्यातून उपलब्ध शब्दांची माहिती आलेखाच्या स्वरूपात प्राप्त होते. भारतात भाषांची मोठी विविधता आहे. मराठी ही देशातील सर्वाधिक बोलल्या जाणाऱ्या भाषांपैकी आहे. मराठी भाषेचे ८३ दशलक्षहून अधिक भाषिक आहेत. विभागामार्फत करण्यात येत असलेल्या या विविध भारतीय भाषांमध्ये, बोलीभाषेतील व्यक्तिमत्त्व दर्शवणाऱ्या शब्दांचा वापर करून मानसशास्त्रीय घटकांच्या रचनेचा अभ्यास केला जातो.

हा अभ्यास मनो-भाषिक दृष्टिकोन म्हणून ओळखला जातो. या संशोधनासाठी एखाद्या भाषेतील कोणते शब्द किती वेळा वापरले जातात, याची माहिती महत्त्वाची असते. गुगल एन-ग्रामने ही माहिती अनेक भाषांसाठी उपलब्ध करून दिली असली तरी त्यात भारतीय भाषांचा समावेश नाही. त्यामुळे मराठी आणि हिंदीच्या मानस-भाषिक अभ्यासासाठी डॉ. विवेक बेल्हेकर आणि त्यांच्या पीएचडीच्या विद्यार्थिनी राधिका भार्गव यांनी मराठी आणि हिंदी कॉर्पस विकसित केला आहे.

एल्साव्हीअरच्या ‘अप्लाईड कॉर्पस लिंग्विस्टिक्स’ या जर्नलमध्ये मराठी आणि हिंदी भाषेसाठी कॉर्पसचा शोधनिबंध नुकताच प्रसिद्ध झाला असून यातून तयार झालेला कॉर्पस हा संशोधकांच्या वापरासाठी खुला करून देण्यात आला आहे. या कामाचा वापर भाषाशास्त्र, सामाजिक शास्त्रे, मजकूर खणन (टेक्स्ट मायनिंग), यंत्र-शिक्षण इत्यादी विविध क्षेत्रांतील संशोधक करू शकतात. या संदर्भातील अधिक काम मुंबई विद्यापीठाच्या उपयोजित मानसशास्त्र विभागात सुरू असून लवकरच अधिक उपयोगी भाषिक विश्लेषणाची साधने संशोधक आणि सर्वसामान्यांना उपलब्ध करून दिली जाणार आहेत.

- डॉ. विवेक बेल्हेकर, भाषा संशोधक

वेबॲपवर माहिती उपलब्ध

भाषा आणि संस्कृतीबद्दल संशोधन प्रश्‍नांची उत्तरे देण्यासाठी याद्वारे डेटा सेट उपलब्ध झाला आहे. डेटा सेट हा ओएसएफ या खुल्या डेटा रिपॉजिटरीवर उपलब्ध करून देण्यात आला आहे. (लिंक https://osf.io/vd3xz/). वापरकर्त्यांसाठी इंडियन लँग्वेजेस वर्ड कॉर्पस (आयएलडब्ल्यूसी) नावाचे वेबॲप विकसित करण्यात आले असून https://indianlangwordcorp.shinyapps.io/ILWC/ या लिंकवर वेबॲप उपलब्ध आहे. या ॲपमध्ये जर एखादा शब्द मिळाला नाही तर ते नोंदवण्याची सोयसुद्धा उपलब्ध करून देण्यात आली आहे.

सकाळ+चे सदस्य व्हा

शॉपिंगसाठी 'सकाळ प्राईम डील्स'च्या भन्नाट ऑफर्स पाहण्यासाठी क्लिक करा.

Read Marathi news and watch Live TV. Breaking news from Maharashtra, India, Pune, Mumbai, Politics, Entertainment, Sports, Lifestyle at SaamTV. Get Live Marathi news on Mobile. Download the Saam Tv app for Android and IOS.

Vasai-Virar Politics: वसई-विरारचा 'गड' राखण्यासाठी ठाकूर-गावडे युती, भाजपच्या 'चक्रव्यूह' भेदणार का?

Firing In America: अमेरिकेतील मिसिसिपीमध्ये अंदाधुंद गोळीबार; ६ जणांचा मृत्यू

उद्धव ठाकरेंना मोठा धक्का; माजी आमदार शिंदेसेनेत प्रवेश करणार

Maharashtra Live News Update: पालघर जिल्ह्यात पुन्हा भूकंपाचे सौम्य धक्के

Maharashtra Politics: राजकीय मंचावर ताई-दादा एकत्र; निवडणुकीनंतरही दोन्ही राष्ट्रवादी एकत्र राहणार?

SCROLL FOR NEXT