Mumbai University News Saam Digital
मुंबई/पुणे

Mumbai University : मुंबई विद्यापीठात मराठी भाषेचा कॉर्पस विकसीत, काय आहे कॉपर्स? कसा होतो उपयोग? जाणून घ्या

Mumbai University News : मुंबई विद्यापीठातील उपयोजित मानसशास्त्र विभागाने मराठी भाषेचे कॉर्पस विकसित केले आहे. मराठी भाषा गौरव दिनाचे औचित्य साधून हे कॉर्पस प्रदर्शित करण्यात आले आहे.

Sandeep Gawade

Mumbai University

मुंबई विद्यापीठातील उपयोजित मानसशास्त्र विभागाने मराठी भाषेचे कॉर्पस विकसित केले आहे. मराठी भाषा गौरव दिनाचे औचित्य साधून हे कॉर्पस प्रदर्शित करण्यात आले आहे. विभागातील प्रा. डॉ. विवेक बेल्हेकर आणि त्यांच्या संशोधक चमूने संस्कृती, भाषा आणि व्यक्तिमत्त्व या विषयावर संशोधन करून हा कॉर्पस विकसित केला आहे. कॉर्पस म्हणजे एखाद्या विषयाच्या लिखाणातील जवळपास सर्व शब्दांचा संग्रह, शब्द मोजणी कॉर्पसमध्ये प्रत्येक शब्द किती वेळा वापरला आहे, याची माहिती असते.

मुंबई विद्यापीठात विकसित केलेल्या मराठी भाषेच्या कॉर्पसमध्ये प्रत्येक शब्दाचा वापर प्रत्येक दशकात किती वेळा होतो याची माहिती आहे. यासाठीचे ॲप्लिकेशन डॉ. विवेक बेल्हेकर आणि राधिका भार्गव यांनी विकसित केले असून त्यातून उपलब्ध शब्दांची माहिती आलेखाच्या स्वरूपात प्राप्त होते. भारतात भाषांची मोठी विविधता आहे. मराठी ही देशातील सर्वाधिक बोलल्या जाणाऱ्या भाषांपैकी आहे. मराठी भाषेचे ८३ दशलक्षहून अधिक भाषिक आहेत. विभागामार्फत करण्यात येत असलेल्या या विविध भारतीय भाषांमध्ये, बोलीभाषेतील व्यक्तिमत्त्व दर्शवणाऱ्या शब्दांचा वापर करून मानसशास्त्रीय घटकांच्या रचनेचा अभ्यास केला जातो.

हा अभ्यास मनो-भाषिक दृष्टिकोन म्हणून ओळखला जातो. या संशोधनासाठी एखाद्या भाषेतील कोणते शब्द किती वेळा वापरले जातात, याची माहिती महत्त्वाची असते. गुगल एन-ग्रामने ही माहिती अनेक भाषांसाठी उपलब्ध करून दिली असली तरी त्यात भारतीय भाषांचा समावेश नाही. त्यामुळे मराठी आणि हिंदीच्या मानस-भाषिक अभ्यासासाठी डॉ. विवेक बेल्हेकर आणि त्यांच्या पीएचडीच्या विद्यार्थिनी राधिका भार्गव यांनी मराठी आणि हिंदी कॉर्पस विकसित केला आहे.

एल्साव्हीअरच्या ‘अप्लाईड कॉर्पस लिंग्विस्टिक्स’ या जर्नलमध्ये मराठी आणि हिंदी भाषेसाठी कॉर्पसचा शोधनिबंध नुकताच प्रसिद्ध झाला असून यातून तयार झालेला कॉर्पस हा संशोधकांच्या वापरासाठी खुला करून देण्यात आला आहे. या कामाचा वापर भाषाशास्त्र, सामाजिक शास्त्रे, मजकूर खणन (टेक्स्ट मायनिंग), यंत्र-शिक्षण इत्यादी विविध क्षेत्रांतील संशोधक करू शकतात. या संदर्भातील अधिक काम मुंबई विद्यापीठाच्या उपयोजित मानसशास्त्र विभागात सुरू असून लवकरच अधिक उपयोगी भाषिक विश्लेषणाची साधने संशोधक आणि सर्वसामान्यांना उपलब्ध करून दिली जाणार आहेत.

- डॉ. विवेक बेल्हेकर, भाषा संशोधक

वेबॲपवर माहिती उपलब्ध

भाषा आणि संस्कृतीबद्दल संशोधन प्रश्‍नांची उत्तरे देण्यासाठी याद्वारे डेटा सेट उपलब्ध झाला आहे. डेटा सेट हा ओएसएफ या खुल्या डेटा रिपॉजिटरीवर उपलब्ध करून देण्यात आला आहे. (लिंक https://osf.io/vd3xz/). वापरकर्त्यांसाठी इंडियन लँग्वेजेस वर्ड कॉर्पस (आयएलडब्ल्यूसी) नावाचे वेबॲप विकसित करण्यात आले असून https://indianlangwordcorp.shinyapps.io/ILWC/ या लिंकवर वेबॲप उपलब्ध आहे. या ॲपमध्ये जर एखादा शब्द मिळाला नाही तर ते नोंदवण्याची सोयसुद्धा उपलब्ध करून देण्यात आली आहे.

सकाळ+चे सदस्य व्हा

Read Marathi news and watch Live TV. Breaking news from Maharashtra, India, Pune, Mumbai, Politics, Entertainment, Sports, Lifestyle at SaamTV. Get Live Marathi news on Mobile. Download the Saam Tv app for Android and IOS.

Maharashtra News Live Updates: कार्तिकी यात्रेत विठ्ठल चरणी साडेतीन कोटींचे दान

लठ्ठपणामुळे मधुमेह होतो का? या दोघांमधील संबंध समजून घ्या...

Narayan Rane : महायुती आणि उद्धव ठाकरेंचे किती उमेदवार निवडून येतील? नारायण राणेंनी थेट आकडाच सांगितला

Diljit Dosanjh: दारूबंदी करा मग गाण्यांवर बंदी घाला, दिलजीत दोसांजचं सरकारच्या नोटिशीला उत्तर, काय आहे प्रकरण?

Pitbull And Ieopard Fight: पिटबूल आणि बिबट्यामध्ये थरारक झुंज; दोघे एकमेकांवर पडले भारी, अंगावर काटा आणणारा व्हिडिओ पाहिलात का?

SCROLL FOR NEXT