Mumbai University News Saam Digital
मुंबई/पुणे

Mumbai University : मुंबई विद्यापीठात मराठी भाषेचा कॉर्पस विकसीत, काय आहे कॉपर्स? कसा होतो उपयोग? जाणून घ्या

Mumbai University News : मुंबई विद्यापीठातील उपयोजित मानसशास्त्र विभागाने मराठी भाषेचे कॉर्पस विकसित केले आहे. मराठी भाषा गौरव दिनाचे औचित्य साधून हे कॉर्पस प्रदर्शित करण्यात आले आहे.

Sandeep Gawade

Mumbai University

मुंबई विद्यापीठातील उपयोजित मानसशास्त्र विभागाने मराठी भाषेचे कॉर्पस विकसित केले आहे. मराठी भाषा गौरव दिनाचे औचित्य साधून हे कॉर्पस प्रदर्शित करण्यात आले आहे. विभागातील प्रा. डॉ. विवेक बेल्हेकर आणि त्यांच्या संशोधक चमूने संस्कृती, भाषा आणि व्यक्तिमत्त्व या विषयावर संशोधन करून हा कॉर्पस विकसित केला आहे. कॉर्पस म्हणजे एखाद्या विषयाच्या लिखाणातील जवळपास सर्व शब्दांचा संग्रह, शब्द मोजणी कॉर्पसमध्ये प्रत्येक शब्द किती वेळा वापरला आहे, याची माहिती असते.

मुंबई विद्यापीठात विकसित केलेल्या मराठी भाषेच्या कॉर्पसमध्ये प्रत्येक शब्दाचा वापर प्रत्येक दशकात किती वेळा होतो याची माहिती आहे. यासाठीचे ॲप्लिकेशन डॉ. विवेक बेल्हेकर आणि राधिका भार्गव यांनी विकसित केले असून त्यातून उपलब्ध शब्दांची माहिती आलेखाच्या स्वरूपात प्राप्त होते. भारतात भाषांची मोठी विविधता आहे. मराठी ही देशातील सर्वाधिक बोलल्या जाणाऱ्या भाषांपैकी आहे. मराठी भाषेचे ८३ दशलक्षहून अधिक भाषिक आहेत. विभागामार्फत करण्यात येत असलेल्या या विविध भारतीय भाषांमध्ये, बोलीभाषेतील व्यक्तिमत्त्व दर्शवणाऱ्या शब्दांचा वापर करून मानसशास्त्रीय घटकांच्या रचनेचा अभ्यास केला जातो.

हा अभ्यास मनो-भाषिक दृष्टिकोन म्हणून ओळखला जातो. या संशोधनासाठी एखाद्या भाषेतील कोणते शब्द किती वेळा वापरले जातात, याची माहिती महत्त्वाची असते. गुगल एन-ग्रामने ही माहिती अनेक भाषांसाठी उपलब्ध करून दिली असली तरी त्यात भारतीय भाषांचा समावेश नाही. त्यामुळे मराठी आणि हिंदीच्या मानस-भाषिक अभ्यासासाठी डॉ. विवेक बेल्हेकर आणि त्यांच्या पीएचडीच्या विद्यार्थिनी राधिका भार्गव यांनी मराठी आणि हिंदी कॉर्पस विकसित केला आहे.

एल्साव्हीअरच्या ‘अप्लाईड कॉर्पस लिंग्विस्टिक्स’ या जर्नलमध्ये मराठी आणि हिंदी भाषेसाठी कॉर्पसचा शोधनिबंध नुकताच प्रसिद्ध झाला असून यातून तयार झालेला कॉर्पस हा संशोधकांच्या वापरासाठी खुला करून देण्यात आला आहे. या कामाचा वापर भाषाशास्त्र, सामाजिक शास्त्रे, मजकूर खणन (टेक्स्ट मायनिंग), यंत्र-शिक्षण इत्यादी विविध क्षेत्रांतील संशोधक करू शकतात. या संदर्भातील अधिक काम मुंबई विद्यापीठाच्या उपयोजित मानसशास्त्र विभागात सुरू असून लवकरच अधिक उपयोगी भाषिक विश्लेषणाची साधने संशोधक आणि सर्वसामान्यांना उपलब्ध करून दिली जाणार आहेत.

- डॉ. विवेक बेल्हेकर, भाषा संशोधक

वेबॲपवर माहिती उपलब्ध

भाषा आणि संस्कृतीबद्दल संशोधन प्रश्‍नांची उत्तरे देण्यासाठी याद्वारे डेटा सेट उपलब्ध झाला आहे. डेटा सेट हा ओएसएफ या खुल्या डेटा रिपॉजिटरीवर उपलब्ध करून देण्यात आला आहे. (लिंक https://osf.io/vd3xz/). वापरकर्त्यांसाठी इंडियन लँग्वेजेस वर्ड कॉर्पस (आयएलडब्ल्यूसी) नावाचे वेबॲप विकसित करण्यात आले असून https://indianlangwordcorp.shinyapps.io/ILWC/ या लिंकवर वेबॲप उपलब्ध आहे. या ॲपमध्ये जर एखादा शब्द मिळाला नाही तर ते नोंदवण्याची सोयसुद्धा उपलब्ध करून देण्यात आली आहे.

सकाळ+चे सदस्य व्हा

शॉपिंगसाठी 'सकाळ प्राईम डील्स'च्या भन्नाट ऑफर्स पाहण्यासाठी क्लिक करा.

Read Marathi news and watch Live TV. Breaking news from Maharashtra, India, Pune, Mumbai, Politics, Entertainment, Sports, Lifestyle at SaamTV. Get Live Marathi news on Mobile. Download the Saam Tv app for Android and IOS.

Ambarnath Crime : अंबरनाथमधील हल्ला प्रकरणात धक्कादायक खुलासा; सहा तरुणांविरोधात गुन्हा दाखल

Politics : 'ED-CBIची चौकशी थांबवा; आम्ही भाजपमध्ये येतो...' बड्या खासदाराचा खळबळजनक दावा

Crime: 'एका रात्रीत तीन वेळा...', घरी बोलावून घेतलं, खासदाराकडून २ तरुणांवर बलात्कार

Cyber Crime: बॅंकिग फ्रॉड टाळण्यासाठी 'या' टिप्स करा फॉलो

Ind Vs Eng 4th Test : मँचेस्टरमध्ये इंग्लंडचा रडीचा डाव? कसोटी जिंकण्यासाठी बॉल टॅम्परिंग? पाहा Viral Video

SCROLL FOR NEXT