Марта Луньо : виробнича практика з корпусної лінгвістики як новий підхід до застосування інформаційних технологій у магістерських дослідженнях

19.06.2025 | 08:27

Моя група вперше проходила практику в Українському мовно-інформаційному фонді НАН України. Кожен з нас мав два керівники :  від  інституту з нами працював к.т.н. М. В.  Надутенко,  від кафедри загального мовознавства – проф. Г. П. Мацюк. Практика базувалася на прослуханих  заняттях з корпусної лінгвістики в  курсі «Магістерський семінар», які провела доц. Н. Я.Лотоцька.  У широкому розумінні мета практики полягала у засвоєннні нових навичок роботи з корпусними технологіями, у створенні та наповненні словникової капсули, а також у вдосконалення вмінь аналізу мовного матеріалу, у вузькому – всі види робіт були підпорядковані використанню інформаційних технологій у наших магістерських дослідженнях.

Які завдання мені прийшлося виконувати?  1. На початковому етапі практики я зібрала 20 статей до теоретичного розділу мого магістерського дослідження на тему  «Лінгвістична експертиза соціальних мереж : ідентифікація анонімних маніпулятивних впливів у час гібридних викликів національній безпеці України» ( я використала відкриті онлайн-ресурси, наукові видання та тематичні журнали). 2. Потрібно було нормалізувати текстовий матеріал, тобто  очищистити від зайвих елементів (форматування, дублікатів, нерелевантного контенту). Нормалізація також включала перевірку орфографії та граматики текстів. 3. Зібраний і нормалізований матеріал я завантажила на платформу Sketch Engine і створила текстовий корпус, який став базою для подальшого лексикографічного аналізу. 4. Я вивчила відеоінструкції та текстові матеріали щодо використання капсули КІТ Поліедр, зрозуміла функціонал інструменту та способи його ефективного застосування. 5. У капсулу  додала коротку біографічну інформацію, включаючи свої академічні досягнення та професійні інтереси. 6. Занесла інформацію про словник. Опис словника включав тематику, мету його створення, основні принципи формування словникових статей. 7. На основі корпусу я виокремила 5 термінів, кожен з яких отримав повноцінну словникову статтю, включаючи: дефініцію, приклади вживання, ілюстрації, авторський семантичний коментар. 8. Занесла інформацію про роботу з корпусом,  додала звіт про виконану роботу в корпусі, зокрема про його створення, пошук ключових слів і частотнийаналіз.

Мої самостійно отримані результати такі:

• створено тематичний корпус, що складається з 20 нормалізованих статей;

• освоєно використання інструменту Sketch Engine та капсули КІТ Поліедр;

• розроблено 5 словникових статей;

• отримано практичні навички аналізу корпусних даних і створення  словникових статей.

Підкреслю, що виробнича практика дозволила мені закріпити теоретичні знання та отримати цінний досвід у формуванні корпусів та лексикографічного опису. Вперше в житті  я отримаю сертифікат про авторські права на створені мною тексти!