Виробнича практика з комп’ютерної та корпусної лінгвістики 2024 (оновлення)
Тип: Нормативний
Кафедра: загального мовознавства
Навчальний план
| Семестр | Кредити | Звітність |
| 3 | 3 | Диференційований залік |
Практичні
| Семестр | К-сть годин | Група | Викладач(і) |
| 3 | ФЛл-21м | професор МАЦЮК Галина Петрівна |
Опис курсу
Мета практики: закріплення теоретичних знань і набуття практичних навичок у використанні інформаційних технологій для створення корпусу наукових текстів для теоретичного розділу магістерського дослідження, аналізу лінгвістичних даних корпусу щодо частотності термінів, роботи зі словниковими статтями і створення словника найчастотніших термінів аналізу матеріалу магістерського дослідження.
Основні завдання практики:
1. Підготувати і провести дискусію на тему: «Комп’ютерна лексикографія як напрям сучасної комп’ютерної лінгвістики: можливості, стан і перспективи розвитку» (на матеріалі Інтегрованої лексикографічної системи «Словники України» та порталу «Mova.info: про українську мову, лінгвістику і не тільки»).
2. Виокремити 20 наукових статей з теоретичного розділу магістерського дослідження для створення текстового корпусу.
3. Здійснити нормалізацію текстів: видалити зайві символи (пробіли, коди, знаки форматування); адаптувати форматування для сумісності з програмним забезпеченням Sketch Engine і/або іншим використаним програмним забезпеченням.
4. Завантажити нормалізовані статті в середовище Sketch Engine, створивши корпус із можливістю лінгвістичного аналізу. Перевірити роботу інструментів для пошуку ключових слів, частоти вживання та контекстного аналізу.
5. Створити словникові статті. Для цього вибрати найчастотніші 10 термінів із корпусу і укласти щодо них словникові статті за схемою: термін, визначення, приклади вживання.
6. Переглянути відеоінструкцію щодо використання капсули Е-devel, що допомагає зрозуміти основні функції платформи та способи роботи з нею.
7. Занести інформацію про себе до капсули Е-devel, увійшовши до системи капсули та додавши профільну інформацію (розповідь про себе; спеціалізацію; наукові публікації; нагороди, сертифікати).
8. Занести інформацію про роботу з корпусом.
9. Занести інформацію про словник, вказавши мету (пояснення ключових термінів); специфіку використання (для науковців, студентів, викладачів тощо); критерії вибору термінів (релевантність і частотність). До капсули додати звіт про роботу з корпусом: опис методики, основні функції, інструменти аналізу.
10. У разі потреби та зацікавленості студентів вивченням додаткового програмного забезпечення можливі додаткові індивідуальні завдання для практикантів, які включають: визначення середньої довжини слів і речень текстів деякою мовою; вивчення словника текстів і порівняння їхніх параметрів Type-Token Ratio; фонетичний і силабічний аналіз текстів однією із східнослов’янських мов; визначення консонантного коефіцієнта; професійну роботу з базами лінгвістичних даних різних типів; побудова запитів з урахуванням лінгвістичних завдань; визначення та порівняння семантичного навантаження різних текстів корпусу; встановлення подібності текстів і наявності плагіату; роботу з програмним пакетом Grammarly із елементами штучного інтелекту для комп’ютерного редагування, машинного перекладу та перевірки текстів на плагіат.
11. У разі технічної можливості: проаналізувати текстовий корпус, використовуючи моделі «торба слів» (Bag of Words), TF-IDF, та отримати векторизації термінів за допомогою Word2Vec. Застосувати базові можливості великих мовних моделей (Large Language Models, LLMs) за допомогою фреймворку LangChain для виконання простих завдань, таких як генерація тексту або класифікація, на основі матеріалів корпусу.
Рекомендована література
1.Бойко М. І. Українська комп’ютерна лексикографія: суспільні запити, проблеми та перспективи // Науковий вісник Міжнародного гуманітарного університету . Серія «Філологія». 2022. №56. С.12-15. http://www.vestnik- philology.mgu.od.ua/archive/v56/3.pdf
2.Ваховська О. В. Основи комп’ютерної лінгвістики: Навчально-методичний посібник. К.: Видавничий центр КНЛУ, 2023. 112 с
3.Волошин В. Г. Комп’ютерна лінгвістика. Суми : Університетська книга, 2004. 382 с.
4.Демська-Кульчицька О. Корпусна рецепція тексту // Наукові записки НаУКМА. Сер. Філологічні науки. 2010. Т. 111. С. 3–7.
5.Демська-Кульчицька О. Базові поняття корпусної лінгвістики // Українська мова. 2003. №1. С. 42–47.
6.Жуковська В. В. Вступ до корпусної лінгвістики: навчальний посібник / Житомир: Вид-во ЖДУ ім. І. Франка, 2013.
7.Калимон Ю. Комп’ютерна лексикографія: виклики та перспективи // Актуальні питання іноземної філології. 2019. № 10. С. 112–118.
8.Карпіловська Є.А. Вступ до прикладної лінгвістики: комп’ютерна лінгвістика: Підручник. Донецьк: ТОВ «Юго-Восток, Лтд», 2006. 188 с.
9.Кульчицький І. Унормування тексту під час докорпусного опрацювання: досвід застосування // Вісник Національного університету «Львівська політехніка». Серія: Інформаційні системи та мережі. 2020. Т. 7. С. 51–58.
10.Купріянов Є. Комп’ютерна лексикографія як проблема сучасного мовознавства. 2008. URL: http://repository.kpi.kharkov.ua/ bitstream/KhPI-Press/2480/1/2008_Kupriyanov_Kompiuterna%20 leksykohrafiia.pdf
11.Кушнір О. С. Основи комп’ютерної лінгвістики (конспект лекцій). Львів: Видавн. Львів. ун-ту, 2023. 292 с.
12.Лінгвістично-інформаційні студії : праці Українського мовно-інформаційного фонду НАН України : у 5 т. / В. А. Широков та ін. Т. 4 : Корпусна та когнітивна лінгвістика. Київ. Український мовно-інформаційний фонд НАН України. 2018. 246 с. https://ulif.mon.gov.ua/system/files/ling_inf_studio_tom_4_umif_b5.pdf
13.Надутенко Маргарита, Надутенко Максим, Семеног Олена. Застосування цифрового методу у викладанні філологічних дисциплін (на прикладі віртуальної лексикографічної лабораторії) // Волинь філологічна: текст і контекст. Вип. 34: Філологія та цифрові технології / упоряд. Т. Левчук. Луцьк: Волин. нац. ун-т ім. Лесі Українки, 2022. С. 7–26.
14.Надутенко М. В. Загальний огляд та перспективи використання національних лінгвістичних цифрових ресурсів Українського мовно-інформаційного фонду НАН України // Проблеми загального та порівняльно-історичного мовознавства : тези доповідей міжнародної наукової конференції на пошану пам’яті професора В. В. Лучика, 3 березня 2020 р. / [орг. комітет: Куранова С. І., Лучик А. А. та ін.] ; Національний університет «Києво-Могилянська академія», кафедра загального і слов’янського мовознавства. Київ : НаУКМА, 2020. С. 91–95.
15.Сидоренко О. Українська комп’ютерна лексикографія як важливий інноваційний чинник навчального процесу // Актуальні проблеми слов’янської філології. 2010. Випуск XXІІІ. Частина 1. С. 524–528.
16.Широков В. Комп’ютерна лексикографія : монографія. К. : Наук. думка, 2011. 351 с.
17.Широков В.А., Бугаков О. В., Грязнухіна та ін. Корпусна лінгвістика. К. : Довіра, 2005.
18.Широков В. А., Надутенко М. В., Стрижак О. Є., Ющенко С. С. Технологічні засади логіко-лінгвістичних досліджень законодавства // Науково-технічний журнал «Біоніка інтелекту». 2020. Т. 2, № 95. С. 3–14.
19.Широков В. А., Ющенко С. С. Лінгво-експертна діяльність Українського мовно-інформаційного фонду: теорія, методологія, практика, інструменти // Українська мова в юриспруденції: стан, проблеми, перспективи [Текст] : матеріали ХVІІІ Всеукр. наук.-практ. конф. (Київ, 17.10.2022 р.) / [редкол.: В. В. Чернєй, С. Д. Гусарєв, С. С. Чернявський та ін.]. Київ : Нац. акад. внутр. справ, 2022. С. 69–74.