Корпусна лінгвістика та аналіз тексту

Тип: На вибір студента

Кафедра: загального мовознавства

Навчальний план

СеместрКредитиЗвітність
24Залік

Лекції

СеместрК-сть годинЛекторГрупа(и)
216доцент БУК СоломіяФЛт-11м, ФЛу-11м, ФЛф-11м

Практичні

СеместрК-сть годинГрупаВикладач(і)
232ФЛт-11мдоцент БУК Соломія
ФЛу-11мдоцент БУК Соломія
ФЛф-11мдоцент БУК Соломія

Опис курсу

У сучасних умовах постійного зростання інформаційних потоків проблема автоматичного опрацювання природномовної інформації набуває всі більшого значення. Комп’ютерні технології, прийшовши в лінгвістику, запропонували свої технічні можливості для опрацювання, збереження і відбору мовного матеріалу. Це дало поштовх до зародження та розвитку нової галуззі мовознавчих досліджень: корпусної лінгвістики. Базуючись на використанні величезних масивів емпіричного матеріалу та залученні ІТ-технологій для отримання об’єктивних висновків про функціонування мовних одиниць, лінгвістичні корпуси швидко перетворилися на неоціненний лінгвістичний ресурс.

Впродовж курсу розглянемо корпусну лінгвістику як інноваційний інформаційно-семіотичний напрям сучасного мовознавства, навчимося користуватися корпусами української та інших мов, застосовувати їхні результати в різних напрямках мовознавства і для аналізу тексту, а також створювати власні корпуси текстів.

Рекомендована література

• Дарчук Н. Корпусна лінгвістика: проблеми, методи, перспективи. Навчальна програма. Київ: Київський національний університет ім. Тараса Шевченка, 2013. 10 с.
• Демська-Кульчицька О. Основи національного корпусу української мови. Київ : Інститут української мови НАНУ, 2005. 219 с.
• Демська-Кульчицька 2011: Демська-Кульчицька О. Текстовий корпус: ідея іншої форми. Київ : НаУКМА, 2011. 282 с.
• Жуковська В. В. Вступ до корпусної лінгвістики: навчальний посібник. Житомир: Вид-во ЖДУ ім. І. Франка, 2013. 142 с.
• Прикладна лінгвістика: навчальний посібник/ МОН України, Уманський держ. пед. ун.-т. імені Павла Тичини/ упорядник: Н. А. Цимбал. Умань: Візаві, 2019. 106 с.
• Селіванова О.О. Корпусна лінгвістика // Сучасна лінгвістика: напрями та проблеми: підручник. Полтава: Довкілля-К, 2008. С. 667–669.
• Українська корпусна лінгвістика: сьогодення і перспективи : [інтерв’ю із канд. філолог. наук, доц. каф. укр. мови Нац. ун-ту “Києво-Могилянська академія” Орисьою Мар’янівною Демською] // Дивослово. 2011. № 10. С. 32-34. <https://dyvoslovo.com.ua/wp-content/uploads/2016/03/6-1011.pdf>
• Широков та ін. 2018: Лінгвістично-інформаційні студії : праці Українського мовно-інформаційного фонду НАН України : у 5 т. / Широков В. А., Буга¬ков О. В., Заїка Н. М., Грязнухіна Т. О., Кригін М. О., Надутенко М. В., Рабу¬лець О. Г., Сидорчук Н. М., Терещенко Л. О., Шевченко І. В., Шипнівська О. О., Ющенко С. С., Якименко К. М. Т. 4 : Корпусна та когнітивна лінгвістика. Київ. Український мовно-інформаційний фонд НАН України, 2018. 246 с.
• Бук С. Архітектура польсько-українського та українсько-польського паралельного корпусу автоперекладів Івана Франка // Slavia Orientalis. 2012. T. LXI. N 2. С. 213–230.
• Бук С. Велика проза Івана Франка: електронний корпус, частотні словники та інші міждисциплінарні контексти : монографія / Львів : ЛНУ імені Івана Франка, 2021. 424 с.
• Бук С. Учнівські корпуси в методиці викладання іноземної мови // Теорія і практика викладання української мови як іноземної. Львів : ЛНУ імені Івана Франка, 2007. Вип. 2. С. 19–23.
• Čermák F. New generation corpus-based frequency dictionaries : The case of Czech // International Journal of Corpus Linguistics. 10. 2005. P. 453–467.
• Divjak A., Sharoff S., and Erjavec T. Slavic Corpus and Computational Linguistics // Journal of the Slavic Linguistics Society. 2017. Vol. 25. N 2. P. 171–199.
• Enery T. Mc., Xiao R., and Tono Y. Corpus-based language studies: an advanced resource book. Routledge, London, 2006. 286 p.
• T. McEnery, A. Wilson Corpus Linguistics. An Introduction. 2-nd Edition. Edinburg: University Press, 2001. 235 p.
• Lahjouji-Seppälä, M. – Rabus, A. – von Waldenfels, R. Ukrainian standard variants in the 20th century: stylometry to the rescue [on-line] <https://www.researchgate.net/publication/364332887_Ukrainian_standard_variants_in_the_20th_century_stylometry_to_the_rescue?fbclid=IwAR3bNDrrWLNUXtyPF0SZ5dlD_NZaFYfVXCACULYtMOhjtr5vqse2TY48u5c>
• Paquot M. & Gries S. T. A practical handbook of corpus linguistics. Berlin: Springer. 2020.
• Podstawy językoznawstwa korpusowego / Red. B. Lewandowska-Tomaszczyk. Lódź: Wydawnictwo Uniwersytetu Lódzskiego, 2005. 306 s.
• Praktyczny przewodnik po korpusach języków słowiańskich. Red. Milena Hebal-Jezierska. Warszawa: Zakład Grad graficzny Uniwersytetu Warszawskiego, 2014. 231 s. <http://slawistyka.uw.edu.pl/pl/2014/11/05/praktyczny-przewodnik-po-korpusach-jezykow-slowianskich-red-nauk-m-hebal-jezierska/>
• Sinclair J. EAGLES Preliminary recommendations on Corpus Typology. <www.ilc.cnr.it/EAGLES/ pub/eagles/corpora/corpustyp.ps.gz>
• Viana V., & O’boyle A. Corpus linguistics for English for Academic Purposes. New York: Routledge. 2022.
• Zufferey S. Introduction to corpus linguistics. New Jersey: John Wiley & Sons. 2020.

Перелік деяких корпусів:
• ГРАК 2017–2021: Генеральний регіонально анотований корпус української мови (ГРАК), 2017–2024 .
• Український національний лінгвістичний корпус. Український мовоно-інформаційний фонд
• КУМ (Чтиво) = Корпус української мови
• Лабораторія української. Паралельні корпуси <https://mova.institute/%D0%BF%D0%B0%D1%80%D0%B0%D0%BB%D0%B5%D0%BB%D1%8C%D0%BD%D1%96_%D0%BA%D0%BE%D1%80%D0%BF%D1%83%D1%81%D0%B8>
• Корпусукраїнської мови Лепцизького університету / Corpus of Ukrainian by the University of Leipzig <https://corpora.uni-leipzig.de/en?corpusId=ukr_mixed_2014&fbclid=IwAR2n7pHaHOoOxkOQHaJsIkN9ynXCB6-dq6uQn_5eEKQ7l9h6YCxZQwh5ix8>
• Національний корпус кримсько-татарської мови / National Corpus of the Crimean Tatar Language <https://ctcorpus.org/index.php/en/>
• Skovoroda Online Concordance / Онлайн конкорданс Сковороди <http://www.arts.ualberta.ca/~ukr/skovoroda/ NEW/index.php>
• Дарчук Н. П. Корпус текстів Тараса Шевченка як джерело для мовознавчих досліджень // Science and Education a New Dimension. Philology. V(32). Issue: 122. 2017. С. 33–37.
• Дослідницький корпус Лесі Українки: лінгвістичні параметри // Науковий вісник Волинського національного університету імені Лесі Українки. Філологічні науки. Мовознавство. 2018. № 12. С. 30–36.
• Загнітко А., Данилюк І., Ситар Г. Корпус текстів Юрія Шевельова: структура, функції, навігація // Мова: класичне – модерне – постмодерне. Київ: НУКМА. 2019. Вип. 5. С. 158–169.
• Корпус текстів Богдана Лепкого / Кітаєва Віка (укладач). <http://corpora.donnu.edu.ua/bonito/run.cgi/corp_info?corpname=kitaeva>
• Корпус текстів Михайла Коцюбинського / Бройко Н. (укладач). <http://corpora.donnu.edu.ua/bonito/run.cgi/corp_info?corpname=brojk>
• Бук С., Ровенчак А. Онлайн-конкорданс роману Івана Франка «Перехресні стежки» <http://ktf.franko.lviv.ua/users/andrij/science/Franko/concordance.html>
• British National Corpus <http://www.natcorp.ox.ac.uk>.
• Český národní korpus <http://ucnk.ff.cuni.cz>
• Korpus Języka Polskiego IPI PAN <http://korpus.pl/index.php?page=welcome>
• Korpus Języka Polskiego Wydawnictwa Naukowego PWN <https://sjp.pwn.pl/korpus>
• PAWUK = Polish Automatic Web corpus of UKrainian language / Польський автоматичний вебкорпус української мови <https://pawuk.ipipan.waw.pl/overview>
• PolUKR = polsko-ukraiński korpus równolegly / польсько-український паралельний корпус <http://www.domeczek.pl/~polukr/index.php?option=welcome>
• The JRC-Acquis Multilingual Parallel Corpus / Корпус законодавства Європейського Союзу: Acquis Communautaire, що містить 231 мовну пару https://web.archive.org/web/20060619034515/http://langtech.jrc.it/JRC-Acquis.html
• Von Waldenfels, Ruprecht and Meyer, Roland (2006-2023): ParaSol, a Corpus of Slavic and Other Languages <https://www.parasolcorpus.org/Ursynow/>

 

Силабус:

Завантажити силабус