Корпусна лінгвістика та аналіз тексту 2024
Тип: На вибір студента
Кафедра: загального мовознавства
Навчальний план
Семестр | Кредити | Звітність |
2 | 4 | Залік |
Лекції
Семестр | К-сть годин | Лектор | Група(и) |
2 | 16 | доцент БУК Соломія | ФЛл-11м |
Практичні
Семестр | К-сть годин | Група | Викладач(і) |
2 | 32 | ФЛл-11м | доцент БУК Соломія |
Опис курсу
Упродовж курсу розглянемо корпусну лінгвістику як інноваційний інформаційно-семіотичний напрям сучасного мовознавства, навчимося користуватися корпусами української та інших мов, застосовувати їхні результати в різних напрямках мовознавства і для аналізу тексту, а також створювати власні корпуси текстів.
Базуючись на використанні величезних масивів емпіричного матеріалу та залученні комп’ютерних технологій для отримання об’єктивних висновків про функціонування мовних одиниць, електронні корпуси текстів швидко перетворилися на неоціненний лінгвістичний ресурс. Саме корпуси текстів стали незамінним інструментом в руках сучасних фахівців текстотворення й лінгвістичної експертизи, фольклористів, дослідників української мови та її викладачів.
Мета вивчення дисципліни – сформувати у студентів-магістрантів знання про теоретичні і практичні можливості застосування корпусів для сучасної гуманітаристики, зокрема для текстотворення й лінгвістичної експертизи, фольклористики, дослідження української мови загалом.
Рекомендована література
- Дарчук Н. Корпусна лінгвістика: проблеми, методи, перспективи. Навчальна програма. Київ: Київський національний університет ім. Тараса Шевченка, 2013.
- Демська-Кульчицька О. Текстовий корпус: ідея іншої форми. Київ : НаУКМА, 2011.
- Жуковська В. В. Вступ до корпусної лінгвістики: навчальний посібник. Житомир: Вид-во ЖДУ ім. І. Франка, 2013.
- Прикладна лінгвістика: навчальний посібник/ МОН України, Уманський держ. пед. ун.-т. імені Павла Тичини/ упорядник: Н. А. Цимбал. Умань: Візаві, 2019.
- Селіванова О.О. Корпусна лінгвістика // Сучасна лінгвістика: напрями та проблеми: підручник. Полтава: Довкілля-К, 2008.
- М. Шведова, Р. фон Вальденфельс. Регіональна розмітка в ГРАКу, великому референтному корпусі української мови: питання і проблеми [Regional Annotation within GRAC, a Large Reference Corpus of Ukrainian: Issues and Challenges]. CEUR Workshop Proceedings. Proceedings of the 5th International Conference on Computational Linguistics and Intelligent Systems (COLINS 2021). Volume I: Main Conference. Kharkiv, Ukraine, April 22-23, 2021.
- Широков та ін. 2018: Лінгвістично-інформаційні студії : праці Українського мовно-інформаційного фонду НАН України : у 5 т. / Широков В. А., Бугаков О. В., Заїка Н. М., Грязнухіна Т. О., Кригін М. О., Надутенко М. В., Рабулець О. Г., Сидорчук Н. М., Терещенко Л. О., Шевченко І. В., Шипнівська О. О., Ющенко С. С., Якименко К. М. Т. 4 : Корпусна та когнітивна лінгвістика. Київ. Український мовно-інформаційний фонд НАН України, 2018.
Додаткова література
- Демська-Кульчицька О. Основи національного корпусу української мови. Київ : Інститут української мови НАНУ, 2005.
- Бук С. Н. Ідіолект письменника крізь призму корпусно-лексикографічного моделювання: велика проза І. Франка // Лексикографічна парадигма ХХІ ст.: теорія і методологія. До 100-ліття від дня народження Леоніда Сидоровича Паламарчука: монографія. Київ : Інститут української мови НАН України, 2023. С. 56–72.
- Бук С. Архітектура польсько-українського та українсько-польського паралельного корпусу автоперекладів Івана Франка // Slavia Orientalis. 2012. T. LXI. N 2.
- Бук С. Велика проза Івана Франка: електронний корпус, частотні словники та інші міждисциплінарні контексти : монографія / Львів : ЛНУ імені Івана Франка, 2021.
- Бук С. Учнівські корпуси в методиці викладання іноземної мови // Теорія і практика викладання української мови як іноземної. Львів : ЛНУ імені Івана Франка, 2007. Вип. 2.
- Lahjouji-Seppälä, M. – Rabus, A. – von Waldenfels, R. Ukrainian standard variants in the 20th century: stylometry to the rescue [on-line] <https://www.researchgate.net/publication/364332887_Ukrainian_standard_variants_in_the_20th_century_stylometry_to_the_rescue?fbclid=IwAR3bNDrrWLNUXtyPF0SZ5dlD_NZaFYfVXCACULYtMOhjtr5vqse2TY48u5c>
- Paquot M. & Gries S. T. A practical handbook of corpus linguistics. Berlin: Springer. 2020.
- Praktyczny przewodnik po korpusach języków słowiańskich. Red. Milena Hebal-Jezierska. Warszawa: Zakład Grad graficzny Uniwersytetu Warszawskiego, 2014.<http://slawistyka.uw.edu.pl/pl/2014/11/05/praktyczny-przewodnik-po-korpusach-jezykow-slowianskich-red-nauk-m-hebal-jezierska/>
- Sinclair J. EAGLES Preliminary recommendations on Corpus Typology. <www.ilc.cnr.it/EAGLES/ pub/eagles/corpora/corpustyp.ps.gz>
- Viana V., & O’boyle A. Corpus linguistics for English for Academic Purposes. New York: Routledge. 2022.
- Zufferey S. Introduction to corpus linguistics. New Jersey: John Wiley & Sons. 2020.
Перелік деяких корпусів та інших електронних ресурсів:
-
- ГРАК: Генеральний регіонально анотований корпус української мови (ГРАК), 2017–2024 <uacorpus.org>.
- Український національний лінгвістичний корпус. Український мовоно-інформаційний фонд <ulif.org.ua>
- КУМ (Чтиво) = Корпус української мови <org.ua>
- Лабораторія української. Паралельні корпуси <https://mova.institute/%D0%BF%D0%B0%D1%80%D0%B0%D0%BB%D0%B5%D0%BB%D1%8C%D0%BD%D1%96_%D0%BA%D0%BE%D1%80%D0%BF%D1%83%D1%81%D0%B8>
- Корпус української мови Лепцизького університету / Corpus of Ukrainian by the University of Leipzig <https://corpora.uni-leipzig.de/en?corpusId=ukr_mixed_2014&fbclid=IwAR2n7pHaHOoOxkOQHaJsIkN9ynXCB6-dq6uQn_5eEKQ7l9h6YCxZQwh5ix8>
- Корпуси української мови на SketchEngine <https://www.sketchengine.eu/corpora-and-languages/ukrainian-text-corpora/>
- Інструменти роботи зі системою SketchEngine (user guide) <https://www.sketchengine.eu/guide/>
- Національний корпус кримськотатарської мови / National Corpus of the Crimean Tatar Language <https://ctcorpus.org/index.php/en/>
- Skovoroda Online Concordance / Онлайн конкорданс Сковороди <http://www.arts.ualberta.ca/~ukr/skovoroda/NEW/index.php>
- Бук С., Ровенчак А. Онлайн-конкорданс роману Івана Франка «Перехресні стежки» <http://ktf.franko.lviv.ua/users/andrij/science/Franko/concordance.html>
- Паралельний німецько-український та українсько- німецько корпус (М. Шведова, А. Лукашевський) <https://uacorpus.org/Kyiv/en/pararook>
- British National Corpus <http://www.natcorp.ox.ac.uk>.
- Český národní korpus <http://ucnk.ff.cuni.cz>
- Korpus Języka Polskiego IPI PAN <http://korpus.pl/index.php?page=welcome>
- Korpus Języka Polskiego Wydawnictwa Naukowego PWN <https://sjp.pwn.pl/korpus>
- PAWUK = Polish Automatic Web corpus of UKrainian language / Польський автоматичний вебкорпус української мови <https://pawuk.ipipan.waw.pl/overview>
- PolUKR = polsko-ukraiński korpus równolegly / польсько-український паралельний корпус <http://www.domeczek.pl/~polukr/index.php?option=welcome>
- Korpusomat <https://korpusomat.eu/>
- Laurence A. AntConc (Windows, MacOS, Linux). Build 4.1.4 <https://www.laurenceanthony.net/software/antconc/releases/AntConc414/help.pdf>
- The JRC-Acquis Multilingual Parallel Corpus / Корпус законодавства Європейського Союзу: Acquis Communautaire, що містить 231 мовну пару https://web.archive.org/web/20060619034515/http://langtech.jrc.it/JRC-Acquis.html
- Von Waldenfels, Ruprecht and Meyer, Roland (2006-2024): ParaSol, a Corpus of Slavic and Other Languages <https://www.parasolcorpus.org/Ursynow/>