Квантитативні методи аналізу тексту 2023

Тип: Нормативний

Кафедра: загального мовознавства

Навчальний план

СеместрКредитиЗвітність
33Іспит

Лекції

СеместрК-сть годинЛекторГрупа(и)
316доцент БУК СоломіяФЛл-21м

Практичні

СеместрК-сть годинГрупаВикладач(і)
316ФЛл-21мЧирун  Л.

Опис курсу

Курс покликаний поглибити теоретичні і практичні знання магістрантів зі спеціальності прикладна лінгвістика, сформувати чіткі уявлення про особливості застосування квантитативних методів у гуманітарних науках. Впродовж цього курсу навчимося створювати, користуватися і правильно інтерпретувати частотні словники; знаходити необхідні кількісні характеристики різних стилів і жанрів, письменників і їхніх творів; визначати авторство, прочитність і складність тексту; з’ясуємо, скільки слів потрібно, щоби оволодіти мовою; ознайомимося з основними статистичними інструменти текстових корпусів, програмам Sketch Engine, Stylo, графіками CQL, Word, Excel тощо, сформуємо навички їх використання та візуалізації кількісних текстових даних тощо.

Практичні заняття передбачають використання корпусних та інших цифрових технологій, формат академічної дискусії, командну роботу, соціолінгвістичний експеримент, укладання частотного словника, кількісний аналіз мови і тексту. Курс є важливим в системі освіти сучасного мовознавця, без нього складно уявити висококваліфікованого фахівця-лінгвіста. Він сприяє переосмисленню академічного статусу лінгвістичних дисциплін і їх соціальної функції.

Мета курсу – сформувати у маґістрантів знання щодо застосування основних квантитативних (кількісних) методів у філології: мовознавстві та літературознавстві, лінгвістичній експертизі, стилометрії, криміналістичній, соціо-, когнітивній та історичній лінгвістиці, лінгводидактиці та оволодінні іноземною мовою, етнолінгвістиці, фольклористиці, діалектології, а також у культурології, гендерних дослідженнях тощо.

Завдання курсу: (1) осмислити карколомний кількісний поворот у лінгвістиці: протягом останніх 20 років у світовій лінгвістиці частка кількісно- статистичних методів неухильно зростає, а частка якісного підходу різко зменшується (Kortmann 2021);

(2) дати студентам уявлення про те, як покращити якість своїх досліджень, застосовуючи основні кількісні інструменти, і таким чином зробити молоде покоління більш конкурентоспроможним в міжнародній галузі досліджень;

(3) проаналізувати основні статистичні інструменти текстових корпусів, програм Sketch Engine, Stylo, графіків CQL, Word, Excel тощо та сформувати навички їх використання; навчитися візуалізувати текстові дані;

(4) з’ясувати роль квантитативного опису мови і тексту, а також визначити місце цієї галузі серед цифрових гуманітарних наук;

(5) показати значення основоположних кількісних понять (частота, відносна частота та її порівняння; ключові слова, вимірювання колокацій, багатовимірний аналіз тощо) та їхнє значення в гуманітарних галузях, згаданих вище

У результаті вивчення курсу студент/ка повинен/нна знати:

  • найважливіші поняття і категорійний апарат квантитативної лінгвістики;
  • лексикографічні та електронні джерела знаходження кількісної інформації про мовні одиниці;
  • основні статистичні інструменти текстових корпусів, програм Sketch Engine, Stylo, графіків CQL, Word, Excel тощо;
  • ключові інструменти візуалізації статистичної інформації про текстові дані;
  • частотні словники української мови та їх визначальні характеристики;
  • основні підстави застосування квантитативних методів у мовознавстві;
  • поняття статистичної структури тексту, типологію та проблеми укладання частотних словників, методику їх порівняння;
  • розвиток та становлення квантитативних методів у мовознавстві;
  • лінгвостатистичні характеристики, закони, залежності;
  • кількісні характеристики одиниць різних рівнів мови та мовлення.

уміти:

  • знаходити необхідну кількісну інформацію про мовні одиниці в лексикографічних та електронних джерелах;
  • застосовувати квантитативні методи для аналізу тексту у своїй дослідницькій роботі та для розв’язання різних типів лінгвістичних завдань;
  • укладати і зіставляти частотні словники, правильно інтерпретувати їх інформацію;
  • виявляти і правильно інтерпретувати квантитативні дані про мовну одиницю, отримані з лексикографічних та електронних джерел, основні їх залежності і закони;
  • користуватися основними статистичними інструментами текстових корпусів, програм Sketch Engine, Stylo, графіків CQL, Word, Excel тощо;
  • візуалізувати статистичну інформацію про текстові дані за допомогою різних ресурсів;
  • оперувати найважливішими поняттями квантитативної лінгвістики;
  • аналізувати мовлення (текст) на предмет кількісних характеристик;
  • послуговуватися корпусами текстів для виявлення зазначених характеристик на різних рівнях;
  • критично оцінювати кількісні дані текстів, отримані з частотних словників, корпусів текстів та комп’ютерних програм.

Рекомендована література:

Основна

  1. Альтман Ґ. Мода та істина в лінгвістиці // Проблеми квантитативної лінгвістики. Чернівці: Рута, 2005. С. 3–11.
  2. Бук С. Основи статистичної лінгвістики: Навчально-методичний посібник. Видавничий центр ЛНУ імені Івана Франка, 2008. 124 с.
  3. Васильєв О., Чалий О., Васильєва І. Математичні методи й моделі в лінгвістиці // Україна модерна. Справа Verba et numeri (кількісні підходи до аналізу мови й тексту). 2019. Ч. 27. С. 9–28.
  4. Дарчук Н. П. Статистичні характеристики лексики як відображення структури тексту // Мовознавчі студії. К.: Наукова думка, 1976. С. 97–102.
  5. Перебийніс В. С. Статистичні методи для лінгвістів: Навчальний посібник. Вінниця: «Нова книга», 2002. С. 3–8.
  6. Перебийніс В. С., Муравицька М. П., Дарчук Н. П. Частотні словники та їх використання. К: Наукова думка, 1985. 204 с.
  7. Статистичні параметри стилів / за ред. В. С. Перебийніс. К.: Наукова думка, 1967. 260 с.
  8. Структура мови і статистика мовлення / Відп. ред. канд. філол. наук М. П. Муравицька і Л. А. Олексієнко. К.: Наукова думка, 1974. 176 с.
  9. Burrows J. ‘Delta’ a Measure of Stylistic Difference and a Guide to Likely Authorship. Literary and Linguistic Computing. 2002. 17/3, 1 September: 267–287.
  10. Eder M., Rybicki J., Kestemont M. Stylometry with R: a package for computational text analysis // R Journal. 2016. 8(1). 107–121. <https://journal.r-project.org/archive/2016/RJ-2016-007/index.html>
  11. Kortmann B. Reflecting on the Quantitative Turn in Linguistics // Linguistics. 59 (5): P. 1212.
  12. Lahjouji-Seppälä M., Rabus A., von Waldenfels R. Ukrainian standard vari-ants in the 20th century: stylometry to the rescue <https://www.researchgate.net/publication/364332887_Ukrainian_standard_vari-ants_in_the_20th_century_stylometry_to_the_rescue?fbclid=IwAR3bNDrrWLNUXtyPF0SZ5dlD_NZaFYfVXCACULYtMOhjtr5vqse2TY48u5c>

Додаткова

  1. Бук С. Велика проза Івана Франка: електронний корпус, частотні словники та інші міждисциплінарні контексти : монографія . Львів : ЛНУ імені Івана Франка, 2021. 424 c.
  2. Бук С. Н. Лексична основа української мови: виділення та системно-стуктурна організація : дис. … канд. філол. н. Львівський національний університет імені Івана Франка, Львів, 2004. 281 с.
  3. Бук С. Н. Корпусно-лексикографічні та лінгвостатистичні виміри великої прози Івана Франка: словник і текст : дис. … д-ра філол. наук : 10.02.01 ; Київ. нац. ун-т ім. Тараса Шевченка. Київ, 2021. 500 с.
  4. Бук С. Курс «Основи статистичної лінгвістики» у системі освіти сучасного прикладного лінгвіста // Інформація. Мова. Інтелект: Тези доповідей Міжнародної наукової конференції (м. Київ, 30–31.10.2023 р.). Київ – Варшава : Український мовно-інформаційний фонд НАН України. С. 37–39.
  5. Бук С. Багатство мови Івана Франка: приклад великої прози // Лінгвістичні студії. 2022. 43. C. 121-128.  DOI: https://doi.org/10.31558/1815-3070.2022.43.11
  6. Бук С. Н. Лінгвостатистичний аналіз службових частин мов у словнику і тексті (на матеріалі корпусу текстів великої прози І. Франка) // Mezinárodní vědecká conference “Synsémantické slovní druhy ve slovanských jazycích”  : Mezinárodní vědecká conference “Synsémantické slovní druhy ve slovanských jazycích” (30.−31. března 2023). Sborník abstraktů. Slovanský ústav Akademie věd České republiky, v. v. i., Ústav pro jazyk český Akademie věd České republiky, v. v. i. , Прага, Чехія, 30−31 березня 2023. С. 17.
  7. Пасічник В., Щербина Ю., Висоцька В., Шестакевич Т. Математична лінгвістика. [Книга 1. Квантитативна лінгвістика; Книга 2. Комбінаторна лінгвістика] : [Навчальний посібник]. Львів : «Новий світ-2000», 2012. 359 с.
  8. Перебийніс В. С. Математична лінгвістика: Навчальний посібник. К.: Вид. центр КНЛУ, 2014. 125 c.
  9. Buk S. Quantitative Linguistics as a Transdisciplinary Field on the Intersection of Scientific Traditions, and as a University Course // Інформація. Мова. Інтелект: [колективна монографія] за заг. редакцією В. А. Широкова. Київ – Варшава, Український мовно-інформаційний фонд НАН України, 2023.
  10. Buk S. Traditions and New Trends in Quantitative Linguistics: Navigating Challenges for the University Discipline // Innovative technologies in linguistics and translation. Lviv: Lviv State University of Life Safety. 2024. P. 52−55.
  11. Caldeira S. M. G., Petit Lobão T. C., Andrade R. F. S., Neme A., Miranda J. G. V. The network of concepts in written texts // European Physical Journal. 2006. B 49. P. 523–529.
  12. Rasinger S. M. Quantitative Research in Linguistics: An Introduction Research Methods in Linguistics. A&C Black, 2013. 304 p.
  13. Wimmer G., Altmann G., Hřebíček L., Ondrejovič S., Wimmerová S. Úvod do analýzy textov. Bratislava: Veda, 2003. S. 18

Силабус:

Завантажити силабус