Předmět: Analýza textových dat

« Zpět
Název předmětu Analýza textových dat
Kód předmětu KMA/TEXT
Organizační forma výuky Přednáška + Cvičení
Úroveň předmětu Magisterský
Rok studia 1
Semestr Letní
Počet ECTS kreditů 3
Vyučovací jazyk Čeština
Statut předmětu Povinně-volitelný
Způsob výuky Kontaktní
Studijní praxe Nejedná se o pracovní stáž
Doporučené volitelné součásti programu Není
Vyučující
  • Pavlů Ivana, Mgr. Ph.D.
Obsah předmětu
- Úvod do textových dat - Předzpracování, čištění a formátování textových dat - Základní vizualizace - Popisná statistika v textových datech - Word + document frequency, Zipfův zákon - N-gramy, korelace v textových datech - Analýza sentimentu - Klasifikační metody pro textová data - Modelování témat - Specifika českého jazyka v analýze textu - Textová data a umělá inteligence - Textová data a LLM

Studijní aktivity a metody výuky
Přednášení, Dialogická (diskuze, rozhovor, brainstorming), Demonstrace
Výstupy z učení
Předpoklady
nespecifikováno

Hodnoticí metody a kritéria
nespecifikováno
Prezentace závěrečného projektu, kde student prokáže porozumění tématu.
Doporučená literatura
  • (2022). Text as Data: A New Framework for Machine Learning and the Social Sciences. Princeton University Press (March 29).
  • (2016). Text Data Management and Analysis. Association for Computing Machinery and Morgan & Claypool (23 June).
  • (2019). Text Mining with Machine Learning: Principles and Techniques. CRC Press (October, 2019).
  • (2017). Text Mining with R: A Tidy Approach. (August 1) O'Reilly Media; 1st edition.


Studijní plány, ve kterých se předmět nachází
Fakulta Studijní plán (Verze) Kategorie studijního oboru/specializace Doporučený ročník Doporučený semestr
Fakulta: Přírodovědecká fakulta Studijní plán (Verze): Aplikovaná matematika (2023) Kategorie: Matematické obory 1 Doporučený ročník:1, Doporučený semestr: Letní