|
Vyučující
|
|
|
|
Obsah předmětu
|
- Úvod do textových dat - Předzpracování, čištění a formátování textových dat - Základní vizualizace - Popisná statistika v textových datech - Word + document frequency, Zipfův zákon - N-gramy, korelace v textových datech - Analýza sentimentu - Klasifikační metody pro textová data - Modelování témat - Specifika českého jazyka v analýze textu - Textová data a umělá inteligence - Textová data a LLM
|
|
Studijní aktivity a metody výuky
|
|
Přednášení, Dialogická (diskuze, rozhovor, brainstorming), Demonstrace
|
|
Výstupy z učení
|
|
|
|
Předpoklady
|
nespecifikováno
|
|
Hodnoticí metody a kritéria
|
nespecifikováno
Prezentace závěrečného projektu, kde student prokáže porozumění tématu.
|
|
Doporučená literatura
|
-
(2022). Text as Data: A New Framework for Machine Learning and the Social Sciences. Princeton University Press (March 29).
-
(2016). Text Data Management and Analysis. Association for Computing Machinery and Morgan & Claypool (23 June).
-
(2019). Text Mining with Machine Learning: Principles and Techniques. CRC Press (October, 2019).
-
(2017). Text Mining with R: A Tidy Approach. (August 1) O'Reilly Media; 1st edition.
|