|
Vyučující
|
-
Matlach Vladimír, Mgr. Ph.D.
|
|
Obsah předmětu
|
Zpracování textu a aktuální nástroje pro NLP: Úskalí NLP Vektorové reprezentace textů, vektorizace slov, vět a celků (Word2Vec, GloVE, FastText, LASER) Nástroje pro zpracování a vytěžování přirozeného jazyka, knihovny pro jazyk R a Python Identifikace jazyka Identifikace sentimentu Identifikace pojmenovaných entit Vytěžování témat Základy a praktické zpracování obrazu a aktuální přístupy: OCR Grafické embeddingy Shlukování na základě grafické podobnosti Generování popisků Vytěžování sociálních sítí a aplikace grafových algoritmů: Identifikace klíčových rolí v sociálních sítích Identifikace skupin Obecné: Získávání dat Role dat a metadat
|
|
Studijní aktivity a metody výuky
|
|
nespecifikováno
|
|
Výstupy z učení
|
Tento kurz navazuje a dál rozvíjí předchozí znalosti z kurzu zpracování dat v DH. Student se zde seznámí s pokročilými aplikacemi již představených metod na komplexní data vyžadující další formu zpracování. Jedná se především o stále rozsáhlejší potřeby zpracovávat multimediální data (obraz, video, text), vztahová data a meta-data.
|
|
Předpoklady
|
nespecifikováno
|
|
Hodnoticí metody a kritéria
|
nespecifikováno
Vypracování seminární práce a test.
|
|
Doporučená literatura
|
|