| Název předmětu | Úvod do Digital Humanities 1 - Úvod do kvatitativních metod |
|---|---|
| Kód předmětu | KOL/91AU1 |
| Organizační forma výuky | Seminář |
| Úroveň předmětu | Doktorský |
| Rok studia | nespecifikován |
| Semestr | Zimní a letní |
| Počet ECTS kreditů | 10 |
| Vyučovací jazyk | Čeština |
| Statut předmětu | Povinný |
| Způsob výuky | Kontaktní |
| Studijní praxe | Nejedná se o pracovní stáž |
| Doporučené volitelné součásti programu | Není |
| Vyučující |
|---|
|
| Obsah předmětu |
|
Podrobnější výklad o několika nejvýznamnějších přístupech moderní formální lingvistiky, a to chomskyanského GB a minimalismu, lexikální funkční gramatiky J. Bresnanové, teorie optimalismu, kategoriální gramatiky a různých přístupech gramatiky závislostní. V celém výkladu bude brán výrazný zřetel na strukturální lingvistiku Pražské školy a její výsledky.
|
| Studijní aktivity a metody výuky |
| Přednášení |
| Výstupy z učení |
|
Předmět má za cíl posluchače seznámit s jedním z nejdůležitějších zdrojů digitálních dat o lidech, tj. s psanými texty a obrazem. Ať už se jedná o digitalizované historické knihy, dopisy, rukopisy nebo o aktuální beletrii a zprávy ze sociálních sítí, vyžaduje práce s takovými daty specifické znalosti práce s přirozeným jazykem. V tomto předmětu budou poskytnuty praktické znalosti, jak a kde texty získat, jak je zpracovat, tak, aby v nich bylo možné vyhledávat komplexními dotazy a získávat z nich tak náhled na kulturu, jazyk, vztahy mezi zmíněnými lidmi, městy a dalšími entitami. Dále předmět poskytne nástroje, jak tyto úlohy provádět a jak z nich získat smysluplná data včetně problematiky jejich interpretace. Předmět je zaměřen na zisk praktických znalostí, porozumění problematice zpracování multimediálních dat a pojetí konceptů práce s nimi. Na tento předmět následně navážou další, které nabyté znalosti využijí ke komplexním studiím. 1) Problematika zpracování a sběru textových a multimediálních dat - Základy zpracování textu pro pozdější zpracování - Tokenizace, lemmatizace, tagging, dostupné nástroje, úskalí a praxe - Digitalizace literatury a OCR, získávání dat z webových stránek, otevřené zdroje - Právní problematika sběru dat - Biasy a různá zkreslení vnímání získaných dat - Lidský faktor, sugestivita 2) Práce s texty -- korpusy, databáze, weby - Regulární výrazy a jejich využití - Jazykové korpusy, vyhledávání v nich a interpretace - Tvorba vlastních korpusů, sběr dat - Vytěžování pro jazykovědné, kulturní, sociologické, psychologické, historické aplikace 3) Základní způsoby vytěžování textu a médií - Modelování témat - Detekce jmenných entit, sentimentu - Modelování vztahů entit na základě gramatik - Používané nástroje od programovacích jazyků po ty automatické - Způsoby zpracování obrazu a fotografií, tagging, detekce objektů 4) Případové studie - analýza a zpracování - Reflexe odborného textu
|
| Předpoklady |
|
Předmět je určen pouze pro studenty doktorského studia.
|
| Hodnoticí metody a kritéria |
|
Ústní zkouška
Literatura, účast na přednášce, rešerše. Výuka se bude konat 14. 6. 2013. |
| Doporučená literatura |
|
| Studijní plány, ve kterých se předmět nachází |
| Fakulta | Studijní plán (Verze) | Kategorie studijního oboru/specializace | Doporučený semestr | |
|---|---|---|---|---|
| Fakulta: Filozofická fakulta | Studijní plán (Verze): Lingvistika a Digital Humanities (2025) | Kategorie: Filologické vědy | - | Doporučený ročník:-, Doporučený semestr: - |
| Fakulta: Filozofická fakulta | Studijní plán (Verze): Lingvistika a Digital Humanities (2025) | Kategorie: Filologické vědy | - | Doporučený ročník:-, Doporučený semestr: - |
| Fakulta: Filozofická fakulta | Studijní plán (Verze): Lingvistika a Digital Humanities (2020) | Kategorie: Filologické vědy | - | Doporučený ročník:-, Doporučený semestr: - |
| Fakulta: Filozofická fakulta | Studijní plán (Verze): Lingvistika a Digital Humanities (2020) | Kategorie: Filologické vědy | - | Doporučený ročník:-, Doporučený semestr: - |