Práce se zabývá regresí pomocí metody nejmenších dílčích čtverců, která nachází největší využití v případech, kdy je v datovém souboru více proměnných než pozorování a také je vhodná při redukci dimenze dat. Standardní metoda nejmenších čtverců v této situaci nelze použít. Na metodu nejmenších dílčích čtverců navazuje robustní a řídká metoda, které zajišťují lepší interpretační vlastnosti. V závěru práce jsou jednotlivé metody demonstrovány na reálných a nasimulovaných datech, následně je uvedeno srovnání kvality predikce uvedených metod. Praktické aplikace jsou realizovány pomocí statistického softwaru R.
Anotace v angličtině
The thesis deals with regression modelling using the partial least squares method. It finds the largest application in cases where a dataset contains more variables than observations. It is also possible to apply this method for dimension reduction. Note that the standard least squares method cannot be used for this purpose. The thesis continues with other approaches, such as the partial least squares method applications of robustness and sparsity constraints, which provide better interpretations. Finally, these methods are demonstrated on real and simulated data followed by the comparison of quality of prediction for previously mentioned methods. Practical applications are conducted in statistical software R.
Klíčová slova
metoda nejmenších dílčích čtverců, metoda hlavních komponent, regrese, chemometrie, robustní metoda, řídká metoda, software R, singulární rozklad matice, prahový parametr
Klíčová slova v angličtině
partial least squares method, principal component analysis, regression, chemometrics, robust method, sparse method, software R, singular value decomposition, tresholding parameter
Rozsah průvodní práce
68 s.
Jazyk
CZ
Anotace
Práce se zabývá regresí pomocí metody nejmenších dílčích čtverců, která nachází největší využití v případech, kdy je v datovém souboru více proměnných než pozorování a také je vhodná při redukci dimenze dat. Standardní metoda nejmenších čtverců v této situaci nelze použít. Na metodu nejmenších dílčích čtverců navazuje robustní a řídká metoda, které zajišťují lepší interpretační vlastnosti. V závěru práce jsou jednotlivé metody demonstrovány na reálných a nasimulovaných datech, následně je uvedeno srovnání kvality predikce uvedených metod. Praktické aplikace jsou realizovány pomocí statistického softwaru R.
Anotace v angličtině
The thesis deals with regression modelling using the partial least squares method. It finds the largest application in cases where a dataset contains more variables than observations. It is also possible to apply this method for dimension reduction. Note that the standard least squares method cannot be used for this purpose. The thesis continues with other approaches, such as the partial least squares method applications of robustness and sparsity constraints, which provide better interpretations. Finally, these methods are demonstrated on real and simulated data followed by the comparison of quality of prediction for previously mentioned methods. Practical applications are conducted in statistical software R.
Klíčová slova
metoda nejmenších dílčích čtverců, metoda hlavních komponent, regrese, chemometrie, robustní metoda, řídká metoda, software R, singulární rozklad matice, prahový parametr
Klíčová slova v angličtině
partial least squares method, principal component analysis, regression, chemometrics, robust method, sparse method, software R, singular value decomposition, tresholding parameter
Zásady pro vypracování
Metoda dílčích nejmenších čtverců má široké využití v případech, kdy je v datovém souboru více proměnných než pozorování, a nelze tedy při regresní analýze použít standardní metodu nejmenších čtverců. Úkolem diplomové práce bude zejména studium aplikačního potenciálu uvedené metody a tento demonstrovat pomocí statistického softwaru R na konkrétních příkladech.
Zásady pro vypracování
Metoda dílčích nejmenších čtverců má široké využití v případech, kdy je v datovém souboru více proměnných než pozorování, a nelze tedy při regresní analýze použít standardní metodu nejmenších čtverců. Úkolem diplomové práce bude zejména studium aplikačního potenciálu uvedené metody a tento demonstrovat pomocí statistického softwaru R na konkrétních příkladech.
Seznam doporučené literatury
Varmuza, K., Filzmoser, P. (2009) Introduction to multivariate statistical analysis in chemometrics. CRC Press, Boca Raton
Další literatura dle doporučení školitele.
Seznam doporučené literatury
Varmuza, K., Filzmoser, P. (2009) Introduction to multivariate statistical analysis in chemometrics. CRC Press, Boca Raton
Další literatura dle doporučení školitele.
Přílohy volně vložené
-
Přílohy vázané v práci
grafy, tabulky
Převzato z knihovny
Ano
Plný text práce
Přílohy
Posudek(y) oponenta
Hodnocení vedoucího
Záznam průběhu obhajoby
V úvodu obhajoby diplomové práce \uv{Regresní analýza pomocí metody dílčích nejmenších čtverců} studenta Dominika Mikšová seznámila komisi s cílem práce a poté se zaměřila na popis problému a uvedla několik různých výpočetních algoritmů. Kromě standardní metody dílčích nejmenších čtverců představila také robustní a řídkou metodu dílčích nejmenších čtverců. Následně demonstrovala metody na umělých i reálných datech, prezentovala dosažené výsledky a závěry práce. Po přečtení posudků vedoucího i oponentky práce proběhla diskuze. Komise se shodla na celkovém hodnocení oponované práce stupněm C.