Tématem bakalářské práce je problematika tvorby umělé neuronové sítě pro potřeby časoprostorového predikčního modelování pandemie COVID-19 v administrativních jednotkách České republiky. K tomu jsou použita volně dostupná epidemiologická data sekvenční povahy, jež jsou za účelem usnadnění učení sítě nejprve analyzována vybranými statistickými metodami a transformována do vhodné podoby před vstupem do modelu. Sama tvorba konkrétní architektury umělé neuronové sítě plnící stanovené cíle je rozebrána z teoretického i praktického hlediska. Závěrečným krokem je vícefázová validace přesnosti predikcí i samotného nejlepšího dosaženého modelu zvolenými metodami užitím stanovených kritérií a vizualizací.
Výsledkem je kromě rozboru dané problematiky finální model, stejně jako nástroj vytvořený autorem práce v programovacím jazyce Python, který je použit k realizaci celého výše nastíněného procesu. Práce by měla reprezentovat jednu z možných cest časoprostorového predikčního modelování epidemiologických dat, případně by mohla také sloužit jako inspirace pro tvorbu podobných umělých neuronových sítí pro potřeby predikce sekvenčních dat i v jiných tematických oblastech.
Anotace v angličtině
This bachelor thesis deals with the design of an artificial neural network for the needs of spatiotemporal predictive modelling of the COVID-19 pandemic in the administrative units of the Czech Republic. For this purpose, freely available epidemiological data of sequential nature are used, which are first analysed using selected statistical methods and transformed into a suitable form before entering the model in order to facilitate learning of the network. The actual design of a specific artificial neural network architecture fulfilling the stated objectives is discussed in both theoretical and practical perspectives. The final phase is the multi-stage validation of the accuracy of the predictions and of the best achieved model itself, attained by the chosen methods using selected criteria and visualizations.
The results are, in addition to the analysis of the issue, the final model, as well as the tool created by the author of the thesis in the Python programming language, which was used to implement the entire process outlined above. The work should represent one of the possible ways of spatiotemporal predictive modelling of epidemiological data, while it could also serve as an inspiration for the creation of similar artificial neural networks for the needs of sequential data prediction in other subject areas.
artificial neural networks, machine learning, time series forecasting, Python, COVID-19
Rozsah průvodní práce
41 s. (80 786 znaků)
Jazyk
CZ
Anotace
Tématem bakalářské práce je problematika tvorby umělé neuronové sítě pro potřeby časoprostorového predikčního modelování pandemie COVID-19 v administrativních jednotkách České republiky. K tomu jsou použita volně dostupná epidemiologická data sekvenční povahy, jež jsou za účelem usnadnění učení sítě nejprve analyzována vybranými statistickými metodami a transformována do vhodné podoby před vstupem do modelu. Sama tvorba konkrétní architektury umělé neuronové sítě plnící stanovené cíle je rozebrána z teoretického i praktického hlediska. Závěrečným krokem je vícefázová validace přesnosti predikcí i samotného nejlepšího dosaženého modelu zvolenými metodami užitím stanovených kritérií a vizualizací.
Výsledkem je kromě rozboru dané problematiky finální model, stejně jako nástroj vytvořený autorem práce v programovacím jazyce Python, který je použit k realizaci celého výše nastíněného procesu. Práce by měla reprezentovat jednu z možných cest časoprostorového predikčního modelování epidemiologických dat, případně by mohla také sloužit jako inspirace pro tvorbu podobných umělých neuronových sítí pro potřeby predikce sekvenčních dat i v jiných tematických oblastech.
Anotace v angličtině
This bachelor thesis deals with the design of an artificial neural network for the needs of spatiotemporal predictive modelling of the COVID-19 pandemic in the administrative units of the Czech Republic. For this purpose, freely available epidemiological data of sequential nature are used, which are first analysed using selected statistical methods and transformed into a suitable form before entering the model in order to facilitate learning of the network. The actual design of a specific artificial neural network architecture fulfilling the stated objectives is discussed in both theoretical and practical perspectives. The final phase is the multi-stage validation of the accuracy of the predictions and of the best achieved model itself, attained by the chosen methods using selected criteria and visualizations.
The results are, in addition to the analysis of the issue, the final model, as well as the tool created by the author of the thesis in the Python programming language, which was used to implement the entire process outlined above. The work should represent one of the possible ways of spatiotemporal predictive modelling of epidemiological data, while it could also serve as an inspiration for the creation of similar artificial neural networks for the needs of sequential data prediction in other subject areas.
artificial neural networks, machine learning, time series forecasting, Python, COVID-19
Zásady pro vypracování
Cílem práce je sestavit predikční model založený na neuronové síti pro potřeby časoprostorového predikčního modelování. Proces bude zaměřen na epidemiologické téma vybraných charakteristik pandemie COVID-19 v administrativních jednotkách ČR. Student nejprve vybere vhodná volně dostupná data, která budou mít dostatečně detailní prostorový aspekt. Vstupní data budou zanalyzována metodami exploratorní analýzy s cílem postinutí jejich vnitřních závislostí pro tvorbu robustnějšího modelu. Nad daty bude sestaven model neuronové sítě (např. rekurentní neuronové vrstvy, Bayesovské neuronové a další) pomocí kterého budou modelovány vybrané charakteristiky z dostupných dat tak, aby byla možná přímá validace výsledků. Práce by měla reprezentovat jednu z možných cest časoprostorového predikčního modelování epidemiologických dat, případně by mohla také sloužit jako inspirace pro tvorbu podobných umělých neuronových sítí pro potřeby predikce sekvenčních dat i v jiných tematických oblastech.
Celá práce (text, přílohy, výstupy, zdrojová a vytvořená data) bude odevzdána v digitální podobě na CD nebo jiném digitálním médiu, text práce bude spolu s vybranými přílohami odevzdán ve dvou svazcích na sekretariát katedry. O práci student vytvoří webové stránky, které budou v souladu s pravidly dostupnými na stránkách katedry. Diplomová práce bude zpracována podle zásad dle Voženílka (2002) a také podle šablon dostupných na stránkách katedry. Na závěr práce připojí student jednostránkové resumé v anglickém jazyce. Jako shrnutí bakalářské práce bude vytvořen poster.
Zásady pro vypracování
Cílem práce je sestavit predikční model založený na neuronové síti pro potřeby časoprostorového predikčního modelování. Proces bude zaměřen na epidemiologické téma vybraných charakteristik pandemie COVID-19 v administrativních jednotkách ČR. Student nejprve vybere vhodná volně dostupná data, která budou mít dostatečně detailní prostorový aspekt. Vstupní data budou zanalyzována metodami exploratorní analýzy s cílem postinutí jejich vnitřních závislostí pro tvorbu robustnějšího modelu. Nad daty bude sestaven model neuronové sítě (např. rekurentní neuronové vrstvy, Bayesovské neuronové a další) pomocí kterého budou modelovány vybrané charakteristiky z dostupných dat tak, aby byla možná přímá validace výsledků. Práce by měla reprezentovat jednu z možných cest časoprostorového predikčního modelování epidemiologických dat, případně by mohla také sloužit jako inspirace pro tvorbu podobných umělých neuronových sítí pro potřeby predikce sekvenčních dat i v jiných tematických oblastech.
Celá práce (text, přílohy, výstupy, zdrojová a vytvořená data) bude odevzdána v digitální podobě na CD nebo jiném digitálním médiu, text práce bude spolu s vybranými přílohami odevzdán ve dvou svazcích na sekretariát katedry. O práci student vytvoří webové stránky, které budou v souladu s pravidly dostupnými na stránkách katedry. Diplomová práce bude zpracována podle zásad dle Voženílka (2002) a také podle šablon dostupných na stránkách katedry. Na závěr práce připojí student jednostránkové resumé v anglickém jazyce. Jako shrnutí bakalářské práce bude vytvořen poster.
Seznam doporučené literatury
Cliff, A. D., & Ord, J. K. (1975) Space-Time Modelling with an Application to Regional Forecasting. Transactions of the Institute of British Geographers, (64), 119. https://doi.org/10.2307/621469
Emmert-Streib, F., Yang, Z., Feng, H., Tripathi, S., & Dehmer, M. (2020). An Introductory Review of Deep Learning for Prediction Models With Big Data. Frontiers in Artificial Intelligence, 3. https://doi.org/10.3389/frai.2020.00004
Nikparvar, B., Rahman, M. M., Hatami, F., & Thill, J.-C. (2021). Spatio-temporal prediction of the COVID-19 pandemic in US counties: modeling with a deep LSTM neural network. Scientific Reports, 11(1), 21715. https://doi.org/10.1038/s41598-021-01119-3
Niraula, P., Mateu, J., & Chaudhuri, S. (2022). A Bayesian machine learning approach for spatio-temporal prediction of COVID-19 cases. Stochastic Environmental Research and Risk Assessment. https://doi.org/10.1007/s00477-021-02168-w
Kruse, R., Borgelt, C., Braune, C., Mostaghim, S., & Steinbrecher, M. (2016). Computational Intelligence. https://doi.org/10.1007/978-1-4471-7296-3
Voženílek, V., 2002. Diplomové práce z geoinformatiky. Olomouc: Vydavatelství Univerzity Palackého. ISBN 80-244-0469-9
Seznam doporučené literatury
Cliff, A. D., & Ord, J. K. (1975) Space-Time Modelling with an Application to Regional Forecasting. Transactions of the Institute of British Geographers, (64), 119. https://doi.org/10.2307/621469
Emmert-Streib, F., Yang, Z., Feng, H., Tripathi, S., & Dehmer, M. (2020). An Introductory Review of Deep Learning for Prediction Models With Big Data. Frontiers in Artificial Intelligence, 3. https://doi.org/10.3389/frai.2020.00004
Nikparvar, B., Rahman, M. M., Hatami, F., & Thill, J.-C. (2021). Spatio-temporal prediction of the COVID-19 pandemic in US counties: modeling with a deep LSTM neural network. Scientific Reports, 11(1), 21715. https://doi.org/10.1038/s41598-021-01119-3
Niraula, P., Mateu, J., & Chaudhuri, S. (2022). A Bayesian machine learning approach for spatio-temporal prediction of COVID-19 cases. Stochastic Environmental Research and Risk Assessment. https://doi.org/10.1007/s00477-021-02168-w
Kruse, R., Borgelt, C., Braune, C., Mostaghim, S., & Steinbrecher, M. (2016). Computational Intelligence. https://doi.org/10.1007/978-1-4471-7296-3
Voženílek, V., 2002. Diplomové práce z geoinformatiky. Olomouc: Vydavatelství Univerzity Palackého. ISBN 80-244-0469-9
Přílohy volně vložené
1 poster ve formátu A2
Přílohy vázané v práci
-
Převzato z knihovny
Ne
Plný text práce
Přílohy
Posudek(y) oponenta
Hodnocení vedoucího
Záznam průběhu obhajoby
V úvodu obhajoby student seznámil komisi s cíli, metodami a výsledky své bakalářské práce. Následně přednesli své posudky vedoucí práce a oponent.