Tato diplomová práce se zabývá přesností klasifikace tří vybraných krajinných jednotek. Klasifikace je provedena pomocí čtyř vybraných algoritmů strojového učení - CART, Random Forest, Minimum Distance a Naive Bayes. Spuštění klasifikace kompletně probíhá v GEE. V práci jsou použity tři satelitní multispektrální snímky z družic Sentinel-2, Landsat 8 a MODIS.
Dílčí část klasifikace je provedena v cloudovém prostředí Google Earth Engine, kdežto již samotné zpracování je realizováno v desktopovém softwaru ArcGIS Pro. Výsledky klasifikace jsou porovnány s referenčními vrstvami pro všechny 3 úrovně - land cover, land use a biotop.
Výsledkem práce je procentuální porovnání klasifikací v kategoriích. A shoda klasifikace s referenční vrstvou určující přesnost klasifikace. Výstupy jsou vypracovány v tabulkové a grafické podobě. Nejlepší výsledky klasifikace prokazuje algoritmus Random Forest, naopak nejslabší výsledky Naive Bayes. Při porovnání shod v kategoriích, jsou brány v potaz všechny tři zkoumané krajinné jednotky, ukazuje na území Olomouce nejlepší výsledky algoritmus CART a na území Černovic algoritmus Na?ve Bayes. Klasifikace s nejvyšším procentem shody vychází pro testovací snímek Sentinel-2.
Anotace v angličtině
This thesis deals with the classification accuracy of three selected landscape units. The classification is performed using four selected machine learning algorithms - CART, Random Forest, Minimum Distance and Naive Bayes. The execution of the classification is completely done in GEE. Three satellite multispectral images from Sentinel-2, Landsat 8 and MODIS satellites are used in this work.
The classification part is performed in the cloud environment of Google Earth Engine, whereas the actual processing is performed in the desktop software ArcGIS Pro. The classification results are compared with reference layers for all 3 levels - land cover, land use and habitat.
The result of the work is a percentage comparison of the classifications in the categories. And the agreement of the classification with the reference layer determining the accuracy of the classification. The outputs are produced in tabular and graphical form. The Random Forest algorithm shows the best classification results, while Naive Bayes shows the worst results. When comparing the matches in the categories, all three studied landscape units are taken into account, the CART algorithm shows the best results in the territory of Olomouc and the Na?ve Bayes algorithm in the territory of Černovice. The classification with the highest percentage of agreement is based on the Sentinel-2 test image.
Klíčová slova
Google Earth Engine, řízená klasifikace, algoritmy
Klíčová slova v angličtině
Google Earth Engine, supervised classification, algorithms
Rozsah průvodní práce
68 s.
Jazyk
CZ
Anotace
Tato diplomová práce se zabývá přesností klasifikace tří vybraných krajinných jednotek. Klasifikace je provedena pomocí čtyř vybraných algoritmů strojového učení - CART, Random Forest, Minimum Distance a Naive Bayes. Spuštění klasifikace kompletně probíhá v GEE. V práci jsou použity tři satelitní multispektrální snímky z družic Sentinel-2, Landsat 8 a MODIS.
Dílčí část klasifikace je provedena v cloudovém prostředí Google Earth Engine, kdežto již samotné zpracování je realizováno v desktopovém softwaru ArcGIS Pro. Výsledky klasifikace jsou porovnány s referenčními vrstvami pro všechny 3 úrovně - land cover, land use a biotop.
Výsledkem práce je procentuální porovnání klasifikací v kategoriích. A shoda klasifikace s referenční vrstvou určující přesnost klasifikace. Výstupy jsou vypracovány v tabulkové a grafické podobě. Nejlepší výsledky klasifikace prokazuje algoritmus Random Forest, naopak nejslabší výsledky Naive Bayes. Při porovnání shod v kategoriích, jsou brány v potaz všechny tři zkoumané krajinné jednotky, ukazuje na území Olomouce nejlepší výsledky algoritmus CART a na území Černovic algoritmus Na?ve Bayes. Klasifikace s nejvyšším procentem shody vychází pro testovací snímek Sentinel-2.
Anotace v angličtině
This thesis deals with the classification accuracy of three selected landscape units. The classification is performed using four selected machine learning algorithms - CART, Random Forest, Minimum Distance and Naive Bayes. The execution of the classification is completely done in GEE. Three satellite multispectral images from Sentinel-2, Landsat 8 and MODIS satellites are used in this work.
The classification part is performed in the cloud environment of Google Earth Engine, whereas the actual processing is performed in the desktop software ArcGIS Pro. The classification results are compared with reference layers for all 3 levels - land cover, land use and habitat.
The result of the work is a percentage comparison of the classifications in the categories. And the agreement of the classification with the reference layer determining the accuracy of the classification. The outputs are produced in tabular and graphical form. The Random Forest algorithm shows the best classification results, while Naive Bayes shows the worst results. When comparing the matches in the categories, all three studied landscape units are taken into account, the CART algorithm shows the best results in the territory of Olomouc and the Na?ve Bayes algorithm in the territory of Černovice. The classification with the highest percentage of agreement is based on the Sentinel-2 test image.
Klíčová slova
Google Earth Engine, řízená klasifikace, algoritmy
Klíčová slova v angličtině
Google Earth Engine, supervised classification, algorithms
Zásady pro vypracování
Cílem práce je provést sérii klasifikací obrazu a na základě dosažených výsledků stanovit vhodnost dostupných algoritmů pro klasifikaci krajinných jednotek v prostředí Google Earth Engine (GEE). Student/ka se seznámí s dostupnými datasety a klasifikačními algoritmy, jež jsou dostupné v prostředí GEE. Pro vybrané zájmové plochy v ČR provede sérii klasifikací obrazu v rozhraní GEE a využije strukturní i texturní charakteristiky. Dosažené výsledky vzájemně vyhodnotí a srovná se stavem na kontrolních plochách. Klasifikace bude zaměřená na rozlišení krajinných jednotek na třech úrovních (landcover jednotka, landuse jednotka, biotop jednotka).
Studentka vyplní údaje o všech datových sadách, které vytvořil nebo získal v rámci práce, do Metainformačního systému katedry geoinformatiky a současně zálohu údajů ve formě validovaného XML souboru. Celá práce (text, přílohy, výstupy, zdrojová a vytvořená data, XML soubor) se odevzdá v digitální podobě na CD (DVD) a text práce s vybranými přílohami bude odevzdán ve dvou svázaných výtiscích na sekretariát katedry. O diplomové práci student vytvoří webovou stránku v souladu s pravidly dostupnými na stránkách katedry. Práce bude zpracována podle zásad Voženílek (2002) a závazné šablony pro diplomové práce na KGI. Povinnou přílohou práce bude poster formátu A2.
Zásady pro vypracování
Cílem práce je provést sérii klasifikací obrazu a na základě dosažených výsledků stanovit vhodnost dostupných algoritmů pro klasifikaci krajinných jednotek v prostředí Google Earth Engine (GEE). Student/ka se seznámí s dostupnými datasety a klasifikačními algoritmy, jež jsou dostupné v prostředí GEE. Pro vybrané zájmové plochy v ČR provede sérii klasifikací obrazu v rozhraní GEE a využije strukturní i texturní charakteristiky. Dosažené výsledky vzájemně vyhodnotí a srovná se stavem na kontrolních plochách. Klasifikace bude zaměřená na rozlišení krajinných jednotek na třech úrovních (landcover jednotka, landuse jednotka, biotop jednotka).
Studentka vyplní údaje o všech datových sadách, které vytvořil nebo získal v rámci práce, do Metainformačního systému katedry geoinformatiky a současně zálohu údajů ve formě validovaného XML souboru. Celá práce (text, přílohy, výstupy, zdrojová a vytvořená data, XML soubor) se odevzdá v digitální podobě na CD (DVD) a text práce s vybranými přílohami bude odevzdán ve dvou svázaných výtiscích na sekretariát katedry. O diplomové práci student vytvoří webovou stránku v souladu s pravidly dostupnými na stránkách katedry. Práce bude zpracována podle zásad Voženílek (2002) a závazné šablony pro diplomové práce na KGI. Povinnou přílohou práce bude poster formátu A2.
Seznam doporučené literatury
Oficiální dokumentace k technickým parametrům a způsobu práce
https://developers.google.com/earth-engine/
Yang, Y.; Yang, D.; Wang, X.; Zhang, Z.; Nawaz, Z. Testing Accuracy of Land Cover Classification Algorithms in the Qilian Mountains Based on GEE Cloud Platform. Remote Sens. 2021, 13, 5064. https://doi.org/10.3390/rs13245064
Shunlin Liang, Xiaowen Li, Jindi Wang (eds.) Advanced Remote Sensing. 1st Edition. Terrestrial Information Extraction and Applications
William James Frampton, Jadunandan Dash, GaryWatmough, Edward James Milton (2013): Evaluating the capabilities of Sentinel-2 for quantitative estimation of biophysical variables in vegetation
indexované databáze
Seznam doporučené literatury
Oficiální dokumentace k technickým parametrům a způsobu práce
https://developers.google.com/earth-engine/
Yang, Y.; Yang, D.; Wang, X.; Zhang, Z.; Nawaz, Z. Testing Accuracy of Land Cover Classification Algorithms in the Qilian Mountains Based on GEE Cloud Platform. Remote Sens. 2021, 13, 5064. https://doi.org/10.3390/rs13245064
Shunlin Liang, Xiaowen Li, Jindi Wang (eds.) Advanced Remote Sensing. 1st Edition. Terrestrial Information Extraction and Applications
William James Frampton, Jadunandan Dash, GaryWatmough, Edward James Milton (2013): Evaluating the capabilities of Sentinel-2 for quantitative estimation of biophysical variables in vegetation
indexované databáze
Přílohy volně vložené
Poster
Přílohy vázané v práci
grafy, tabulky
Převzato z knihovny
Ne
Plný text práce
Přílohy
Posudek(y) oponenta
Hodnocení vedoucího
Záznam průběhu obhajoby
V úvodu obhajoby studentka seznámila komisi s cíli, metodami a výsledky své diplomové práce. Následně přednesli své posudky vedoucí práce a oponent.
V diskusi byla řešena témata:
testování a porovnávání výsledků algoritmu v jeho základním nastavení a uživatelské modifikaci
použití řízených klasifikací (ŘK) v GEE, největší přinos a úskalí oproti ŘK v desktop řešeních
nefunkčnost SVM algoritmu
obecné dotazy a připomínky k výstupům ve formě StoryMaps
vliv dat na výsledek (přesnost), jsou tvrzení obecně platná nebo jsou vztažena ke zvoleným datovým sadám (robustnost řešení)