Tato práce je zaměřena na výzkum systémů 201 radikálů, vydaný Pracovním výborem pro jazyk a písmo ČLR a zahrnuje celkem 20902 vstupů. Ta je následně porovnávána se znakovou sadou Unicode, která využívá Kangxiho systém radikálů. Tyto dvě znakové sady reprezentují, v současnosti nejvyužívanější systémy indexačních komponentů. První bodem analýzy bylo určení kritérií na základě, kterých byl redukován seznam 201 radikálů. Hlavní naplní pak bylo sestavení korpusu, který čítal celkem 432 znaků, obsahující odlišnou indexační složku. Znaky jsem následně roztřídil do tabulky do dvou kategorií podle odlišných indexačních složek. Dalším předmětem této analýzy inventáře znaků je určení pozice indexační složky. Za tímto účelem jsem rovněž vytvořil tabulku, kde jsou znaky řazeny do skupin podle pozice radikálu a poté do dvou kategorií podle příslušnosti k dané znakové sadě. Poslední částí analýzy je rozdělení znaků do kategorií na základě jejich grafické struktury, což pomůže porozumět pravidlům při identifikaci indexační složky.
Anotace v angličtině
The Aim of this Bachelor is to analyze system of 201 radicals issued by Peoples Republic of China State Language Work Committee. System of 201 radicals is incorporated in GB 13000.1 character set which has total of 20902 entries. This system is compared with Unicode Characters set, that use system of Kangxi radicals. They represent currently the most widely used systems of Indexing Components. The first point of the analysis was to define criteria for reduction of 201 radical index. Main point was to compile corpus that contained total of 430 Chinese Characters with different indexing component. I arranged the characters into a table into two different categories according to different indexing components. Another object of this character inventory analysis was to determine the position of the index component. For this purpose, I also created a table where the characters are grouped according to the radical position and then into two categories according to the respective character set. The last part of the analysis is to divide the characters into categories based on their graphical structure, which will help to understand the rules when identifying the index folder. I recorded the results of individual analyzes in well-arranged tables.
Tato práce je zaměřena na výzkum systémů 201 radikálů, vydaný Pracovním výborem pro jazyk a písmo ČLR a zahrnuje celkem 20902 vstupů. Ta je následně porovnávána se znakovou sadou Unicode, která využívá Kangxiho systém radikálů. Tyto dvě znakové sady reprezentují, v současnosti nejvyužívanější systémy indexačních komponentů. První bodem analýzy bylo určení kritérií na základě, kterých byl redukován seznam 201 radikálů. Hlavní naplní pak bylo sestavení korpusu, který čítal celkem 432 znaků, obsahující odlišnou indexační složku. Znaky jsem následně roztřídil do tabulky do dvou kategorií podle odlišných indexačních složek. Dalším předmětem této analýzy inventáře znaků je určení pozice indexační složky. Za tímto účelem jsem rovněž vytvořil tabulku, kde jsou znaky řazeny do skupin podle pozice radikálu a poté do dvou kategorií podle příslušnosti k dané znakové sadě. Poslední částí analýzy je rozdělení znaků do kategorií na základě jejich grafické struktury, což pomůže porozumět pravidlům při identifikaci indexační složky.
Anotace v angličtině
The Aim of this Bachelor is to analyze system of 201 radicals issued by Peoples Republic of China State Language Work Committee. System of 201 radicals is incorporated in GB 13000.1 character set which has total of 20902 entries. This system is compared with Unicode Characters set, that use system of Kangxi radicals. They represent currently the most widely used systems of Indexing Components. The first point of the analysis was to define criteria for reduction of 201 radical index. Main point was to compile corpus that contained total of 430 Chinese Characters with different indexing component. I arranged the characters into a table into two different categories according to different indexing components. Another object of this character inventory analysis was to determine the position of the index component. For this purpose, I also created a table where the characters are grouped according to the radical position and then into two categories according to the respective character set. The last part of the analysis is to divide the characters into categories based on their graphical structure, which will help to understand the rules when identifying the index folder. I recorded the results of individual analyzes in well-arranged tables.
Cílem této práce je komparace indexačních systémů čínských znaků pomocí radikálů. V teoretické části se budu zabývat historickým vývojem indexace znaků pomocí radikálů a stručnou komparací s ostatními systémy řazení znaků v čínských slovnících. Dále se v teoretické části budu zabývat stručnou analýzou indexačních systémů v tištěných a elektronických slovnících s použitím vybraných příkladů systému Unihanu a normy GB 13000.1 vydaných ministerstvem školství ČLR. Tyto systémy jsem vybral vzhledem k jejich rozšířenosti a propracovanosti. Například Unihan, který vychází z Kangxiho slovníku a je často využíván jako základní norma pro tvorbu mnoha elektronických i tištěných. Na proti tomu je norma GB 13000.1, která byla použita při tvorbě dvou populárních slovníků Xinhua Zidian a Xiandai Hanyu Zidian. V praktické části budu tyto systémy následně porovnávat na základě analýzy vybraných příkladů, odchylek v indexaci znaků, změn v používání radikálů podle posledních norem ministerstva školství ČLR a indexačních pravidel Unihanu.
Zásady pro vypracování
Cílem této práce je komparace indexačních systémů čínských znaků pomocí radikálů. V teoretické části se budu zabývat historickým vývojem indexace znaků pomocí radikálů a stručnou komparací s ostatními systémy řazení znaků v čínských slovnících. Dále se v teoretické části budu zabývat stručnou analýzou indexačních systémů v tištěných a elektronických slovnících s použitím vybraných příkladů systému Unihanu a normy GB 13000.1 vydaných ministerstvem školství ČLR. Tyto systémy jsem vybral vzhledem k jejich rozšířenosti a propracovanosti. Například Unihan, který vychází z Kangxiho slovníku a je často využíván jako základní norma pro tvorbu mnoha elektronických i tištěných. Na proti tomu je norma GB 13000.1, která byla použita při tvorbě dvou populárních slovníků Xinhua Zidian a Xiandai Hanyu Zidian. V praktické části budu tyto systémy následně porovnávat na základě analýzy vybraných příkladů, odchylek v indexaci znaků, změn v používání radikálů podle posledních norem ministerstva školství ČLR a indexačních pravidel Unihanu.
Seznam doporučené literatury
Daniel Kane 2006. The Chinese Language: Its History and Current Usage. Tuttle Publishing. ISBN 0-8048-3853-4
Boltz, William 1994. The origin and early development of the Chinese writing system, American Oriental Society, ISBN 978-0-940490-78-9. (revised 2003)
Xin hong bing. Modern Chinese Character Analysis and Computation. Commercial Press Pub. 2007. ISBN: 7100053102
Specification for indetifying indexing Chinese components of GB 13000.1 Chinese Charachter set. Zhonghua Renmin Gongheguo Jiaoyubu. 2009. ISBN-13: 978-780241121
Xiandai hanyu cidian [Contemporary Chinese Dictionary] (6th edition). Beijing: Commercial Press. 2012. ISBN 9787100084673.
Xinhua Zidian [Xinhua Dictionary], 11th revised edition. Beijing: Commercial Press. 2011. ISBN 9787100077040
Yuyan wenzi guifan biaozhun [Official Standards for Written and Spoken Language]. Beijing: The Commercial Press. 2017. ISBN 978-7-100-12169-9.
The Unicode Standard, Version 11.0, 2018 [online]. Dostupné z: https://www.unicode.org
Seznam doporučené literatury
Daniel Kane 2006. The Chinese Language: Its History and Current Usage. Tuttle Publishing. ISBN 0-8048-3853-4
Boltz, William 1994. The origin and early development of the Chinese writing system, American Oriental Society, ISBN 978-0-940490-78-9. (revised 2003)
Xin hong bing. Modern Chinese Character Analysis and Computation. Commercial Press Pub. 2007. ISBN: 7100053102
Specification for indetifying indexing Chinese components of GB 13000.1 Chinese Charachter set. Zhonghua Renmin Gongheguo Jiaoyubu. 2009. ISBN-13: 978-780241121
Xiandai hanyu cidian [Contemporary Chinese Dictionary] (6th edition). Beijing: Commercial Press. 2012. ISBN 9787100084673.
Xinhua Zidian [Xinhua Dictionary], 11th revised edition. Beijing: Commercial Press. 2011. ISBN 9787100077040
Yuyan wenzi guifan biaozhun [Official Standards for Written and Spoken Language]. Beijing: The Commercial Press. 2017. ISBN 978-7-100-12169-9.
The Unicode Standard, Version 11.0, 2018 [online]. Dostupné z: https://www.unicode.org