4. listopadu 2014 byl spuštěn Versologickým týmem Ústavu pro českou literaturu AV ČR velmi zajímavý projekt. Na stránkách www.versologie.cz totiž najdeme Korpus českého verše. O co se jedná a jak lze tento mocný nástroj použít ve výuce, o tom pojednává následující článek.
O co jde
Zde si pomohu citací přímo ze stránek Korpusu českého verše:"Korpus českého verše (KČV) je lemmatizovaný, foneticky, morfologicky, metricky a stroficky anotovaný korpus české poezie 19. a počátku 20. století.Jedná se tedy o databázi české poezie a to až na úrovni slov. Obsahuje 78 391 básní v 1689 básnických sbírkách z 19. a 20. století (soupis všech zpracovaných textů). Aby nedocházelo k mýlce, Korpus českého verše nezpřístupňuje básně či básnické sbírky jako takové, ale podrobné informace o nich. Pokud hledáte způsob, jak se dostat k digitalizované podobě české poezie 19. a počátku 20. století, pak mohu doporučit jiný zajímavý projekt, Českou elektronickou knihovnu, z které ostatně údaje v KČV vycházejí. ČEK obsahuje 1700 digitalizovaných básnických knih a, jak sami píší, přináší kompletní veršované dílo nejvýznamnějších básníků české novodobé literatury.
Ke každé slovní jednotce v korpusu je připojena informace o jejím základním slovním tvaru (lemma), fonetickém přepisu a gramatických kategoriích, u každého verše je určeno metrum (jamb, trochej...), rozsah (n-stopý), typ klauzule (mužská, ženská...) a metrický vzorec. (V současnosti jsou z hlediska metriky anotovány pouze verše sylabotónické.) Na vyšších rovinách jsou pak anotovány rýmové dvojice, resp. n-tice a pevné formy (sonet, rondel...). V metrickém a strofickém popisu je možné vyhledávat prostřednictvím Databáze českých meter, rovina lemmatizace je částečně zpřístupněna prostřednictvím Frekvenčních slovníků, rýmové páry lze vyhledávat v aplikaci Gunstick
KČV..."
Co KČV nabízí
Krom samotných statistických dat (zjistíme například, že čeští poetové byli nejaktivnější v letech 1890 - 1899, kdy napsali skoro půl milionu veršů) můžeme použít i několik velmi zajímavých nástrojů:- Frekvenční slovník
- Gunstick - databázi rýmů
- Databázi českých meter
- Eufonometr
- Hex - klíčová slova v české poezii
- Cvičebnici
Frekvenční slovník
Zde nalezneme databázové soubory (xls, txt) jak celého korpusu (více než 14 milionů záznamů), tak jednotlivých subkorpusů (autorů a následně i sbírek). U každého lemmatu (základního slovníkového tvaru slova - započítány jsou tedy výskyty jakéhokoli tvaru) je uvedeno pořadí, slovní druh a relativní a absolutní četnost. Nejde zde tedy o nástroj jako takový, ale spíš o zpřístupnění nadmíru zajímavých dat, která pak můžeme dále zpracovávat a porovnávat.
Gunstick - databáze rýmů
Gunstick nám umožní nahlédnout pod pokličku české poezie z hlediska rýmů. Můžeme si vyhledat rýmy k jakémukoli slovu, které nás napadne. Gunstick zobrazí graf relativní četnosti jednotlivých rýmů k zadanému slovu, počet rýmů v jednotlivých letech a konečně i tabulku s konkrétními verši, ve kterých se rým objevuje, společně s údajem o autorovi, básni, sbírce a roku vydání. Tak si například ověříme, že nejčastějším rýmem ke slovu "škola" bylo mezi lety 1800 a 1920 skutečně slovo "volá".
Vyhledávání je možné dále omezovat. Můžeme prohledávat jen některé autory, brát v potaz určitou dobu vydání nebo upřesnit metrickou klauzuli (mužský X ženský verš, ukončený X neukončený...).
Databáze českých meter
Zde je zpřístupněn metrický a strofický popis všech 1689 zpracovaných básnických sbírek. Tento nástroj však není přímo na stránkách versologického týmu a vyžaduje registraci.
Odmění nás ale mnoha zajímavými informacemi o formální stránce české poezie dané doby. Databáze českých meter nám především umožňuje vytvořit vizualizace různých dotazů. Zobrazí nám např. grafy i tabulky srovnávající Nerudovu a Hálkovu oblibu používání sonetu.
Tento nástroj je velmi mocný, nicméně je zřejmé, že je určen spíše odborníkům a entuziastům v oboru literární vědy.
Eufonometr
V druhé polovině dvacátého století vytvořili lingvisté způsob, jak spočítat zvukomalebnost básnického textu. A právě toto nabízí nástroj eufonometr. Můžeme vložit jakýkoli básnický text a nástroj nám spočítá míru zvukomalebnosti a ukáže, kterému autoru jsme nejblíže. Dozvíme se tak například, že "autor" lidové písničky Skákal pes by sdílel 33. příčku s Františkem Rajmanem.
Celý článek na spomocnik.rvp.cz.
0 komentářů:
Okomentovat