Jan Bouchner: Korpus českého verše a jeho využití ve výuce

čtvrtek 13. listopadu 2014 ·

Zpráva o novém nástroji Ústavu pro českou literaturu AV ČR, který poskytuje informace o české poezii 19. a 20. století a může být vhodným zdrojem informací pro výuku.


4. listopadu 2014 byl spuštěn Versologickým týmem Ústavu pro českou literaturu AV ČR velmi zajímavý projekt. Na stránkách www.versologie.cz totiž najdeme Korpus českého verše. O co se jedná a jak lze tento mocný nástroj použít ve výuce, o tom pojednává následující článek.

O co jde

Zde si pomohu citací přímo ze stránek Korpusu českého verše:
"Korpus českého verše (KČV) je lemmatizovaný, foneticky, morfologicky, metricky a stroficky anotovaný korpus české poezie 19. a počátku 20. století.
Ke každé slovní jednotce v korpusu je připojena informace o jejím základním slovním tvaru (lemma), fonetickém přepisu a gramatických kategoriích, u každého verše je určeno metrum (jamb, trochej...), rozsah (n-stopý), typ klauzule (mužská, ženská...) a metrický vzorec. (V současnosti jsou z hlediska metriky anotovány pouze verše sylabotónické.) Na vyšších rovinách jsou pak anotovány rýmové dvojice, resp. n-tice a pevné formy (sonet, rondel...). V metrickém a strofickém popisu je možné vyhledávat prostřednictvím Databáze českých meter, rovina lemmatizace je částečně zpřístupněna prostřednictvím Frekvenčních slovníků, rýmové páry lze vyhledávat v aplikaci Gunstick
KČV..."
Jedná se tedy o databázi české poezie a to až na úrovni slov. Obsahuje 78 391 básní v 1689 básnických sbírkách z 19. a 20. století (soupis všech zpracovaných textů). Aby nedocházelo k mýlce, Korpus českého verše nezpřístupňuje básně či básnické sbírky jako takové, ale podrobné informace o nich. Pokud hledáte způsob, jak se dostat k digitalizované podobě české poezie 19. a počátku 20. století, pak mohu doporučit jiný zajímavý projekt, Českou elektronickou knihovnu, z které ostatně údaje v KČV vycházejí. ČEK obsahuje 1700 digitalizovaných básnických knih a, jak sami píší, přináší kompletní veršované dílo nejvýznamnějších básníků české novodobé literatury.

Co KČV nabízí

Krom samotných statistických dat (zjistíme například, že čeští poetové byli nejaktivnější v letech 1890 - 1899, kdy napsali skoro půl milionu veršů) můžeme použít i několik velmi zajímavých nástrojů:
  • Frekvenční slovník
  • Gunstick - databázi rýmů
  • Databázi českých meter
  • Eufonometr
  • Hex - klíčová slova v české poezii
  • Cvičebnici
Mimo nástrojů dostupných přímo na stránkách versologie.cz přidal svou trošku do mlýna i Český rozhlas. Na svých stránkách vytvořil nástroj, který zpřístupňuje některé informace z korpusu a vizualizuje je pomocí tag cloudu. Snadno tak zobrazíme nejoblíbenější podstatné slovo Jaroslava Vrchlického (srdce) nebo nejoblíbenější přídavné jméno Karáska ze Lvovic (mrtvý).

Frekvenční slovník

Zde nalezneme databázové soubory (xls, txt) jak celého korpusu (více než 14 milionů záznamů), tak jednotlivých subkorpusů (autorů a následně i sbírek). U každého lemmatu (základního slovníkového tvaru slova - započítány jsou tedy výskyty jakéhokoli tvaru) je uvedeno pořadí, slovní druh a relativní a absolutní četnost. Nejde zde tedy o nástroj jako takový, ale spíš o zpřístupnění nadmíru zajímavých dat, která pak můžeme dále zpracovávat a porovnávat.

Gunstick - databáze rýmů

Gunstick nám umožní nahlédnout pod pokličku české poezie z hlediska rýmů. Můžeme si vyhledat rýmy k jakémukoli slovu, které nás napadne. Gunstick zobrazí graf relativní četnosti jednotlivých rýmů k zadanému slovu, počet rýmů v jednotlivých letech a konečně i tabulku s konkrétními verši, ve kterých se rým objevuje, společně s údajem o autorovi, básni, sbírce a roku vydání. Tak si například ověříme, že nejčastějším rýmem ke slovu "škola" bylo mezi lety 1800 a 1920 skutečně slovo "volá".
Vyhledávání je možné dále omezovat. Můžeme prohledávat jen některé autory, brát v potaz určitou dobu vydání nebo upřesnit metrickou klauzuli (mužský X ženský verš, ukončený X neukončený...).

Databáze českých meter

Zde je zpřístupněn metrický a strofický popis všech 1689 zpracovaných básnických sbírek. Tento nástroj však není přímo na stránkách versologického týmu a vyžaduje registraci.
Odmění nás ale mnoha zajímavými informacemi o formální stránce české poezie dané doby. Databáze českých meter nám především umožňuje vytvořit vizualizace různých dotazů. Zobrazí nám např. grafy i tabulky srovnávající Nerudovu a Hálkovu oblibu používání sonetu.
Tento nástroj je velmi mocný, nicméně je zřejmé, že je určen spíše odborníkům a entuziastům v oboru literární vědy.

Eufonometr

V druhé polovině dvacátého století vytvořili lingvisté způsob, jak spočítat zvukomalebnost básnického textu. A právě toto nabízí nástroj eufonometr. Můžeme vložit jakýkoli básnický text a nástroj nám spočítá míru zvukomalebnosti a ukáže, kterému autoru jsme nejblíže. Dozvíme se tak například, že "autor" lidové písničky Skákal pes by sdílel 33. příčku s Františkem Rajmanem.


Celý článek na spomocnik.rvp.cz.

0 komentářů:

Články dle data



Učitelské listy

Nabídka práce

Česká škola - portál pro ZŠ a SŠ

Česká škola poskytuje svým čtenářům diskusní prostor k vyjádření názorů na školskou problematiku. Tyto příspěvky se nemusí shodovat se stanoviskem redakce České školy a jsou uveřejňovány jako podnět k dalším diskusím.

Obsah článků nemusí vyjadřovat stanovisko redakce nebo vydavatele Albatros Media, a.s.


Všechna práva vyhrazena.

Tento server dodržuje právní předpisy
o ochraně osobních údajů.

ISSN 1213-6018




Licence Creative Commons

Obsah podléhá licenci Creative Commons Uveďte autora-Neužívejte dílo komerčně-Nezasahujte do díla 3.0 Česká republika, pokud není uvedeno jinak nebo nejde-li o tiskové zprávy.



WebArchiv - archiv českého webu



Tyto webové stránky používají k poskytování služeb, personalizaci reklam a analýze návštěvnosti soubory cookie. Informace o tom, jak tyto webové stránky používáte, jsou sdíleny se společností Google. Používáním těchto webových stránek souhlasíte s použitím souborů cookie.