Jan Wagner: html2cz: překlad anglických stránek do češtiny

pondělí 9. února 2004 ·

Program html2cz poskytuje jednoduchou a rychlou pomoc při překladu anglických WWW stránek v HTML do češtiny. Je šířen bezúplatně pod licencí GNU/GPL a s úspěchem jej ve škole využijete třeba pro tvorbu výukových textů s podporou překladu.

Říká se, že v jednoduchosti je síla, takže řada uživatelů bude nad aplikací html2cz  od Martina Sznapky (verze v jazyce Java), Tarase Kapuščaka (verze v jazyce C) a Jiřího Nečase (verze winhtml2cz pro MS Windows) jásat. Podobně jsem hodnotil před více než rokem v recenzi pro dnes již neexistující Svět Namodro tehdejší verze aplikace html2cz, ke kterým přibyly v minulém roce dvě další multiplatformní v jazyce Java pro MS Windows, Linux, MacOS, OS/2, Solaris a další, a v jazyce C se dvěma binárními distribucemi pro MS Windows a Linux.

Důvod vzniku autoři předloni vysvětlovali takto: „Jelikož je angličtina rozšířený jazyk a mnoho zajímavých textů na internetu je právě v tomto jazyku, tak jsem potřeboval pomocníka se slovíčky, které neznám. Papírový i elektronický slovník je sice dobry, ale jako každý, i já jsem líný a potřebuju překlad, aniž bych upustil z ruky myš a klavesnici :]" 

Aplikace html2cz překládá anglicky psané HTML stránky do češtiny pomocí náhrady jednotlivých anglických slov ve zdrojovém kódu konstrukcí se SPAN a TITLE, jejíž příklad vidíte u slova today

<SPAN TITLE="dnes, dneska, dnešek">today</SPAN>

Tento princip způsobí, že při prohlížení přeložené stránky se v libovolném internetovém prohlížeči po najetí myší na anglické slovo objeví bublina s českým překladem:

The advance of science and technology during the nineteenth and twentieth centuries brought about increased needs for numerical computations. Solving complex equations used in different fields required considerable time and effort and called for a design of effective computational equipment. With the U.S. census in 1890, a new computational need arose.

Nejstarší, už nedodávaná verze programu html2cz o velikosti pouhých 34 kB byla napsána s pomocí FreePascalu a spouštěla se v příkazovém režimu MS-DOS, verze winhtml2cz o velikosti 415 kB, napsaná v Borland C++, je grafická nadstavba, pracující jako běžná aplikace v MS Windows 9x/Me/2000/XP. Novější prostorově velmi úsporná 15kB verze html2cz v jazyce C pracuje opět v příkazovém režimu MS-DOS a dodává se i se zdrojovým kódem s možností kompilace pro operační systém Linux. Na rozdíl od dále popisované verze v Javě se v této verzi obejdeme bez dalších souborů, kromě použitého slovníku.


Instalujeme

Nejnovější verzi html2cz 0.1.0 v jazyce Java si můžete stáhnout buď jako archiv ve formátu ZIP o velikosti 75 kB nebo jako spustitelný instalační soubor pro MS Windows o velikosti 117 kB. Programy z rodiny html2cz jsou šířeny bezúplatně pod licencí GNU GPL a používají  slovník GNU FDL Anglicko-Český slovník.

Pro spuštění a úspěšnou práci je nutné stáhnout z internetu tyto soubory:

  • jednu z výše uvedených distribucí programu html2cz;
  • Java Runtime Environment (JRE) samozřejmě jen pokud ho nemáte;
  • GNU FDL Anglicko-Český slovník v archivu slovnik_data.txt.gz (cca 1MB, po rozbalení ve formátu TXT přes 6 MB).

Nejprve nainstalujte program html2cz a JRE, poté rozbalíme soubor slovníku a pak můžeme spustit html2cz poklepáním na zástupce na ploše či v Nabídce Start, nebo na soubor html2cz-0.1.0.jar v některém ze souborových manažerů.  Prvním krokem po spuštění je načtení slovníku a jeho konverze pro rychlou práci aplikace (výsledný soubor má velikost 2,7 MB). Poté můžeme vybírat buď překlad jednotlivých souborů, nebo celých adresářů a je možné volit i přímý přepis původních souborů.

Klepnutím zvětšíte

Využití a zhodnocení

Pokud jsem vás zahltil odborným popisem programu, omlouvám se. Nyní se podívejme na využití ve školní praxi, kde ho používáme pro tvorbu anglických učebních textů s podporou překladu. Vybraný anglický text překopírujeme v HTML editoru do dokumentu, který po uložení ve formátu HTML s využitím html2cz zpracujeme. Výsledný HTML dokument pak můžeme umístit do školního intranetu nebo na internet. Pokročilejší uživatelé si mohou vytvářet i vlastní tematické slovníky, takže při zpracování bude český překlad pouze u vybraných slov.

Závěrečné hodnocení: jediný zjištěný problém je u smíšených anglicko-českých stránek (u mne s kódováním ISO-8859-2); zde totiž dojde k nepochopitelnému chybnému zápisu českého textu. To je závažná chyba, takže celkově můžeme hodnotit jen za horší dvojku. Autor slíbil, že během několika týdnů bude k dispozici opravená a v mnoha směrech vylepšená verze, takže se můžeme těšit na další jedničkovou aplikaci.



Jan Wagner

0 komentářů:

Články dle data



Učitelské listy

Nabídka práce

Česká škola - portál pro ZŠ a SŠ

Česká škola poskytuje svým čtenářům diskusní prostor k vyjádření názorů na školskou problematiku. Tyto příspěvky se nemusí shodovat se stanoviskem redakce České školy a jsou uveřejňovány jako podnět k dalším diskusím.

Obsah článků nemusí vyjadřovat stanovisko redakce nebo vydavatele Albatros Media, a.s.


Všechna práva vyhrazena.

Tento server dodržuje právní předpisy
o ochraně osobních údajů.

ISSN 1213-6018




Licence Creative Commons

Obsah podléhá licenci Creative Commons Uveďte autora-Neužívejte dílo komerčně-Nezasahujte do díla 3.0 Česká republika, pokud není uvedeno jinak nebo nejde-li o tiskové zprávy.



WebArchiv - archiv českého webu



Tyto webové stránky používají k poskytování služeb, personalizaci reklam a analýze návštěvnosti soubory cookie. Informace o tom, jak tyto webové stránky používáte, jsou sdíleny se společností Google. Používáním těchto webových stránek souhlasíte s použitím souborů cookie.