Jak posuzovat počítačové slovníky a překladače

Člověk |

Následující text vychází především z poznatků zjištěných během mé diplomové práce na katedře informačního a znalostního inženýrství Vysoké školy ekonomické v Praze. ...




Následující text vychází především z poznatků zjištěných během mé diplomové práce na katedře informačního a znalostního inženýrství Vysoké školy ekonomické v Praze.
V praktické části diplomové práce bylo mým úkolem posoudit jak (polo)automatické překladače textů, tak i podpůrný slovníkový software. V rámci první kategorie jsem testoval následující produkty: SKIK 3.0, PC Translator 9.0 a PC Translator 98, Transen 1.3 CZ, Eurotran 98 a Aces 3.0. Ve slovníkovém softwaru se dostalo na Prodict 98, GED 6.1, YAP 4.0, LEDA a slovníky firmy Commercial Service.
Soustředil jsem se především na pomoc, kterou tyto nástroje dokáží poskytnout při překladu anglicky psaného textu, zabývajícího se ekonomickou problematikou.
Celá oblast nástrojů strojového překladu se velmi rychle vyvíjí. Výsledky této diplomové práce budou jistě za rok či dva poněkud zastaralé, avšak principy a hlediska, podle nichž se jednotlivé produkty hodnotí, zůstávají stejné.

V rámci víceméně uživatelského testu jsem posuzoval následující vlastnosti:
kvalita překladu
slovník
délka dat
snadnost instalace
uživatelská přívětivost
cena

Slovník a kvalita překladu
Základním kritériem pro velikost slovníku je počet slov, respektive rozsah slovní zásoby. Jednotliví výrobci bohužel chápou tento pojem značně odlišně. Kritérium slovní zásoby je velmi zkresleno rozdílným chápáním pojmu "slovníkové heslo" někteří výrobci uvádějí jako jedno heslo např. slovo "go" a vše, co je za ním, někteří však slovníkovými hesly rozumí i "podhesla" jako např. "go behind", "go for", "go into", atd…
Někteří výrobci dokonce jako hesla zvláště počítají i jednotlivé slovníkové dvojice "ekvivalentů", např. jak go jít, tak go jet, atd. Potom například nemusí existovat žádný rozdíl mezi rozsahem slovní zásoby 100 000 slov u výrobce, který počítal pouze základní hesla a např. 450 000 slov u výrobce, který zahrnul pod pojem "slovníkové heslo" i všechna podhesla. Bohužel dnes nemáme žádnou normu, která by s pojmem "slovníkové heslo" zacházela, a tak se tedy mnoho výrobců snaží navodit mylný dojem a stále ohromuje potencionální zákazníky "obří" slovní zásobou ve svých produktech.

Uživatelské slovníky
Aplikace obvykle umožňuje uživateli vytvářet si vlastní slovník. Zajímavou otázkou je, zda by měla umožnit i zásahy do slovníku základního. Odpověď ano znamená potenciální riziko řady překlepů a obtížně odstranitelných inkonzistencí. Eurotran vše např. řeší tak, že zásah do základního slovníku neumožňuje. Důsledkem je pak skutečnost, že nemůžeme měnit již jednou předdefinovaná slova (můžeme je sice zadat do našeho uživatelského slovníku, ale program stejně přednostně hledá ve slovníku základním).

Rozhraní
Standardně mají podobné programy uživatelské rozhraní v podobě dvou oken, v jednom z nich je text zdrojový a v jednom výsledek programu. Pokročilejší programy umožňují začátek výstupního textu editovat ještě za běhu programu tedy ještě než se dokončí celý překlad.
Patrně jednou z nejlepších vlastností editoru Eurotranu je volitelný způsob rolování textů uživatel si může nastavit synchronní rolování obou obrazovek, což velmi usnadňuje orientaci.
Zajímavostí je také podoba PC Translatoru s třemi okny. Střední okno pak slouží jako jakási pracovní plocha, kam program zapisuje postupně překládaná slova, uživatel si vybírá správný význam, mění slovosled atd.
Některé slovníky umožňují i vyhledávání pomocí hvězdičkové konvence a logických operátorů.
K nevýhodám patří skutečnost, že některé překladače umožňují zadávání textu pouze ve formátu ASCII. Ne vždy je také dostatečně podporována prá-ce se schránkou (zejména u verzí překladačů pocházejících ještě z DOSové éry). Raritou v záporném smyslu je pak Transen 1.3 CZ, v němž již nemůžeme opravovat text poté, co nám při postupném rolování utekl z obrazovky.

Další kritéria
Sem samozřejmě patří cena produktu, snadnost instalace, datová náročnost slovníku…

Celkové hodnocení
Hodnocení slovníků a překladačů jsem prováděl především z hlediska uživatele zaměřeného na texty ekonomického charakteru. Navíc jsem se soustředil především na překlady do češtiny (Eurotran však neumí překládat texty z češtiny do angličtiny, přičemž tato jednosměrnost je jeho zřejmě nejvážnější vadou).
Nejdůležitějším hlediskem při hodnocení počítačových překladačů je samozřejmě výstup programu, tzn. kvalita překladu společně s cenou. Kritéria hodnocení slovníků jsou obdobná jako u překladačů. Velmi důležitým faktorem je zde také způsob vlastní práce se slovníkem a možnosti vytváření uživatelských slovníků.
Je samozřejmé, že pro relevanci hodnocení mají zásadní význam relativní váhy jednotlivých kritérií stanovených v tabulce (kvalitě překladu u překladačů odpovídá např. váha 30 %, stejně jako ceně). Pokud by tyto relativní váhy byly stanoveny jinak, bylo by samozřejmě zcela odlišné i výsledné pořadí.
Přesto myslím, že některé z mých závěrů mají i obecnější platnost. Sem patří zejména zjištění, že zatímco na poli nástrojů pro počítačovou podporu překladu jsem shledal významné rozdíly, pořadí na poli slovníků nebylo zdaleka jednoznačné (viz závěrečné tabulky). Velmi příjemným překvapením pro mě bylo, že všech pět zkoumaných slovníků mělo velmi dobrý standard, rozdíly mezi nimi byly velmi malé a kvalita překladů byla téměř bezchybná. O vzájemném pořadí tak vedle kvality překladu a způsobu práce se slovníkem rozhodovala především cena produktů, rozsah slovní zásoby, ale také takové nuance jako grafické zpracování programu, způsob instalace a délka dat na disku.
Jelikož kvalita překladu a příjemnost práce se všemi slovníky byla velmi podobná a nepříliš odlišná a jelikož všechny slovníky obsahovaly alespoň přikoupitelné kvalitní ekonomické nadstavby, zcela překvapivě mohu doporučit k užívání všechny posuzované produkty.








Související články




Komentáře

31.07.2014, 16:17

.... good!...

Napsat vlastní komentář

Pro přidání příspěvku do diskuze se prosím přihlašte v pravém horním rohu, nebo se prosím nejprve registrujte.