reklama

Konverzačním příručkám a tištěným slovníkům už, zdá se, odzvonilo. Nedávný průzkum organizace British Council odhalil, že téměř dvě třetiny lidí ve věku mezi 16 a 34 lety se na svých cestách do zahraniční spoléhají na překladové aplikace. Jedním z favoritů je samozřejmě Google Translate, mezi dalšími se objevuje například Microsoft Translator.

V létě jeden uživatel Google Translate našel chybu v překladu, když 18krát za sebou napsal slovo dog, což mu překladač vysvětlil jako zprávu, která v maorštině tvrdila, že brzy přijde konec světa a Ježíšův návrat.

Jak vlastně chybné překlady v překladových aplikacích vznikají?

1) Homografy

Velkým problémem je, že slova nemají jen jeden význam. Tzv. homografy (slova, která se píší stejně, ale vyslovují odlišně) sice v češtině nejsou tak časté jako například v angličtině nebo jiných světových jazycích, nicméně jsou to právě tato slova, která komplikují především strojové překlady.

Aby se překladové aplikace vyvarovaly chybných překladů, jsou naprogramovány tak, aby vycházely z databází již přeložených textů a na základě kontextu, v jakém bylo dané slovo použito, se snaží vybrat správný význam.

Klíčem k přesnějším překladům mají být tzv. neuronové sítě a statistický strojový překlad. Podle serveru bbc.com by strojový překlad tímto způsobem podobně jako člověk překládal text nejprve „na hrubo", a poté si prošel různé texty, porovnal různé kontexty a na základě statistických výsledků by vybral správný význam.

2) Minoritní jazyky

Pokud má aplikace překládat mezi dvěma jazyky, pro které neexistuje dostatečně široká databáze přeložených textů, ze kterých by se dalo poučit o kontextech a možných významech slov, obtížnost překladu se jen zvyšuje.

Samozřejmě je zde možnost překládat nejdříve do angličtiny a z angličtiny do dalšího z minoritních jazyků, ovšem tímto způsobem by jen docházelo ke zbytečným chybám.

I v minoritních jazycích je vždy minimálně jeden dokument, který má své téměř totožné verze i v jiných jazycích, a tím je Bible. Spoléhat se ale na to, že na základě starých dokumentů se dá přeložit text dnešní by bylo příliš idealistické jak z hlediska obsahového, tak i z hlediska stylistického.

Nový projekt, na kterém spolupracují zaměstnanci Facebooku a Sorbonne University v Paříži se na problém strojového překladu zaměřili z jiného úhlu. Do databází neukládají texty přeložené nýbrž jakékoliv texty, resp. věty, přičemž systém sleduje určité vztahy, v jakých se daná slova objevují.

Například slova catfurry se často objevují v podobném vztahu jako španělská slova gatopeludo. Systém se tyto vzorce naučí, a pak je uplatňuje při překládání. Zpětně si systém svou verzi překladu kontroluje v různých kontextech, než dojde k závěrečnému výsledku.

Tato technika by mohla najít své uplatnění nejen v překladu dnešních jazyků, ale i v překladech z jazyků mrtvých nebo jazyků doposud nerozluštěných. Otázkou však znovu je, jestli existuje dost textů, ze kterých by se dala databáze vytvořit.