Časopis Naše řeč
en cz

První pokus se strojovým překladem v Československu

Dana Konečná

[Reviews and reports]

(pdf)

-

Ve Výzkumném ústavu matematických strojů byl 12. ledna 1960 proveden první pokus strojového překladu s použitím československého samočinného počítače SAPO. Jazykovou přípravu překladu provedla skupina pracovníků oddělení pro teorii strojového překladu při katedře českého jazyka, obecného jazykozpytu a fonetiky na filosofické fakultě Karlovy university (P. Sgall, P. Novák, B. Palek, D. Konečná), „program“ pro práci stroje připravila inž. K. Korvasová z Výzkumného ústavu matematických strojů.

Příprava pokusu v podstatě vycházela ze zpracování tří jednoduchých anglických vět, vybraných celkem nahodile z referátu [110]E. Fischerové-Jörgensenové na mezinárodním lingvistickém kongresu v Oslo r. 1958. Především byl sestaven slovník těchto vět, obsahující dohromady jen 40 slov. Otázky mnohoznačnosti slov při tomto pokusu řešeny nebyly, pro každé anglické slovo byl vybrán jen jeden český ekvivalent. Anglický slovník byl pak přenesen na děrné štítky (jimiž je prozatím ještě nutno ukládat do stroje vstupní informace) s použitím číselného kódu tak, aby na každém štítku bylo pouze jedno anglické slovo, a pro každé anglické slovo byl kromě toho zpracován další štítek, obsahující údaje o jeho slovním druhu a dále o mluvnické charakteristice (podle potřeby rod, vzor, vazba atd.) jeho českého ekvivalentu. Vedle toho bylo třeba zajistit, aby do „paměti“ stroje byl uložen anglický slovník tak, aby v něm stroj pomocí jednoduchých aritmetických operací (odčítání) mohl automaticky sám hledat.

Největší pozornost v přípravě překladu musela být věnována tomu, podle jakých informací může stroj určit mluvnické kategorie a syntaktickou funkci daného slova tak, aby měl potom v „paměti“ zaznamenány všechny údaje, které jsou nutné jako podklad pro syntézu správné české věty. Při jazykovědné části přípravy takových „pokynů“ je třeba vycházet z toho, že stroj větě „nerozumí“, že může pracovat pouze s informacemi danými jen formální stránkou, jako je forma jednotlivých slov, pořadí slov v textu (slovosled), formální stránka slovního druhu, rekce atd. Při přípravě pokusu byla z tohoto hlediska zpracována otázka správného určení anglických složených tvarů slovesných, otázka, kdy je anglické slovo, které může být buď podstatným jménem, nebo přídavným jménem, jménem podstatným a kdy přídavným aj. Dále musela být řešena otázka, jaké údaje z české mluvnické stavby mohou být vloženy do stroje, který má poměrně malou kapacitu „paměti“, a byly zpracovány pokyny pro sestavení české věty z údajů, které může stroj získat z anglické věty, a z údajů o české mluvnici. Pokyny vypracované lingvisty bylo třeba zapsat do instrukcí, kterých se používá při sestavování „programu“ pro práci stroje, což už není záležitost lingvistická.

Výstup samočinného počítače SAPO není spojen s tiskacím strojem, výstupní informace vycházejí opět na děrných štítcích (stroje, které budou v budoucnu skutečně překládat, si také natisknou překlad v písmenech). Při uvedeném pokusu byl výstupní text české věty zapsán na děrných štítcích pomocí jednoduchého kódu, tj. každému písmenu odpovídalo pětimístné číslo, složené pouze ze dvou znaků (O a I), např. A = OOIII, B = OIOOO, C = OIOOI atd.

„Program“ byl vypracován tak, že umožnil překlad nejen vybraných tří vět, ale i překlad některých jednoduchých vět dalších, které obsahují různé kombinace slov obsažených ve vybraných větách, [111]a to překlad bez jediné chyby proti české spisovné normě. První věta zněla v anglickém originále: The consonants have not by far been investigated to the same extent as the vowels. V českém překladu pak: Souhlásky zdaleka nebyly prozkoumány do stejné míry jako samohlásky.

Cílem pokusu nebylo dokázat možnost strojového překladu vůbec. Ta byla dokázána v USA a v SSSR již před šesti lety. Nešlo také jen o ukázku toho, že dnes i v ČSR máme své vlastní technické vymoženosti, které mohou člověku pomáhat i při duševní práci (ostatně SAPO se k překládání pro praxi nehodí; ale již druhý československý samočinný počítač EPOS, který bude do konce třetí pětiletky dán do sériové výroby, bude pro překlad mnohem vhodnější — bude mít mnohem větší kapacitu „paměti“ i operační rychlost). Snahou lingvistů, kteří pokus připravovali, bylo získat za pomoci inženýrů přímé zkušenosti z přípravy strojového překladu a ověřit si správnost svého metodického postupu. Podrobněji chceme čtenáře informovat o těchto zkušenostech v příštím čísle Naší řeči.

Naše řeč, volume 43 (1960), issue 3-4, pp. 109-111

Previous Václav Vážný: Nová lexikální monografie z nářeční oblasti moravské

Next Zoe Hauptová, Karel Hausenblas: Maďarská konference o jazykové kultuře