Časopis Naše řeč
en cz

O jedné z cest moderní jazykovědy

Ivan Lutterer

[Reviews and reports]

(pdf)

-

Není tajemstvím, že nové myšlenky a postupy, které začaly do jazykovědy pronikat v posledních letech v souvislosti s aplikací matematických metod, jsou dosud částí lingvistů, zvláště starší a střední generace, přijímány s nedůvěrou, ba někdy vůbec odmítány jako tematika, která do lingvistiky nepatří. Současný vývoj vědecké metodologie však každého stále více přesvědčuje, že ani věda o jazyce se nemůže vyhýbat uplatnění nových, netradičních pojmů a metod. Nové cesty racionálnějšího zkoumání jazyka se dnes hledají a nacházejí především v uplatňování matematického přístupu (matematická lingvistika) a v automatizaci některých složek lingvistické práce. Je ke cti naší jazykovědy, že v tomto heuristickém výzkumu, pro lingvistiku svou neobvyklostí a složitostí tak náročném, nevyklidila pole matematikům, logikům a technikům, nýbrž naopak ujala se iniciativy a ve spolupráci s těmito odborníky si jako prvá z filologických disciplín osvojuje nové badatelské postupy založené na poznatcích matematiky (nejenom kvantitativní) a logiky, čímž zároveň obě tyto vědy recipročně ovlivňuje.

Jako věda typicky pomezní setkává se matematická lingvistika se zájmem odborné veřejnosti mnohem širší než jen lingvistické. Z toho pro ni plyne i po[235]měrně dobrá možnost seznamovat s výsledky svého teoretického i experimentálního studia široké vrstvy čtenářů — počínaje čtenáři odborných filologických časopisů a konče konzumenty populárních technických magazínů. Význam a praktický dosah některých prací, zvláště pak těch, které vycházejí v časopisech jazykovědných (např. v Slově a slovesnosti), však doposud oslabovala jejich malá přístupnost pro čtenáře, kteří nejsou v převážné většině speciálně matematicky vzděláni. Ze snahy o maximální obecnost užívá se totiž často formulací v podobě matematických symbolů, vzorců a grafů, a ty přirozeně znesnadňují porozumění, zůstávají-li nevysvětleny.

Přispět k odstranění tohoto nežádoucího stavu vzala si za hlavní úkol příručka Cesty moderní jazykovědy (Jazykověda a automatizace),[1] kterou pod vedením doc. Petra Sgalla napsal kolektiv autorů dílem z pracovišť universitních (D. Konečná, L. Nebeský, P. Novák, B. Palek, J. Panevová a P. Sgall), dílem akademických (Fr. Daneš, J. Štindlová, M. Těšitelová). Knížka chce seznámit s nejnovějšími jazykovědnými směry nejen lingvisty, ale i matematiky, techniky, učitele aj., zajímající se o otázky jazyka. Jakým způsobem to činí a jak se jí to daří, pokusíme se ukázat v dalších řádcích.

První oddíl Jazyk a současná společnost (s. 7—30) z pera Fr. Daneše a P. Sgalla souvisí sice s ústřední tematikou automatizace jen částečně (dost místa zabírá výklad o jazykovém rozvrstvení češtiny, o demokratizaci spisovného jazyka apod.), obsahuje však několik základních myšlenek o charakteru a postavení lingvistiky v době převratného rozvoje vědy a techniky a revolučních změn v uspořádání lidské společnosti, které jsou vhodným uvedením do celkové problematiky. Změněná situace nejenom klade jazykovědě nové úkoly (strojové překládání, informační jazyk apod.), nýbrž jí zároveň poskytuje nebývale účinné prostředky výzkumu (např. samočinné počítače a děrnoštítkové stroje), které s velkou pravděpodobností ovlivní nejen sám jazyk (směrem k větší přesnosti, jednoduchosti, pravidelnosti a internacionálnosti), ale i vztah společnosti k jazyku zdůrazněním jeho dorozumívací funkce (s. 10). Dialektiku vývoje vidí autoři v tom, že „současné směry matematicko-logické nemohou uznat za plně vědecké to poznání, které nebylo získáno nebo prověřeno jejich metodami“ (s. 7); je však potřebí zdůraznit, že dialektika je i v kontinuitě s poznáním dosaženým již dříve „nematematicky“, např. lingvistikou strukturální. Tato souvislost se mj. projevuje i tím, že výsledky matematických postupů až dosud, jak se zdá, nijak nepopírají výsledky získané metodami klasickými: rozdíl je hlavně kvantitativní, a to ve větší úplnosti a exaktnosti, ve vyšší míře formalizace a dále v tom, že se z nových aspektů objevují nově hlubší souvislosti mezi jednotlivými jevy jazyka.

Druhý oddíl Jazyk a technika (s. 31—71), který napsali D. Konečná, B. Palek a P. Sgall, podrobně ukazuje, kde všude dnes jazykověda nalézá své uplatnění. Nejde jen o soudobou sdělovací techniku, ale především o auto[236]matizaci, která je z hlediska ekonomie nejdůležitější. Celkem nejznámější aplikací je strojový překlad z jednoho jazyka do druhého. I když se dnes už obecně přijímá, že smyslem konstrukce překládacích strojů není a těžko asi kdy bude umělecký překlad dejme tomu poezie a že i při strojovém překladu terminologicky jednoznačnější literatury vědecko-technické zůstane člověku trvale úloha nejvyššího jazykového arbitra, jsou mnohem méně známy výsledky jiného rázu, které práce na přípravě strojového překladu jazykovědě přináší. Všestranný rozbor jazyka před vložením textu do stroje (tj. příprava algoritmu analýzy), jakož i řešení otázek textu výstupního (tj. příprava algoritmu syntézy) vedou k tomu, že „jsou na základě rozsáhlých textů zpracovávány jednotlivé úseky české mluvnice, že jsou prověřovány a doplňovány dosavadní poznatky o vlastnostech a vztazích jednotlivých mluvnických i lexikálních prvků češtiny a že je stavba češtiny studována i po stránce kvantitativní“ (s. 46). Jde mnohdy o zkoumání zcela nově pojaté, jak ukazuje např. syntaktická analýza, jejíž hlavní složkou je vyhledávání větné platnosti všech slovních tvarů v překládaném textu; někdy je dosti vzdáleno od pojetí známého nám ze školních mluvnic, které na rozdíl od stroje mohou počítat se samozřejmou znalostí jazyka u uživatelů a spoléhat na jejich vlastní „intuici“.

Jaké jsou další perspektivy strojového překladu? I když překládání strojem přestalo být již řadu let vědeckou fantazií, stále ještě nevyšlo ze stadia teoretického výzkumu a experimentování. Na jeho další vývoj se nyní rovněž pohlíží trochu kritičtěji než v době jeho prvních počátků. Lze jen souhlasit s názorem autorů, že je mnohem užitečnější, než z reklamních nebo jiných důvodů předkládat veřejnosti výsledky dosud provizorní, trpělivě propracovávat překladové algoritmy, které jedině mohou strojovému překladu zajistit opravdu vysokou kvalitu a konečný úspěch. Jinou otázkou je sestavování tzv. informačních jazyků (spojených s přirozeným jazykem prostřednictvím tzv. jazyka převodního), které mj. pomohou zjednodušit některé otázky týkající se automatického referování. Automatické ukládání a vyhledávání informací je činnost, kterou bude muset v budoucnosti vykonávat za každého vědce stroj, protože již dnes je stále více nad síly i časové možnosti nejen jednotlivce, ale i kolektivů, aby obsáhli všechnu potřebnou literaturu daného oboru. Vzhledem k tomu, že výzkum automatického zpracování informací nutně předpokládá úzkou spolupráci vědců z oborů mnohdy značně vzdálených, považuje se za žádoucí (s. 58), aby bylo dosaženo koordinace terminologie v nejširším slova smyslu.

Uvedení do vlastního teoretického studia matematické lingvistiky představují oddíly III a IV, jichž autory jsou L. Nebeský s P. Sgallem (Algebraická lingvistika, s. 72—102) a P. Novák s M. Těšitelovou (Kvantitativní lingvistika, s. 103—133). Jsou to partie z celé knihy nejen nejzávažnější, ale i nejsložitější. Ačkoli podle slov předmluvy autoři usilovali o výklad pokud možno přístupný i laikovi, nejsou pro matematicky méně zkušené čtenáře všechny kapitoly stejně zvládnutelné. Až při druhém čtení budou [237]asi mnohým plně srozumitelné výklady o generativní a rekognoskativní gramatice (s. 76—92) a snad i o analytických modelech (s. 92—99), a to hlavně proto, že se vyznačují poměrně vysokým stupněm abstraktnosti. Zdá se, že plynulému vnímání textu tak náročného místy vadí též jeho malá stylová vyrovnanost, někdy i terminologická nejasnost. Máme na mysli jednak způsoby vyjadřování, které ne zcela vhodně přejímají příliš specifické prostředky profesionální matematickolingvistické mluvy (např. „Uvažujme fragment češtiny s množinou slovních tvarů…“ na s. 99, „… věty, které mohou být generovány touto gramatikou“, s. 87, aj.), jednak občasné nerespektování termínů v lingvistice už ustálených (např. „otírání koncových hlásek slova“ na s. 99 a 100, „čítání prvků“ na s. 103, aj.). Chápe-li se v algebraické lingvistice např. termín „gramatika“ šíře, než je to zvykem (rozeznává se gramatika generativní — v podobě gramatiky s konečným počtem stavů, frázové gramatiky nekontextové a kontextové, dále gramatika kategoriální, rekognoskativní a transformační), je nezbytně nutné upozornit na toto rozdílné pojetí a vysvětlit je hned na samém začátku výkladu, nikoli až v jeho závěru (s. 100 a 164). Některé nejasnosti jdou na vrub všeobecné neustálenosti terminologie, o níž byla řeč už výše. Kdyby byly termíny jednoznačné, odpadla by zajisté i tato málo povzbudivá věta na s. 129: „Těmito výrazy nemíníme nic, co by mohlo připomínat stejné výrazy v kapitole II a III“.

Zastavili jsme se u těchto spíše formálních otázek poněkud déle proto, že algebraické formulace přinášejí jazykovědě podstatně vyšší úroveň logické kultury a abstrakce především tehdy, pracují-li s přesně vymezeným a jednotným pojmoslovím. Dříve totiž, než se dá určitá oblast jazyka zpracovat matematicky, musí být předem popsána, vyložena a v obecných zákonitostech vědecky zachycena dosavadním aparátem tradiční jazykovědy.

Jednou z velmi závažných otázek, jichž se dotýká oddíl o algebraické lingvistice, je otázka gramatických transformací. Ukazuje se, že pro matematickou lingvistiku nestačí jednodušší typy gramatik: z dosavadních systémů jsou pro ni nejvhodnější právě gramatiky transformační, které stojí v hierarchii gramatik a automatů na dost vysokém stupni. Její pravidla, velmi složitá a dosud ne úplně zpracovaná, umožní např. odvodit z jednoduchých vět (vymezených předem tzv. frázovou složkou) věty složitější, včetně souvětí. I když se do budoucna jeví postavení transformační složky gramatiky poněkud jiné, podružnější, otevírá se tím lingvistice nové pole činnosti, která nám snad již brzy bude moci dát definitivní odpověď na otázku, „je-li tak složitá soustava jako mluvnická stavba národního jazyka zvládnutelná matematickými prostředky“ (s. 177). Na základě všeho toho, co jsme se o algebraické lingvistice dozvěděli v kapitole III, není důvodu pochybovat o tom, že zvládnutelná je, i když zatím různé složky přirozených jazyků různou měrou odolávají formálnímu matematickému zpracování (nejvíce mu vzdoruje sémantika).

Kvantitativní lingvistika patří, jak se na s. 103 vhodně připomíná, k oblastem matematické lingvistiky s nejdelší tradicí. S kvantitativními hledisky [238](hlavně s frekvencí) začalo se u nás pracovat už před několika desetiletími ve fonologii (V. Mathesius, B. Trnka, J. Vachek aj.), ve slovní zásobě a morfologii (V. Šmilauer aj.), řidčeji v syntaxi. Autoři správně zdůrazňují, že ze studia jazykové entropie a redundance, jež jsou základními kategoriemi teorie informace, bude možno udělat vpravdě lingvistickou záležitost teprve tehdy, až se tyto číselné ukazatele relativních četností a nadbytečných znaků organicky začlení do ostatních poznatků o jazyce (s. 124). Vůbec se dá říci, že těžištěm celého dalšího vývoje kvantitativní lingvistiky by mělo být zvládnutí klasické problematiky jazykovědné, na prvním místě nepochybně typologie a stylistiky. Tak si její další perspektivy představují i sami autoři (s. 133). V pátém oddíle Mechanizace a automatizace v lingvistické práci (s. 134 až 159), názorně zpracovaném J. Panevovou, P. Sgallem a J. Štindlovou, dostává se čtenáři základního poučení o využití strojů v automatizaci lingvistického výzkumu (samočinné počítače) a vůbec v jeho zhospodárnění (děrnoštítkové stroje). Důležitost metody děrných štítků pro všestranné zpracování většího množství lingvistických údajů získaných např. excerpcí je v tom, že dovoluje kombinovat a konfrontovat nejrůznější kritéria, aniž se při tom poruší základní třídicí princip excerpční sbírky (abecední nebo věcný). Takovou výhodu ocení např. pracovníci v onomastice, kteří zpracovávají rozsáhlý názvoslovný materiál z hlediska slovotvorného,[2] a vůbec každý, kdo se zabývá studiem tvoření slov, etymologií apod.

Abstraktní matematické postupy v teorii a prostředky mechanizace a automatizace v praxi dávají jazykovědě nové možnosti (s. 165). Bohemistice se tu nabízí především řešení dvou úkolů: stručně řečeno půjde jednak o popis struktury češtiny formou generativní gramatiky, v němž se získají podklady pro objektivnější hodnocení podobností a rozdílů mezi různými útvary českého jazyka, jednak o zjištění vývojového pohybu v běžně mluvené češtině po stránce kvantitativní (pomocí moderních technických prostředků).

Těžko říci, zda po prostudování příručky bude mít každý čtenář dokonale jasno ve všech otázkách, o kterých potřeboval poučení. S plnou jistotou však můžeme tvrdit, že z jejího studia nabude každý pevného přesvědčení, že nové směry mají v soudobé lingvistice již své trvalé místo a že na jejich dalším rozvoji závisí ve velké míře jak teoretický pokrok jazykovědy jako celku, tak i růst její praktické užitelnosti pro společnost budoucích desetiletí.


[1] Malá moderní encyklopedie, sv. 47, Orbis, Praha 1964, stran 195.

[2] Viz V. Zlatohlávek, O možnostech strojového zpracování toponomastického materiálu, Zpravodaj místopisné komise ČSAV, roč. VI, 1965, 35—40.

Naše řeč, volume 48 (1965), issue 4, pp. 234-238

Previous Miloš Dokulil: Pozoruhodná slovenská práce o stavbě slova

Next Jarmila Syrovátková: Teorie informace a jazykověda