Časopis Naše řeč
en cz

Český retrográdní slovník

Helena Confortiová

[Posudky a zprávy]

(pdf)

-

Využívání počítačů v lingvistice se stává v současné době stále běžnějším jevem. Některé typy lingvistických prací jsou bez použití moderní výpočetní techniky dnes již téměř nemyslitelné, jako např. tzv. retrográdní slovníky, tj. slovníky uspo[82]řádané abecedně podle pravé strany slova, tedy a tergo (odzadu). R. 1975 vyšel u nás Retrográdní morfematický slovník češtiny od E. Slavíčkové. Tento slovník, jako ostatně většina retrográdních slovníků, byl zpracován na základě dvojjazyčného slovníku (česko-německého), doplněn lexémy ze Stručného etymologického slovníku (Praha 1968) a konfrontován se Slovníkem spisovného jazyka českého (Praha 1960—71). Slovník Slavíčkové byl morfematický, tj. uváděl slova rozčleněná podle morfémů kořenových, příponových a předponových a byl zpracován na počítači.

Nedávno vyšel Retrográdní slovník současné češtiny (dále RSSČ) autorů M. Těšitelové, J. Petra a J. Králíka (Academia, Praha 1986, 528 s.). Tento slovník se liší — jak sami autoři v úvodu upozorňují — od jiných retrográdních slovníků především tím, že uvádí u všech jednotek absolutní frekvenci zjištěnou v korpusu obsahujícím 540 000 slov ze současného jazyka, a to z oblasti věcného stylu, takže vlastně jde o frekvenční retrográdní slovník. Dále se RSSČ liší tím, že kromě lexikálních jednotek všech slovních druhů uvádí — opět s absolutní frekvencí — všechny doložené tvary substantiv a sloves, tedy frekvenci všech morfologických kategorií těchto dvou základních slovních druhů. Materiál, z kterého RSSČ čerpá, byl zpracován z kvantitativního hlediska už mnoha způsoby.[1] RSSČ je tedy jedním z důležitých výsledků všestranné analýzy současného jazyka se zaměřením na styl věcný z kvantitativního hlediska.[2]

RSSČ vychází důsledně z analýzy textů současné češtiny, tzn. uvádí slovo v kontextu (výběry z textů tvořily 3000 slov). Nutno podtrhnout, že byly analyzovány nejen texty psané, ale i mluvené projevy, které představují celou jednu třetinu materiálu. I v tom lze spatřovat přínos slovníku. Frekvence uváděná u lexémů je objektivním ukazatelem jejich postavení ve fungování slovní zásoby, nikoli v jejím systému. J. Mistrík ve svém retrográdním slovníku slovenštiny (RSS)[3] užil jen zčásti frekvence slov (ze svého frekvenčního slovníku slovenštiny), jeho seznam obsahuje hesla hlavně ze slovenského akademického slovníku, doplněná dalšími prameny, a těmto slovům přiřadil teoretickou frekvenci 1 (srov. charakteristiku RSS v recenzi H. Confortiové v NŘ 71, 1988, s. 147). Pokud v RSSČ má slovo frekvenci 1, znamená to, že se v 180 textech (100 z oblasti odborné češtiny, 60 z publicistiky a 20 z administrativy) vyskytlo opravdu jen 1×, např. jodid, dekorační, naočkovat. — V úvodu k RSSČ jsou dále charakterizovány jednotlivé části slovníku, jsou vysvětleny příslušné kódy a technika zpracování; k nim [83]jsou připojeny metodické pokyny, jak jednotlivých části slovníku užívat.

RSSČ se skládá ze tří částí: V první části je na 136 stranách uveden seznam všech doložených lexémů. Každé slovo je označeno dvoumístným kódem; ten především charakterizuje slovní druh, popř. jeho původ, např. 12 označuje substantivum adjektivní, 14 substantivum číslovkové, 63 adverbium zájmenné, 78 předložku sekundární apod. Tím je vyloučena záměna homonym slovních druhů (např. vedle jako předložka se vyskytlo 116×, jako příslovce 3×; ráno jako substantivum 11×, jako příslovce 33×[4]). V slovníku lexémů můžeme sledovat např. konkurenci adverbií se zakončením -e/-o, srov. hluboce 18×, hluboko 4×; vysoce 43×, vysoko 10×; dalece 4×, daleko 82×; těžce 7×, těžko 64×. Lze tu sledovat i proces konstituování částic (a jako částice se vyskytlo 321×, jako spojka 19 017×; tak jako částice 207×, jako příslovce 1415× a jako spojka 213×), nebo utváření sekundárních předložek (v závislosti na, v návaznosti na, s ohledem na, vzhledem na atd.). U sloves je důsledně označován vid (nedokonavý nebo dokonavý), srov. žádati 63×, požádati 29×. — Ve druhé části nacházíme retrográdní seznam všech tvarů substantiv, kód o šesti až osmi místech umožňuje rozlišit morfologická homonyma (viz níže). Tato část je nejrozsáhlejší, obsahuje 237 stran. — Ve třetí části je seznam tvarů všech doložených sloves (100 stran). Kód (čtyřmístný až osmimístný) umožňuje rovněž rozlišit tvarová homonyma. Srovnáme-li způsob zpracování tvarů slov v češtině a ve slovenštině (viz retrográdní seznam tvarů slov ve FTKS[5]), zjistíme, že Mistrík uvádí sice tvary všech slovních druhů, tedy nejen substantiv a sloves, ale nerozlišuje morfologická homonyma (např. tvary, čítanie aj.).

V retrográdním seznamu tvarů substantiv (druhá část) můžeme sledovat nejen frekvenci tvarů v jednotlivých pádech (např. tvary 6. p. mn. č. -ách, -ech, -ích ap.), ale i homonymii jednotlivých tvarů, např. tvar učitele zahrnuje jako bezpředložkový pád 12× 2. p. j. č., 5× 4. p. mn. č. a 2× 4. p. j. č., jako předložkový pak 2× 4. p. mn. č., 1× 2. p. j. č. a 1× 4. p. j. č. RSSČ je i v tomto průkopnickým dílem, protože takové rozlišení (zejména pády prosté a předložkové) v jiných slovnících nenacházíme.[6] Z kódu můžeme dále vyčíst, že např. 6. p. j. č. s předložkou u slova den, tedy ve dne, se vyskytuje 7×, zatímco předložkový 2. p. j. č. 41× (např. dopis ze dne), nejčastější je ovšem prostý 2. p. j. č. (dne …) — 101×. Tyto charakteristiky jsou uváděny i u jmen nesklonných; v RSSČ se např. dočteme, že slovo relé se vyskytuje ve větě ve funkci 1. p. j. č. 11×, 1. p. mn. č. 2×, 7. p. j. č. 3× atd. U tvaru činitele zjistíme, že toto slovo se vyskytlo jako [84]životné 7×, jako neživotné 13× atd. O tom, že takto roztříděná frekvence tvaru může sloužit účelům didaktickým, netřeba pochybovat.

V retrográdním frekvenčním seznamu slovesných tvarů (třetí část) můžeme najít bohatý repertoár sloves, která mají např. ve 3. os. mn. č. přít. č. tvar -ejí (od obracejí až po nepřihlížejí), nebo -ějí (od vyrábějí po šedivějí). Nebo např. tvar zapsala reprezentuje 3. os. j. č. min. č. pro žen. rod, z toho 4× formu aktivní, tedy zapsala, 3× formu pasivní, tedy zapsala se. Všechny formy jsou pochopitelně rozlišeny kódem. Podobně zjistíme, že tvar připravujeme se vyskytuje 7×, připravujeme se — 3×, zatímco u slovesa dostávat je poměr opačný: dostáváme nacházíme 12 ×, dostáváme se 22 ×.

Kromě tvarů substantiv a sloves byly zpracovány retrográdně i tvary adjektiv; mezi ně byla podle formy zařazena i zájmena a číslovky adjektivní povahy. Z technických důvodů však bohužel nemohly být do RSSČ zařazeny, byly proto publikovány samostatně.[7] Lze litovat, že RSTA vyšel jen jako interní tisk v omezeném nákladu, veřejnost by jeho vydání jistě uvítala. Tvoří totiž s RSSČ nedílný celek.

Závěrem bychom chtěli zdůraznit novátorský přínos RSSČ. Způsob, jakým je uspořádán, dává široké možnosti jeho využití jak pro účely praktické (zejména pedagogické a didaktické, např. pro přípravu učebnic), tak pro účely teoretické: na jeho základě je možno zabývat se v širokém rozsahu slovotvorbou (studovat nejen sufixy, ale i prefixy, srov. odvozeniny slovesa psát: napsat, zapsat, předepsat, odepsat, podepsat, přepsat, sepsat, rozepsat, připsat, opsat, dopsat, popsat, upsat, vypsat); dále je možno studovat jevy morfologické (tvary základních ohebných druhů slov), syntaktické (prostřednictvím pádových koncovek) i pravopisné (příklady pro pravopisné příručky). Je jasné, že retrográdní slovník poslouží i jako příprava pro automatickou morfologickou analýzu při strojovém zpracování jazyka. Nutno také pochválit vynikající grafickou úpravu RSSČ: slova mají zarážku na pravé straně (u retrográdního slovníku Slavíčkové byla zarážka vlevo, čímž byl zpětný pohled ztížen), kód i frekvence se nacházejí vedle slova odděleně vpravo. To vše umožňuje dobrou orientaci ve slovníku a napomáhá lehčeji překonat nezvyk číst slova od pravé strany, tj. odzadu.


[1] Srov. řadu Linguistica, zejm. svazky II, III, IV, VII a XV, dále recenzi M. Těšitelové v NŘ 67, 1984, s. 47—50, a V. Vlkové v NŘ 69, 1986, s. 143—145.

[2] Připomeňme relativně úplný kvantitativní popis současné češtiny na základních jazykových rovinách v kolektivní monografii Kvantitativní charakteristiky současné češtiny, Praha 1985, recenzi J. Petra o této publikaci v NŘ 69, 1986, s. 29—32, nebo populární publikaci obsahující i kvantitativní analýzu sémantiky slov — O češtině v číslech, Praha 1987.

[3] J. Mistrík, Retrográdny slovník slovenčiny, Bratislava 1976.

[4] Český frekvenční slovník (J. Jelínek — J. V. Bečka — M. Těšitelová, Frekvence slov, slovních druhů a tvarů v českém jazyce, Praha 1961) slovní homonyma většinou neoznačoval (zvláště příslovce a předložky, ale snažil se o to, srov. právě u slova ráno : substantivum 265×, příslovce 235×).

[5] J. Mistrík, Frekvencia tvarov a konštrukcií v slovenčine (dále FTKS), Bratislava 1985; recenze H. Confortiové v NŘ 71, 1988, s. 145—150.

[6] Ve FTKS Mistrík uvádí v přehledných tabulkách sice frekvenční údaje pádů bezpředložkových a předložkových, v seznamu „slovotvarů“ však toto rozlišení nemá.

[7] M. Těšitelová — J. Petr — J. Králík, Retrográdní slovník tvarů adjektiv v současné češtině, ÚJČ ČSAV, Praha 1985 (264 s., dále RSTA).

Naše řeč, ročník 72 (1989), číslo 2, s. 81-84

Předchozí Mirek Čejka, Dušan Šlosar: První svazek akademické Mluvnice češtiny

Následující Věra Petráčková: Nový příspěvek k dějinám slovníkářství