Časopis Naše řeč
en cz

Frekvenční slovník slovenštiny

Jiří Kraus

[Reviews and reports]

(pdf)

-

Frekvenční slovníky představují významný krok na cestě k hlubšímu poznání slovní zásoby jazyka, její struktury a fungování. Autoři těchto slovníků sledují jednak cíle praktické, které převládaly zvláště v počátečních obdobích kvantitativního rozboru jazyka, jednak cíle teoretické. Jozef Mistrík, jehož slovník Frekvencia slov v slovenčine vyšel roku 1969 v Bratislavě, tyto cíle shrnuje do těchto okruhů: 1. poskytovat číselné podklady pro poznání slovenštiny jako typologicky i strukturně svébytného jazyka, 2. poskytovat potřebné údaje pro další kvantitativní výzkum, pro překladatelské a stenografické stroje budoucnosti, 3. poskytovat číselné údaje o slovní frekvenci pro [274]potřeby pedagogiky, psychologie, lékařství, fyziky, těsnopisu a pro potřeby těch pracovníků, jimž je jazyk pracovním nástrojem, 4. učit správně interpretovat číselné údaje a zapojovat je do poznání funkční struktury jazyka.

Slovník založený na výběru z textů o rozsahu jednoho miliónu slov je rozdělen do šesti kapitol. První (Informačná časť) obsahuje přehled a stručný popis nejvýznamnějších světových prací o frekvenci slov a výklad celkové koncepce díla se zřetelem na zastoupení jednotlivých stylových vrstev a tematických okruhů, na uspořádání slov ve slovníku a na volbu kvantitativních lexikálních charakteristik. Druhá kapitola (Teoretická časť) se zabývá rozložením slov v jazykovém systému, které autor nazývá vertikálním, a v textu, které jmenuje rozložením horizontálním. Výsledkem vertikálního členění je seskupení slov do významových a frekvenčních skupin. První skupinu představují tzv. slova konstrukční (v podstatě gramatická — předložky, spojky, sponová slovesa, zájmenná slova typu ten, který), která ve frekvenčním pořadí zaujímají 1.-20. místo, následují slova subjektivně situační (modální slovesa, zájmena a zájmenná příslovce, substantiva, adjektiva a slovesa se širokým významem) na 21.-70. místě, dále slova, která Mistrík nazývá gnómickými (číslovky, číselná a hodnotící příslovce), a konečně slova tematická a odborná vztahující se k tematice vybraných textů. V rámci rozložení horizontálního se probírá index opakování (vztah počtu slov různých k celkovému rozsahu textu) a tzv. index gravitnosti jako stupeň frekvenční aktivity nejčastějších slov, který se opírá o množství slovních jednotek, jež se ve zkoumaném souboru vyskytují více než jednou, tj. těch, kterých autor užívá „suverénně“. Opakem této míry je index výlučnosti (exkvizitnosti), jehož základním parametrem je počet slov s frekvencí 1. Zatímco index gravitnosti charakterizuje tematickou homogennost vyjadřování, naznačuje index výlučnosti jeho lexikální pestrost a tematickou rozptýlenost. Třetí část, popisná, se zabývá převážně vztahy mezi číselnými charakteristikami slov v jednotlivých oddílech slovníku.

Jádrem díla jsou kapitoly IV. — Frekvenčný slovník slovenčiny — a V. — Abecedný slovník s údajmi o frekvencii slov v slovenčine. Frekvenční slovník obsahuje 9 568 nejčastěji užívaných slovenských slov (s relativní četností 3 a výše), doprovázených číselnými údaji o pořadí, absolutní četnosti výskytu a četnosti relativní. V kapitole V. je uvedeno 21 823 nejčetnějších slov v abecedním uspořádání. Kvantitativní údaje u těchto slov představují absolutní četnost v textech [275]o rozsahu 1 000 000 slov, počet oddílů slovníku (tj. 1-5) a počet děl, v nichž se slovo vyskytlo (tj. 1-60). Následující charakteristiky udávají konkrétní četnosti slov ve skupinách, a to v dialogu, beletrii, poezii, žurnalistice a ve vědecké próze. Závěrečný, VI. oddíl uvádí zajímavé porovnání nejčastějších 500 slov v osmi cizojazyčných frekvenčních slovnících — anglickém (Thorndikově), českém (Jelínka, Bečky, Těšitelové), francouzském (Vander Bekově), německém (Meierově), polském (Pisarkově), ruském (Zasorinové), španělském a rumunském (Juillandově).

Mistríkovy teoretické výklady směřují převážně k objasnění kvantitativní reprezentativnosti slovníku pro současnou slovenštinu. Přehled navrhovaných kvantitativních charakteristik a ukázky aplikace statistických metod představují originálně pojatou koncepci, která teoreticky zobecňuje zkoumaný empirický materiál. Bohužel méně místa se v úvodní části věnuje problematice reprezentativnosti kvalitativní, spočívající ve snaze o přiměřené zastoupení objektivních stylů (a z nich nejzávažnějších stylů funkčních), žánrů a jednotlivých tematických oblastí. Autor se rozhodl zařadit 60 děl v těchto okruzích (v závorce se uvádí podíl zkoumaného materiálu v procentech): (1) jevištní dialogy (10,53), (2) umělecká próza (30,17), (3) poezie (13,22), (4) žurnalistika (14,58) a (5) vědecká próza (31,5). Tato snaha o co nejrovnoměrnější rozložení jednotlivých okruhů současného jazyka (excerpce zahrnovala literaturu vydanou v rozmezí let 1922-1966) je však omezována řadou činitelů; zmíníme se zde alespoň o dvou z nich.

Z hlediska výběru slovní zásoby pro frekvenční slovník můžeme rozlišovat texty stylově uzavřené a stylově otevřené. Texty stylově uzavřené jsou funkčně i jazykově stejnorodé, nepřekračují v podstatě hranice těch vlastností (žánrů, stylových postupů, tematických okruhů), na jejichž splnění jejich začlenění do výběru záviselo. Takovým textem je např. v českém frekvenčním slovníku[1] úzce odborná Chocholova kniha Spalovací motory, ve slovníku Mistríkově Hrnčiarova skripta Organická chémia. Zařazení těchto souborů musí být voleno velmi citlivě, aby výrazně neovlivnily výsledný obraz slovní zásoby ve frekvenčním slovníku. Podíl termínů v dílech s úzce vymezeným tématem je zřetelný především v údajích o absolutních četnostech tematických slov, která převažují na vzdálenějších místech frekvenčního pořadí, a musí být omezován vhodnou volbou číselné charakte[276]ristiky, jakou je v daném případě Mistríkova relativní frekvence, vycházející z rovnoměrného zastoupení slov ve skupinách (v českém frekvenčním slovníku je touto charakteristikou počet knih, popř. počet stylových okruhů, v nichž slovo vystupuje). Výběry stylově otevřené naopak přesahují své hranice, často záměrně, a zastupují ty situace sdělování, které bývají vymezitelné jen s obtížemi. Takovouto „přesahovou“ úlohu mají např. dramata, která reprezentují jak uměleckou stylizaci, tak hovorový dialog. Podobně je tomu u poezie, zasahující přibližně rovnoměrným způsobem oblast lyrického intimního sdělování, jakož i nejrozmanitější tematiku společenského života. Složité jsou též vztahy v zastoupení umělecké prózy, jejichž slovní zásoba může zahrnovat téměř všechny tematické okruhy. Někdy se dokonce odklon od nejobvyklejších postupů umělecké prózy stává výrazným prostředkem stylistickým; tak je tomu např. při zdůrazňování stroze informativního slohového postupu v dílech V. Linhartové a B. Párala, v případě prací zvolených Mistríkem u žurnalisticky laděného výkladu v Mináčově románu Tmavý kút. Protiklad obou druhů textů představuje závažné hledisko výběru, protože otevřené texty mohou vyvažovat odstředivé tendence textů uzavřených jenom při jisté početní převaze, jejíž konkrétní číselné vyjádření zůstává veličinou dosud neznámou.

Druhým činitelem výběru, který dosavadní frekvenční slovníky, alespoň pokud je nám známo, většinou neřeší, je vztah základního souboru textů k uživatelům jazyka. Řešení praktické můžeme nalézt např. ve frekvenčním slovníku češtiny, který směřuje výrazně k zřetelům pedagogickým, a to zvláště zařazením skupiny obsazující literaturu pro mládež[2] (autoři slovníku byli pracovníky Výzkumného ústavu pedagogického), popř. ve frekvenčních slovnících převážně jednoúčelových (tak je tomu např. u slovníku J. Čápa - K. Matouška - M. Matuly - J. Petráska Frekvence slov v stenografické praxi, Praha 1961). Stále však zůstává teoreticky nepromyšleno postižení sdělovacího profilu „typického uživatele jazyka“ nebo „typického kolektivu uživatelů“, v němž se patrně nejvíce uplatňuje dialog (s aktivní účastí všech mluvčích), odborné vyjadřování (aktivní i pasívní), dále žurnalistika (čtení novin, sledování rozhlasu a televize), v jisté míře též umělecká próza a poezie. Rovněž toto hledisko je prostupováno protikladem otevřenosti a uzavřenosti textů, rozdílným působení aktivní [277]a pasívní slovní zásoby i míšením stylových vrstev v oblasti slovníku. Vývojové změny v jazyce jsou totiž nejzřetelnější právě u frekvence slov, jejíž obraz se mění módností publicistického vyjadřování, vývojem vědy a technického myšlení, vlivem oblíbených písní atd. Předností recenzovaného slovníku je obratná aplikace kvantitativních charakteristik a indexů, které působení náhodnosti těchto proměn snižují; je však třeba litovat, že se autor, sám významný stylistický teoretik, více nezamyslil nad problematikou kvalitativní reprezentativnosti slovníku pro jazyk jako celek a že i svým praktickým řešením skupinového rozdělení materiálu se držel především tradičních vzorů, zvláště slovníků Juillandových.

Již v úvodní části tohoto výkladu jsme naznačili hlavní přednosti Mistríkova slovníku — dobrou úroveň a značnou originalitu teoretických úvah o kvantitativní lexikologii. Dodejme ještě, že i oddíly obsahující vlastní slovník jsou upraveny velmi pečlivě a přehledně. Hodnota díla, o jehož pracnosti a náročnosti není možno pochybovat, znamená jak obohacení slovakistiky, tak i slovanské a světové jazykovědy vůbec.


[1] J. Jelínek - J. V. Bečka - M. Těšitelová, Frekvence slov, slovních druhů a tvarů v současné češtině, Praha 1961.

[2] Tato skupina byla vyčleněna i v původní koncepci slovníku Mistríkova, srov. cit. d. s. 28.

Naše řeč, volume 53 (1970), issue 4-5, pp. 273-277

Previous František Cuřín: Sborník filosofické fakulty brněnské university

Next Antonín Tejnor: Nové sovětské publikace o vědeckém a technickém názvosloví