Petr Holman
[Posudky a zprávy]
-
Skutečnost, že v posledních několika desetiletích jazykovědci věnovali zvýšenou pozornost oblasti lexikální statistiky a kvantitativní lingvistice [42]vůbec, dostatečně svědčí o tom, že zájem o tyto moderní vědní disciplíny neustále trvá, ba ještě roste. A to i u nás.[1]
V minulosti vznikaly, a to především v angloamerické jazykové oblasti, rozsáhlé slovníkové práce, které z mnoha hledisek zkoumaly jazykový materiál získaný z krásné literatury, z literatury pro mládež, z odborných textů a učebnic, z oblasti ekonomické a také z novin nebo časopisů. U nás i v zahraničí byly vypracovány slovníky zachycující dílčí oblasti, např. určitého literárního směru či školy (Index du vocabulaire du symbolisme, Slovník našich novin aj.); vznikají i speciální práce jako např. Slovník šestiletých dětí, Dictionnaire des idées dans l’oeuvre de Simone de Beauvoir atd. Zvláštní skupinu tvoří slovníky, které zpracovávají slovní zásobu významných autorů, tzv. slovníky autorské; připomeňme alespoň slovník Puškinův, Goethova jazyka, Shakespearův a Paula Valéryho (resp. jejich jednotlivých děl), slovník Victora Huga nebo Adama Mickiewicze či Joyceova Odyssea.[2]
Uvědomíme-li si, že je to právě slovní zásoba, která je ze všech složek jazyka nejtěsněji spojena s vývojem národní společnosti, pochopíme zároveň, jak nezbytně nutné je studium jazyka vynikajících osobností naší literatury. Z literárněvědného hlediska bylo už mnohé napsáno o jazyce K. H. Máchy, K. j. Erbena, K. Havlíčka Borovského či O. Březiny, ale jazyk těchto autorů dosud soustavně zkoumán nebyl.
Básník Otokar Březina (1868—1929) daleko přesáhl významem i dosahem svého básnického a esejistického díla nejen čas, ale také místo svého působení. Jeho pět básnických sbírek, vzniklých ve velmi krátkém časovém rozmezí v letech 1895—1901, posmrtně vydané Torso šesté knihy básní (Země, 1933) a dvě knihy esejů představují dohromady svébytný básnický a myšlenkový celek, jaký snad v prostoru žádné jiné národní literatury nevznikl. Když se v časopisech začaly objevovat první Březinovy básně, vznikl neobyčejný zájem o jeho dílo; jak dokládá dvoudílná březinovská bibliografie (Brno 1969, 1971) a připravované dodatky k ní, přetrvává tento zájem až do současnosti.
V poslední době byla u nás i v zahraničí vydána celá řada prací, které jen znovu potvrzují, že Březinovo dílo neztratilo ani v přítomné době nic ze své obdivuhodné síly a působivosti, že je schopno i dnes oslovovat moderního čtenáře a odpovídat na jeho otázky. Celé básinické dílo bylo znovu vydáno a hodnoceno, vyšly studie [43]o Březinových esejích, byly publikovány další, dosud neotištěné dopisy; připravuje se souborné vydání esejů, velká pozornost byla věnována také překladům (reprezentativní kniha překladů vyšla v Maďarsku, připravuje se také překlad Březinova díla do ruštiny).
Březinovo jedinečné dílo, popř. jeho části, bylo často rozebíráno a komentováno z filozofického, náboženského či kulturně historického hlediska; autoři přitom zdůrazňovali i krásu a dokonalost jazyka,[3] působivost metafor, často bylo poukazováno na „hudebnost slohu“ básní i esejů, avšak celkový hodnotící pohled se stále neobjevoval.
Autor této stati pracoval v letech 1974—1986 na přípravě Frekvenčního slovníku básnického díla Otokara Březiny (dále FS OB). Základním posláním tohoto slovníku je podat celkový obraz úplné slovní zásoby Březinova básnického díla, tedy všech veršů, které byly básníkem zařazeny do definitivního vydání jeho díla, Tajemnými dálkami počínaje a dvěma posmrtně objevenými básněmi (Za všechno díky, Návrat) konče. Důležitým cílem slovníku je také, aby poskytl všechny číselné údaje (absolutní a relativní frekvence, distribuční koeficienty, údaje o disperzi atd.) potřebné pro další kvantitativní výzkum Březinova jazyka, ale šíře i jazyka devadesátých let a jazyka obecně.
FS OB je rozvržen do tří dílů (šesti oddílů), jejichž obsah zde naznačíme.
1. Seznam lexikálních jednotek s pořadím 1—1000 seřazených podle klesající relativní frekvence. Jsou zde zachyceny také příslušné ranky, údaje o relativní, ale i absolutní frekvenci jsou doplněny dvěma distribučními koeficienty, které udávají počet sbírek a básní, v nichž se daný lexém vyskytuje. Obsaženy jsou i dílčí frekvence lexémů v jednotlivých sbírkách a údaje o disperzi lexému.
Celý tento seznam je rozdělen po desítkách; za každou z nich najdeme 10 dalších hodnotících číselných vyjádření:
a) součty relativní (FR) a součty absolutní frekvence (FA);
b) rozdíly FR a FA ve srovnání s minulou desítkou;
c) součty FR a FA vyjádřené v procentech;
d) kumulativní FR a FA;
e) obě tyto hodnoty vyjádřené v procentech.
[44]2. Seznam lexikálních jednotek s pořadím 1—1000 seřazených podle klesající absolutní frekvence je doplněn údaji o relativní frekvenci a disperzi příslušného lexému.
3. Seznam lexikálních jednotek s pořadím 1—1000 seřazených podle klesající disperze je rovněž vybaven údaji o absolutní i relativní frekvenci.
Porovnáme-li prvních několik desítek lexémů (z hlediska FA) FS OB se stavem, který zachytil J. Filipec (d. cit. v pozn. 3), dostaneme tento přehled:
FS OB | Filipec | ||||
pořadí slov | frekvence | pořadí slov | frekvence | ||
1 | a | 1740 | 1 | v | 281 |
2 | v/ve | 1683 | 2 | a | 269 |
3 | jak/jako | 595 | 3 | jak | 107 |
4 | z/ze | 558 | 4 | můj | 72 |
5 | jenž | 507 | 6 | jenž | 70 |
6 | na | 416 | 6 | na | 69 |
7 | můj | 377 | 7 | svůj | 48 |
8 | tvůj | 370 | 8 | tvůj | 48 |
9 | svůj | 361 | 9 | duše | 43 |
10 | duše | 295 | 10 | já | 42 |
11 | do | 273 | 11 | k(e) | 40 |
12 | náš | 265 | 12 | do | 38 |
13 | k/ke/ku | 264 | 13 | nad | 38 |
14 | jeho/její/jejich | 244 | 14 | země ‚planeta‘ | 36 |
15 | on/ona/ono | 233 | 15 | vše (chen/cek) | 33 |
16 | země/zem | 232 | 16 | být | 31 |
17 | být | 229 | 17 | kde | 29 |
18 | všechen/všecek/vše | 210 | 18 | on, ona, ono, oni | 25 |
19 | já | 199 | 19 | noc | 24 |
20 | noc | 182 | 20 | pro | 24 |
21 | světlo | 179 | 21 | s | 24 |
22 | nad/nade | 178 | 22 | náš | 23 |
23 | když | 170 | 23 | ruka | 23 |
24 | slunce | 170 | 24 | světlo | 23 |
25 | my | 160 | 25 | oheň | 21 |
26 | zrak | 156 | 26 | květ | 20 |
27 | květ | 144 | 27 | myšlenka | 20 |
28 | vůně | 133 | 28 | pod | 19 |
29 | den | 130 | 29 | zrak(y) | 19 |
30 | věk | 130 | 30 | den | 18 |
Filipec | |||||
pořadí slov | frekvence | pořadí slov | frekvence | ||
31 | s/se | 122 | 31 | když | 18 |
32 | který | 122 | 32 | krev | 18 |
33 | sen | 121 | 33 | tajemství | 18 |
34 | svět | 121 | 34 | věk(y) | 18 |
35 | hvězda | 119 | 35 | vůně | 18 |
36 | i | 118 | 36 | hvězda | 17 |
37 | před/přede | 108 | 37 | i | 17 |
38 | věčný | 108 | 38 | píseň | 17 |
39 | tisíc | 108 | 39 | žhavý | 17 |
40 | píseň | 107 | 40 | moře | 16 |
41 | krev | 107 | 41 | smrt | 16 |
42 | kde | 106 | 42 | hudba | 15 |
43 | smrt | 105 | 43 | mrtvý | 15 |
44 | ruka | 104 | 44 | sen | 15 |
45 | bolest | 102 | 45 | srdce | 15 |
46 | tajemný | 93 | 46 | věčný | 15 |
47 | za | 92 | 47 | vlna | 15 |
48 | zahrada | 89 | 48 | ó | 14 |
49 | tajemství | 87 | 49 | tajemný | 14 |
50 | pod/pode | 84 | 50 | slunce | 13 |
Všechny tyto údaje potvrzují dříve zjištěné skutečnosti, např. převahu pomocných slov nad plnovýznamovými, postavení já před my (199:160, resp. 42:8), časté užití knižního jenž před který (507:122, resp. 70:8) atd.
Ze slov plnovýznamových mají největší frekvenci slova duše (295), země/zem (232), noc (182), světlo (179), slunce (170), zrak (156), květ (144), vůně (133), den (130), věk (130), sen a svět (121), hvězda (119); také v tomto případě můžeme jen potvrdit zjištění J. Filipce (d. cit. v pozn. 3, s. 5), že „uvedená plnovýznamová slova plně identifikují básnický text Březinův na rozdíl od textu jiných básníků. Jsou to tedy slova textově specifická, tematická proti slovům běžného jazyka.“ U vůbec nejfrekventovanějšího Březinova slova duše (FA 295, FR 231, disperze D 78,39), které se vyskytuje ve všech šesti básnických sbírkách, a to ve 110 básních ze 125, si můžeme také názorně ukázat, jak se v posledních třech sbírkách výrazně snižuje počet užití tohoto slova (FA; druhé číslo znamená počet básní, ve kterých se slovo vyskytuje):
[46]TD 71/28, SZ 74/21, VP 71/19, SCH 42/17, R 19/14, Z 18/11.[4] U slova země/zem je tento průběh zcela odlišný:
TD 15/13, SZ 14/8, VP 43/16, SCH 56/15, R 58/18, Z 46/10.
Abecední index všech lexikálních jednotek Březinova básnického díla podává údaje o relativní i absolutní frekvenci doplněné distribučními koeficienty pro počet sbírek a básní. Vedle číselného údaje o disperzi jsou tu v šesti sloupcích i dílčí frekvence lexémů ve sbírkách doplněny distribučními koeficienty platnými pro počet básní. Na konci každého písmena je uveden číselný údaj o absolutním počtu všech lexémů (V) a všech tvarů slov (N); totéž je pak uvedeno i u jednotlivých sbírek.
Šest abecedně řazených seznamů (pro každou sbírku zvlášť) obsahuje kromě číselných údajů o absolutní frekvenci a distribuci úplný soupis všech míst výskytů (konkordanční index), na který je v této části kladen hlavní důraz.
Poslední oddíl FS OB tvoří dodatky, které obsahují tyto údaje:
/1/ abecední seznam přejatých slov vybavený stejnými číselnými charakteristikami jako II. díl (kromě součtu lexémů a tvarů slov);
/2/ přehledy 100 nejfrekventovanějších substantiv, adjektiv a sloves seřazených podle klesající relativní frekvence;
/3/ přehledy 100 nejfrekventovanějších substantiv, adjektiv a sloves seřazených podle klesající absolutní frekvence;
/4/ přehledy 10 nejfrekventovanějších zájmen, číslovek, příslovcí, předložek a spojek (rovněž vybavené odpovídajícími číselnými charakteristikami);
/5/ přehledná grafická znázornění dodatků 3 a 4.
Součástí FS OB je úvodní studie (v I. díle), v které jsou formulovány základní cíle a úkoly slovníku, probírány otázky excerpce a přípravy výchozího textu; značná pozornost byla věnována také textovým odchylkám ve dvou základních použitých vydáních Březinových veršů, tabulačním zásadám a uspořádání hesel ve slovníku.
Za základ pro vydání jsme zvolili kritické vydání M. Hýska.[5] Teprve po ně[47]kolika letech práce bylo možno přihlédnout také k dosud poslednímu vydání Březinova básnického díla.[6]
Kromě všech básní ze šesti sbírek byly excerpovány dvě další básně (do Básnických spisů dosud nezařazené), Návrat a Za všechno díky, takže bylo vyexcerpováno celkem 125 básní v celkovém rozsahu 4640 veršů (TD 883, SZ 625, VP 691, SCH 854, R 873, Z 714). Při excerpci dvou posledně uvedených básní, které do Březinova díla, jak už bylo dříve prokázáno, bezpochyby náležejí, jsme vycházeli z vydání J. Ziky, avšak přihlédli jsme i k samostatným vydáním obou básní.[7]
Co se týká vlastního textu básní, přidrželi jsme se na několika místech textu připraveného B. Štorkem, nikoli vydání Hýskova; všechny tyto případy úvodní studie zachycuje.
Při tabulaci jsme se povětšinou řídili obecně platnými zásadami, které pro Kruh přátel českého jazyka vypracoval V. Šmilauer. Se stálým zřetelem ke specifice Březinova textu jsme v některých případech (ve studii rovněž konkrétně uvedených) tabulační zásady poněkud pozměnili a přizpůsobili nově vzniklým podmínkám.
Hesla v I. dílu slovníku většinou neobsahují žádná další vymezení významů kromě několika určení nutných např. pro rozlišení homonymie (pět-zpívat). Ve II. dílu jsou některé lexémy doplněny vysvětlením významů, tak např. heslo země/zem může mít význam ‚planeta‘, ‚půda (prsť)‘, ‚povrch‘, příp. ‚krajina‘ či ‚území‘. Při vysvětlování těchto významů nám byl většinou vodítkem Slovník spisovného jazyka českého (Praha 1960—1971); mnohdy však bylo velmi obtížné určit příslušný význam. I když jsme si v tomto případě, a právě tady víc než kde jinde, byli vědomi neustálé přítomnosti subjektivních faktorů a jejich silného vlivu (a navíc, básnické dílo je mnohovýznamové!), podnikli jsme — i přes velké riziko — tento první pokus o sémantickou klasifikaci s vědomím, že snad naznačí cestu k další práci na tomto poli. Zvlášť byly řešeny také otázky komparativů, substantivizace adjektiv, záporů, velkých a malých písmen, zvratných sloves atd.
FS OB se řídí poslední úpravou pravopisných jevů Pravidly českého pravopisu z r. 1983. Důsledně však respektuje všechny odchylky v tvarosloví a syntaxi, zachovává také kolísání v kvantitě i kvalitě hlásek.
V další části úvodní studie jsme zjišťovali a hodnotili některé údaje nezbytné pro frekvenční práce, tak např. indexy opakování (TD 3,6; SZ 3,4; VP 4,2; SCH 3,5; R 3,3; Z 3,4; celé dílo 7,7; indexy opakování byly stanoveny [48]i pro jednotlivé slovní druhy), byly vysvětleny a za pomoci moderní počítačové techniky provedeny výpočty relativní frekvence a disperze lexémů (na základě postupů navržených J. Mistríkem), sledovali jsme také narůstání i úbytek nových slov v jednotlivých básnických sbírkách. Určili jsme celkové počty lexémů i počty tvarů slov pro sbírky (TD 1808/6502, SZ 1661/5609, VP 1444/6029, SCH 1665/5910, R 1815/6070, Z 1559/5337) i pro celé Březinovo dílo (4582/35457).
Dále jsme se zabývali hodnocením prvního tisíce slov, v rámci výkladů o ranku jsme sledovali vztahy ranku a frekvence, ověřovali jsme v našich podmínkách platnost I. a II. Zipfova zákona.
Vypočetli jsme hodnoty koeficientů pro tzv. bohatství slovníku (TD 22,42; SZ 22,18; VP 18,60; SCH 21,66; R 23,30; Z 21,34), slovní zásoba byla komplexně charakterizována z kvantitativního hlediska pomocí koeficientů pro
a) rozsah slovníku (TD 34,76; SZ 37,02; VP 29,94; SCH 35,22; R 37,38; Z 36,51);
b) rozptýlení slovníku (TD 94,03; SZ 93,80; VP 91,07; SCH 93,15; R 94,11; Z 93,27) a
c) koncentraci slovníku (TD 23,67; SZ 22,25; VP 20,34; SCH 19,54; R 19,28; Z 20,07).
V rámci analýz slovních druhů jsme zkoumali rozložení lexémů i tvarů slov, vymezili jsme (podle návrhu M. Těšitelové) nominální a verbální skupinu, byly zjišťovány a hodnoceny koeficienty nominálnosti, koeficienty rozvíjení podstatných jmen a sloves.
Druhá hlavní část úvodní studie byla věnována samostatným hodnocením jednotlivých slovních druhů; zvlášť jsme si opět všímali lexémů i tvarů slov, zástupce nominální i verbální skupiny jsme zařadili do pěti stanovených frekvenčních pásem (FA nad 100, FA 11—100, FA 3—10, FA 2, FA 1), u každého slovního druhu jsme také vždy věnovali pozornost deseti nejfrekventovanějším slovům.
V samostatných kapitolách jsme dále pojednali např. o podst. jm. slovesných, o psaní velkých písmen u substantiv a adjektiv, o přejatých slovech, o substantivizaci adjektiv, o stupňování adjektiv atd. Dosažené výsledky byly často porovnávány s údaji frekvenčního slovníku češtiny a s výsledky prací M. Těšitelové.
Je dostatečně známo, jakou důležitost má zkoumání autorského jazyka i pro výzkumy jazyka národního a spisovného a jaký vliv mělo Březinovo básnické slovo na jeho současníky i na mladší generaci už od dob vydání Tajemných dálek. Jenom z těchto obecných konstatování nutně vyplývá, že bude třeba ve zkoumání Březinova jazyka pokračovat. Předmětem zájmu by však rozhodně neměly zůstat pouze verše. Mimořádnou pozornost bude třeba věnovat také esejům, především knihám Hudba pramenů a Skryté dějiny, ale i příležitostným meditacím a dalším textům, jež se před nedávnem [49]podařilo objevit v pozůstalosti a které budou zařazeny do připravovaného souborného vydání. Vzájemné porovnání jazyka veršů a esejů bude tvořit v dalších výzkumech samostatnou kapitolu. Zároveň by bylo velmi záslužné zjistit (a to připomněl v cit. čl. už J. Filipec), jak Březinův jazyk působil na generace básníků současných i pozdějších a jak se jeho transformace objevují v jejich díle.
Naznačujeme zde tedy další možnosti, kterých by se při budoucích (ale nejen kvantitativních!) výzkumech dalo využít; zároveň však se domníváme, že zjištěné výsledky mohou posloužit jako základ pro další úspěšné rozvíjení vztahů mezi kvantitativní lingvistikou (která sama o sobě zůstává stále jen a jen samoúčelná) a literární teorií.
„Jedním z klíčových principů užitečných pro teorii literatury je, že cílem lexikální statistiky nejsou jen frekvenční slovníky, frekvenční seznamy (jednoznačně účelové seznamy slov referující o jejich frekvenci), nýbrž kvantitativní výzkum slovní zásoby jako celku a jejích složek zvláště. Tím se lexikální statistika stává bezprostředně potřebnou pro literární teorii…“[8]
Frekvenční slovník básnického díla Otokara Březiny, první takto pojatá práce u nás vůbec (i když prozatím jen v rukopise), je tedy pouze dalším příspěvkem k lepšímu poznání jazyka. A jestliže bude moci jakkoliv, byť i jen jako technická pomůcka, k příštím výzkumům posloužit, nevznikl zbytečně.[9]
[1] Přehled hlavních prací z této oblasti je uveden v následujících publikacích: J. Jelínek — J. V. Bečka — M. Těšitelová, Frekvence slov, slovních druhů a tvarů v českém jazyce, Praha 1961, s. 11—18; J. Mistrík, Frekvencia slov v slovenčine, Bratislava 1969, s. 13—14; M. Těšitelová, Otázky lexikální statistiky, Praha 1974, zejm. s. 5—12; M. Těšitelová a kol., Kvantitativní charakteristiky současné češtiny, Praha 1985, s. 230—235.
[2] V posledních letech vyvíjí činnost na poli lexikální statistiky zvl. nakl. Slatkine (Ženeva—Paříž), které v redakci Ch. Mullera vydalo např. v r. 1981 monumentální třísvazkový frekvenční slovník francouzštiny (E. Brunet, Le Vocabulaire Français de 1789 à nos jours). Ve stejném nakladatelství vyšel slovník J. Giraudouxe; dokončen byl také Le Vocabulaire de Proust, avec l’index complet et synoptique de la „Recherche du temps perdu“ (I—III).
[3] Ve své době nejrozsáhlejší a v mnoha směrech průkopnickou a cennou práci vykonal pro bližší poznání Březinova jazyka A. Juránek (Inspirační zdroje, Slovník Otokara Březiny, disertační práce na FF UK, Praha 1951); z dalších významnějších můžeme uvést práci M. Jerhotové (Březinovy metafory, disertační práce na FF UK, Praha 1937) a z poslední doby především práci J. Filipce, který rozebírá Březinův slovník, významovou stránku slov a slovních spojení na základě excerpce 5438 slovních tvarů z Tajemných dálek a Rukou a z nadpisů všech básní Březinova básnického díla (K jazyku a stylu Otokara Březiny, NŘ 52, 1969, s. 1—22).
[4] Užívané zkratky básnických sbírek: TD—Tajemné dálky, SZ—Svítání na západě, VP—Větry od pólů, SCH—Stavitelné chrámu, R—Ruce, Z—Země (Torso šesté knihy básní).
[5] Otokar Březina, Básnické spisy, Česká akademie věd a umění, Melantrich, Praha 1933.
[6] Otokar Březina, Básnické spisy, Československý spisovatel, Národní knihovna, Praha 1975. Toto vydání připravil B. Štorek. Text v Hýskově i Štorkově vydání shodně vycházel u prvních pěti sbírek ze šestého knižního vydání (SVU Mánes, Praha 1926). Výchozím textem pro poslední sbírku bylo vydání Em. z Lešehradu v nakl. A. Srdce, Praha 1927, dvě básně (Vše zachvátit, Ztracení) byly přejaty z vydání J. Portmana (Litomyšl 1926).
[7] J. Zika, Otokar Březina, Melantrich, Praha 1970, s. 254—257; O. Březina, Návrat, Okresní knihovna Prostějov, 1968; Za všechno díky, in: Stavba ve výši, Sb. věnovaný památce O. Březiny, Blok, Brno 1970.
[8] M. Klivar, Význam kvantitativní lingvistiky pro literární teorii, Literárněvědný sborník Památníku národního písemnictví, Praha 1984, s. 25.
[9] Rozšířený text příspěvku byl přednesen 20. listopadu 1985 na přednášce Kruhu přátel českého jazyka v Praze. Zároveň děkuji všem, kteří mi svými kritickými připomínkami, radou, dlouhodobým laskavým zájmem, dobrým slovem či stálým povzbuzováním pomáhali v přípravě celé práce.
Naše řeč, ročník 71 (1988), číslo 1, s. 41-49
Předchozí Jiří Kraus: Konference o úloze textu ve společenském dorozumívání
Následující Eva Hošnová: Slavica Pragensia XXV