Lumír Klimeš
[Články]
-
Prof. Šmilauer uvažoval o statistických metodách v jazykovědě už jako posluchač v semináři prof. Smetánky.[1] My, jeho žáci, jsme o nich v jeho seminářích přemýšleli o mnoho let později také, ať už to bylo při hláskových rozborech ukládaných ve šk. r. 1945/46, nebo při sestavování známých syntaktických charakteristik. Proto jsem zvolil statistickou metodu i pro tento jubilejní článek, jehož cílem je přispět k lepšímu poznání skladby obrozenské češtiny i vývoje syntaxe vůbec a dát snad i podnět k dalšímu prohloubení statistických metod.
Pokusil jsem se proto vyšetřit některé údaje týkající se délky jednoduché věty v 1., 2. a 5. listě Počátků českého básnictví (tyto listy psal Palacký), zjistit, zda se délka vět těchto listů významně liší, nebo zda tvoří z hlediska kvantitativního jeden soubor. (Zvláštní pozornost hodláme věnovat rozdílům mezi 5. listem a oběma listy prvními, neboť v nich prováděl některé úpravy Šafařík.[2]) Dále bychom chtěli zjistit, zda se svou délkou liší věty mající různou syntaktickou funkci (věty jednoduché, věty vedlejší), a konečně srovnat zjištěné hodnoty s výsledky jinými a odpovědět na otázku, zda se Palackého věta kvantitativně liší od vět autorů jiných.
Délku věty (dvojčlenné i jednočlenné) měříme v lexikálních slovech; řídíme se názory a zásadami, které shrnula na s. 14—17 své knihy Otázky lexikální statistiky[3] Marie Těšitelová. Délku věty by bylo možno měřit též ve větných členech, popř. i jinak. První způsob se nám přes [201]některé nevýhody jeví v tomto případě jako lepší. Řešení uvedených otázek naráží však na některé těžkosti.
Tak především rozsah Palackého listů není stejný: první obsahuje 248 vět, druhý 214 a pátý 754. Rozsah prvních dvou listů je malý. Také výsledky, k nimž docházíme, jsou dost izolované, neboť sledují pouze počet slov ve větě bez zřetele k jejich syntaktické funkci atp., není osvětlen vztah mezi počtem slov ve větě a počtem slov v souvětí atd. A konečně texty z 18. století,[4] jejichž některé kvantitativní ukazatele uvádíme, jsou vojenskohistorické, jejich autoři měli jiné vzdělání než Palacký, někde se možná uplatnil i vliv německé předlohy atp.
Výsledky kvantitativního rozboru jsou shrnuty v tabulkách na konci článku. Pro srovnání uvádíme i údaje týkající se čtyř tisků ze století 18. a pěti ukázek z prací Fr. Palackého a P. J. Šafaříka, vyšlých v letech 1823—1854.[5] Rozdíly v délce věty v prvním, druhém a pátém listu Fr. Palackého z Počátků českého básnictví… (dále jen L1 L2 a L5) jsou malé, jak ukazuje tabulka č. 1. Totéž potvrdilo i studium počtu slov ve větě jednoduché (tabulka č. 2) a ve vedlejších větách v 1.—4. stupni závislosti (tabulka č. 3). Testovali jsme proto hypotézu, že rozložení četností počtu slov ve všech třech případech je shodné, proti alternativě, že se rozložení od sebe významně liší. Užili jsme testu Kolmogorovova-Smirnovova. Na základě uvedeného materiálu a vypočtených hodnot D, jež byly všude menší než kritické hodnoty K (1,225 pro P = 0,1, 1,36 pro P = 0,5, 1,63 pro P = 0,01, 1,96 pro P = 0,001), neprokázali jsme statisticky významné rozdíly rozložení četností v listech L1, L2 a L5. Šafaříkovy úpravy neměly tedy významný vliv na rozložení četností vět o daném počtu slov.
[202]V L1 se nejčastěji vyskytují věty mající 3 slova, v L2 a L5 6 slov. Podrobnosti jsou zřejmé z tohoto přehledu:
| L1 | L2 | L5 | |||
x | n | x | n | x | n | |
1 | 3 | 29 | 6 | 29 | 6 | 87 |
2 | 5 | 23 | 3 | 24 | 4 | 76 |
3 | 2 | 22 | 5 | 22 | 7 | 75 |
4 | 6 | 18 | 4 | 17 | 5 | 72 |
| 8 | 17 | 7 | 14 | 9 | 57 |
10 | 17 | 9 | 14 |
|
|
x = počet slov, n = počet vět v daném listu majících x slov
Na první čtyři místa (v rozsahu 2, 3, 5 a 6 slov v L1, 3 až 6 v L2, 4 až 7 v L5) připadne v L1 37,09 % všech vět, v L2 42,95 a v L5 41,11. V tiscích z 18. století[4], totiž v H1 (z r. 1739), H4 (z r. 1740), D (z r. 1757) a H5 (z r. 1758) dostávají se na první místo věty mající 6, 7, 6 a 9 slov, na druhé místo 7, 8, 8 a 6 slov atd.; na první čtyři místa připadne 43,23 %, 38,66, 28,55 a 33,34.
Průměrný počet slov ve větě ve zkoumaných čtyřech tiscích z 18. století je 9,32 až 12,61 slov, v Palackého listech 8,06 až 9,10, v Dějinách[5] 12, 22. Pro srovnání s průměrnou délkou věty v češtině 20. století nemáme zatím k dispozici výsledky rozboru děl tematicky blízkých Palackého listům. V materiálu, který publikovala L. Uhlířová v Slově a slovesnosti,[6] pohybuje se délka věty od 4,22 (Vančura, Konec starých časů) a do 8,35 (Severin—Kasik, Průmyslová televize). Šmilauerova Učebnice větného rozboru[7] uvádí tyto průměrné délky vět: v beletrii ve vyprávění 6 slov, v přímých řečech 3,5, u Neffa 14,3 — 8,4; u Martena 17, u Niederla 16.
Jednoduchá věta je kratší než věta vedlejší v prvních dvou listech (L1, L2), delší je v listu pátém (L5). (Viz tabulky 2 a 3.) Podle L. Uhlířové[6] mají jednoduché věty v odborném stylu více slov, jsou delší než vedlejší věty. V pátém listu (L5) je na rozdíl od L1 a L2 víc odstavců [203]zabývajících se metrikou, hláskovým rozborem atp., psaných stylem odborným. To může mít vliv na délku jednoduchých i vedlejších vět.
V tiscích z 18. století je jednoduchá věta mnohem delší než v Palackého listech: H1 15,44, H4 16,90, D 19,27, H5 23,73 slov. Zajímavé však je, že vedlejší věta je v uvedených tiscích z 18. století téměř stejně dlouhá jako u Palackého: H1 8,55, H4 9,48, D 11,03, H5 10,43 slov. Průměrná délka jednoduché věty je v těchto tiscích přibližně dvojnásobkem věty vedlejší. Malý počet slov ve vedlejších větách může zřejmě souviset s jejich menší sdělovací náplní (často pouhá časová nebo místní určení v kronikách); naproti tomu na délku vět jednoduchých mají nepochybně vliv i přechodníkové vazby, nejednou silně rozvité, nahrazující vedlejší větu, a spíš populárně kronikářský než vědecky historický ráz ukázek z 18. století.
1. Průměrný počet slov ve větě v Palackého listech je menší než v kronikách z 18. století.
2. Rozdíly v počtu slov ve větě jednoduché a ve větě vedlejší jsou v listech Palackého malé, kdežto v kronikách z 18. století byly ve zkoumaných tiscích jednoduché věty asi dvakrát delší než věty vedlejší.
3. V pozdějších pracích Palackého a Šafaříkových délka věty roste; tyto rozdíly mohly být někdy způsobeny i tématem a stylem. Přesné údaje jsou zřejmé z tohoto přehledu:[5]
Ukázka | n | μ |
Krok 1823 | 182 | 10,94 |
ČČM P 1835, 1838 | 322 | 10,87 |
Dějiny 1854 | 268 | 12,22 |
ČČM Š 1835, 1838 | 345 | 13,45 |
ČČM Š 1852 | 270 | 12,96 |
n = počet vět, μ = průměrný počet slov ve větě
4. Šafaříkovy úpravy prvního a druhého listu se z hlediska statistického neprojevily významně.
5. Všechny tři Palackého listy se z hlediska zkoumaných parametrů statisticky významně neliší.
Potřebné výpočty provedlo výpočetní středisko lékařské fakulty Univerzity Karlovy v Plzni. Jeho pracovníku, promovanému matematiku Jaroslavu Potměšilovi, děkuji za vzácnou ochotu i za užitečné rady při zpracování lingvistického materiálu.
Zkratky
Časopisy a tisky: ČČM = Časopis českého museum, D = Diarium (z r. 1757), H = Historický vejtah… (H1 z r. 1739, H4 z r. 1740, H5 z r. 1758), L1, L2, L5 = listy č. 1, 2 a 5 z Počátků českého básnictví, obzvláště prozódie. Úplné názvy tisků z 18. stol. a bibliografické údaje zde pro přílišný rozsah neuvádíme, lze je však nalézt v práci citované v poznámkách pod č. 4.
Statistické značky: μ = aritmetický průměr, n = počet vět určitého druhu, P = hladina pravděpodobnosti, xmin = nejmenší hodnota, xmax = největší hodnota, med = medián (tj. hodnota stojící uprostřed souboru), mod = modus (tj. nejčastěji se opakující hodnota), S = směrodatná odchylka, V = variační rozpětí (V = xmax — xmin), Var. k. = variační koeficient (udává v % z aritmetického průměru velikost směrodatné odchylky).
Počet slov ve větě Tabulka 1
L | n | μ | xmin | xmax | V | med | mod | S | Var. k. % |
1 | 248 | 9,10 | 1 | 42 | 41 | 15,5 | 3 | 7,31 | 80,31 |
2 | 214 | 8,32 | 1 | 26 | 25 | 13 | 6 | 5,49 | 66,00 |
5 | 754 | 8,06 | 1 | 50 | 49 | 17 | 6 | 5,37 | 66,67 |
Počet slov v jednoduché větě Tabulka 2
L | n | μ | xmin | xmax | V | med | mod | S | Var. k. % |
1 | 29 | 7,52 | 2 | 33 | 31 | 9,5 | 2; 3 | 6,51 | 86,55 |
2 | 26 | 8,12 | 1 | 25 | 24 | 9,0 | 6 | 6,04 | 74,37 |
5 | 46 | 8,65 | 2 | 25 | 23 | 9,5 | 9 | 5,48 | 63,41 |
[205]Počet slov ve vedlejších větách v 1.—4. stupni závislosti Tabulka 3
L | St. záv. | n | μ | xmin | xmax | V | med | mod | S | Var. k. % | ||
1 | 1 | 75 | 9,51 | 2 | 42 | 40 | 12,5 | 8; 11 | 6, 59 | 69,29 | ||
2 | 24 | 9,67 | 2 | 22 | 20 | 9,5 | 6; 9 | 5, 03 | 52,01 | |||
3 | 4 | 7,50 | 3 | 12 | 9 | 7,5 | 3; 7 | — | — | |||
|
|
|
|
|
|
| 8; 12 |
|
| |||
4 | 1 | 5,00 | 5 | 5 | 0 | 5,0 | 5 | — | — | |||
2 | 1 | 60 | 8,20 | 3 | 24 | 21 | 10,5 | 3; 6 | 4,97 | 60,66 | ||
2 | 20 | 9,35 | 2 | 22 | 20 | 11,0 | 3 | 6,47 | 60,25 | |||
3 | 6 | 8,50 | 4 | 16 | 12 | 8,0 | 8 | — | — | |||
5 | 1 | 244 | 8,35 | 2 | 34 | 32 | 14,5 | 6 | 5,26 | 62,94 | ||
2 | 85 | 7,21 | 2 | 17 | 15 | 9,5 | 6 | 3,46 | 48,04 | |||
3 | 21 | 8,57 | 2 | 28 | 26 | 9,0 | 7 | — | — | |||
4 | 1 | 4,00 | 4 | 4 | 0 | 4,0 | 4 | — | — |
[1] Vl. Šmilauer, Poloha přívlastku v Kronice pražské Bartoše Písaře, Praha 1930, s. 5, bod b.
[2] Počátkové českého básnictví, obzvláště prozódie, Bratislava 1961, 145 s. (První vyd. v r. 1818.) Ve vydavatelské poznámce na s. 121 je uvedena delší stať z Palackého vlastního životopisu; zde citujeme jen jednu větu: „Já vyhotovil ještě pátý list, on [Šafařík] svůj rukopis jenanský proměnil v list třetí a čtvrtý, šestý pak nyní znovu složil; moji dva první listové opraveni jsou nejprve ode mne, potom i od něho.“
[3] M. Těšitelová, Otázky lexikální statistiky, Praha 1974, 289 s.
[4] L. Klimeš, Pokus o statistický výklad vývoje věty a souvětí v české historické próze z let 1685—1758. Annali, Sezione Slava, 13, 1970, s. 105—135. Istituto Universitario Orientale Napoli. Viz s. 109.
[5] Krok 1823 = Fr. Palacký, Přehled dějin krásovědy a její literatury. Krok 1823, díl první, částka IV, s. 22 Dějopisec — 31 zasluhují.
ČČM P 1835 = Fr. Palacký, Pomůcky ku poznání staročeského práva i řádu soudního. ČČM 1835, s. 399 Za — 403 odkládajíce.
ČČM P 1838 = Palackého rezence Slovanských starožitností (ČČM 1838, s. 117—120) a Vesny (s.121—123).
ČČM Š 1835 = P. J. Šafařík, O národech kmene litevského, ČČM 1835, s. 292 Národy — 297 bydlících.
ČČM Š 1838 = P. J. Šafařík, Literní zprávy ze Slovanska, ČČM 1838, s. 102—117. ČČM Š 1852 = P. J. Šafařík, Pohled na prvověk hlaholského písemnictví. ČČM svazek 2, s. 81—108.
Dějiny 1854 = Fr. Palacký, Dějiny národu českého v Čechách i v Moravě, dílu I částka 2, Praha 1854, s. 217—239.
[4] L. Klimeš, Pokus o statistický výklad vývoje věty a souvětí v české historické próze z let 1685—1758. Annali, Sezione Slava, 13, 1970, s. 105—135. Istituto Universitario Orientale Napoli. Viz s. 109.
[5] Krok 1823 = Fr. Palacký, Přehled dějin krásovědy a její literatury. Krok 1823, díl první, částka IV, s. 22 Dějopisec — 31 zasluhují.
ČČM P 1835 = Fr. Palacký, Pomůcky ku poznání staročeského práva i řádu soudního. ČČM 1835, s. 399 Za — 403 odkládajíce.
ČČM P 1838 = Palackého rezence Slovanských starožitností (ČČM 1838, s. 117—120) a Vesny (s.121—123).
ČČM Š 1835 = P. J. Šafařík, O národech kmene litevského, ČČM 1835, s. 292 Národy — 297 bydlících.
ČČM Š 1838 = P. J. Šafařík, Literní zprávy ze Slovanska, ČČM 1838, s. 102—117. ČČM Š 1852 = P. J. Šafařík, Pohled na prvověk hlaholského písemnictví. ČČM svazek 2, s. 81—108.
Dějiny 1854 = Fr. Palacký, Dějiny národu českého v Čechách i v Moravě, dílu I částka 2, Praha 1854, s. 217—239.
[6] L. Uhlířová, O délce věty. SaS 32, 1971: 232—240. Viz s. 238—240.
[7] Vl. Šmilauer, Učebnice větného rozboru, Praha 1972, 197 s. Šesté, přepracované vydání. Viz s. 151.
[6] L. Uhlířová, O délce věty. SaS 32, 1971: 232—240. Viz s. 238—240.
[5] Krok 1823 = Fr. Palacký, Přehled dějin krásovědy a její literatury. Krok 1823, díl první, částka IV, s. 22 Dějopisec — 31 zasluhují.
ČČM P 1835 = Fr. Palacký, Pomůcky ku poznání staročeského práva i řádu soudního. ČČM 1835, s. 399 Za — 403 odkládajíce.
ČČM P 1838 = Palackého rezence Slovanských starožitností (ČČM 1838, s. 117—120) a Vesny (s.121—123).
ČČM Š 1835 = P. J. Šafařík, O národech kmene litevského, ČČM 1835, s. 292 Národy — 297 bydlících.
ČČM Š 1838 = P. J. Šafařík, Literní zprávy ze Slovanska, ČČM 1838, s. 102—117. ČČM Š 1852 = P. J. Šafařík, Pohled na prvověk hlaholského písemnictví. ČČM svazek 2, s. 81—108.
Dějiny 1854 = Fr. Palacký, Dějiny národu českého v Čechách i v Moravě, dílu I částka 2, Praha 1854, s. 217—239.
Naše řeč, ročník 58 (1975), číslo 4, s. 200-205
Předchozí Jaromír Spal: Větné členství instrumentálu komitativního
Následující Jaromír Bělič: O jazykové příslušnosti nářečí na Těšínsku