en cz

K současné české próze z hlediska frekvence slov

Marie Těšitelová

[Články]

Publikování výsledků studia frekvence slov a jejich tvarů v českém spisovném jazyce jsem zahájila před 50 lety v tomto časopise příspěvkem, v němž jsem analyzovala jazyk K. Čapka, dnes již klasika moderní české literatury.[1] Po půl století jsem se vrátila k problematice frekvence slov v jazyce uměleckého stylu a položila jsem si otázku, zda a jak se z tohoto hlediska změnil současný jazyk uměleckého stylu, zejména pak do jaké míry a v jakých relacích se to projevuje vzhledem k druhu slova.

Protože můj příspěvek z r. 1948 byl jedním z prvních, který se frekvencí jazykových jednotek na rovině lexikální a morfologické relativně systematicky zabýval, mohl se víceméně omezit na konstatování zjištěných dat v jednom celém textu. To znamená, že jsem tehdy mimo jiné neměla možnost srovnávat data z textu K. Čapka s daty v jiném textu, popř. ve více textech za analogických podmínek, abych tím mohla zhodnotit reprezentativnost výsledků své práce. Šlo zejména o rozlišení, co je charakteristikou jazyka, češtiny vůbec, popř. jazyka uměleckého stylu a co je individuální pro Čapkův jazyk, co platí i pro jazyk jiného autora apod. To začalo být možné až v 50. letech, kdy jsem pracovala jako spoluautorka tzv. českého frekvenčního slovníku.[2] Od začátku 60. let jsem se už mohla opírat o tištěnou podobu FSČ a později o výsledky svých dílčích studií, srov. např. některé mé knižní publikace.[3] Od 70. do 90. let jsem po jistou dobu měla možnost vést všestrannou kvantitativní analýzu současného českého jazyka tzv. věcného stylu a podílet se na zpracovávání některých dílčích výsledků tohoto výzkumu.[4] Na základě dosavadních zkušeností nabytých při kvantitativní analýze češtiny – v nestejné míře na všech základních jazykových rovinách – pokusím se v tomto příspěvku odpovědět na základní otázku, kterou jsem si položila výše, tj. co se za posledních 50 let změnilo ve frekvenci slov v jazyce uměleckého stylu, popř. zda se vůbec něco podstatného změnilo.

[2]Ke svému studiu jsem zvolila souvislý výběr 3000 slov (srov. OLS, s. 28–46), tj. prvních 3000 slov ze začátku dvou textů předních autorů současné české prózy, Michala Viewegha Výchova dívek v Čechách (Český spisovatel, Praha 1994, dále V_w) a Lenky Procházkové Růžová dáma (Tiberone – české vydání, Praha 1995, dále P). Přihlížela jsem k tomu, že oba autoři jsou si generačně blízcí, mají odborné vzdělání v českém jazyce na Filozofické fakultě UK v Praze a ve svých textech zpracovávají obdobnou tematiku, tj. vztahy mezi mladými lidmi, problémy jejich života apod.

Kvantitativní analýzu těchto dvou výběrů jsem opřela o zřetel ke slovním druhům, resp. k jejich skupinám, které byly zjištěny ve FSČ a jejichž vymezení a význam jsem podrobila zkoumání v řadě svých dalších prací (srov. pozn. 3, zvláště OLS, s. 85n.). Připomeňme jen, že jde o tři skupiny slovních druhů sestavené podle hlediska frekvenčního, a to skupina (1.) nominální (substantiva, adjektiva a předložky), (2.) verbální (slovesa, zájmena, adverbia a spojky), (3.) ostatní (číslovky,[5] citoslovce a částice[6]). V tomto příspěvku věnuji pozornost jen prvním dvěma skupinám.

Výsledky slovnědruhové analýzy založené na skupině nominální a verbální v obou textech jsem při tomto studiu srovnávala s normou FSČ, popř. FSČ_A[7] a podle potřeby s výsledky téže analýzy čtyř relativně stejně dlouhých prozaických textů zařazených do materiálu FSČ, resp. FSČ_A (V. Vančura, Konec starých časů (délka textu N = 30 281 slov), J. Mařánek, Barbar Vok (N = 30 145); I. Olbracht, Bratr Žak (N = 29 803) a K. Horký, Pískání v lese (N = 28 084)).

Při uvedené analýze jsem došla k těmto dílčím poznatkům:

1. Opakování druhů slov

Vzhledem k tomu, že výběry z obou textů, V_w a P, jsou stejně dlouhé (N = 3000 slov), vyloučila jsem možné opakování jednotlivých druhů slov v závislosti na délce textu N. Také u srovnávacích textů z FSČ jsem se snažila minimalizovat význam různé délky textu (srov. výše). Vyloučila jsem tak činitele, který má nemalý vliv na výsledky kvantitativní analýzy pořízené na materiálu o malé délce.

Jak ukazuje tab. č. 1 (s. 9), i při stejné délce textu N se jednotlivé druhy slov v textech V_w a P opakují nestejně často, srov.:

[3]A. skupina nominální: Otestujeme-li významnost rozdílů mezi absolutními četnostmi příslušných druhů slov testem dobré shody χ² na 5%ní hladině významnosti,[8] potvrzuje se, že se při stejné délce obou textů jednotlivé druhy slov v této skupině opakují nestejně často a že rozdíly mezi nimi jsou statisticky významné. Platí to především o adjektivech. Pokud jde o opakování substantiv, jsou rozdíly ve frekvenci mezi nimi na první pohled mnohem menší, ale statisticky významné. Frekvence předložek je v obou textech celkem shodná. Tuto tendenci v opakování druhů slov ve skupině nominální potvrzují i čtyři texty z FSČ (Vančurův a Mařánkův, Olbrachtův a Horův).

Srovnání s normou FSČ, popř. FSČ_A ukazuje, že se text V_w opakováním druhů slov ve skupině nominální téměř shoduje s normou platnou pro češtinu, naproti tomu text P s normou platnou pro jazyk české prózy (srov. tab. č. 1).

Na základě srovnávání všech uvedených dat lze dojít k vysvětlení, že shody a rozdíly mezi analyzovanými texty ze současné prózy v nominální skupině jsou podmíněny především individuálním stylem jejich autorů. Nejvýraznější rozdíly v opakování adjektiv v této skupině vyplývají dále ze slovnědruhového charakteru adjektiv a jejich užívání v jazyce i stylu, jak objektivním, tak i subjektivním. V tom směru se v užívání jednotlivých druhů slov ve skupině nominální v současné české próze zřejmě nic významného za uplynulých 50 let neudálo.

B. skupina verbální: Také opakování slovních druhů řazených z hlediska frekvenčního do skupiny verbální jsem zhodnotila testem χ² na 5%ní hladině významnosti ve stejných textech jako ve skupině nominální (srov. výše). I ve skupině verbální se zamítá hypotéza o shodném rozložení příslušných druhů slov, resp. o jejich opakování. Ve všech textech se významně liší opakování zejména sloves a adverbií, menší rozdíly, ale statisticky významné jsou v opakování zájmen a spojek, tj. druhů slov s omezeným rozsahem slovníku (srov. OLS, s. 148n. a s. 171n.).

Srovnání s normou FSČ, popř. FSČ_A (srov. tab. č. 1) ukazuje v opakování sloves v textu V_w shodu s FSČ, text P překračuje normu české prózy FSČ_A. Opakování adverbií je v obou textech vyšší, než je norma FSČ i FSČ_A. V opakování zájmen se text V_w shoduje s normou FSČ, text P s normou FSČ_A. Spojky se v obou textech opakují celkem shodně, přičemž nedosahují normy ani FSČ, ani FSČ_A.

Příčiny rozdílného opakování jednotlivých složek skupiny verbální lze hledat – ve srovnání se skupinou nominální – především v slovnědruhovém charakteru jejích složek a potom v individuálním užívání těchto jazykových prostředků v jazyce různých autorů. V tom nejsou rozdíly mezi prozaickými texty současnými a texty z FSČ, resp. FSČ_A.

[4]2. Rozsah slovníku podle druhu slova

Vyjděme z tab. č. 2 (s. 9), která uvádí rozložení druhů slov ve slovníku dvou analyzovaných textů ze současné prózy, V_w a P, a zůstaňme u jejich dělení na skupiny nominální a verbální. Při stejné délce textů je na první pohled patrno, že se zastoupení jednotlivých skupin a jejich složení liší, srov.:

A. skupina nominální: Test dobré shody χ² potvrdil zde významnost rozdílů mezi jejími složkami. Platí to především o slovníku adjektiv, který je zvláště v textu V_w větší („bohatší“[9]) než v textu P; v menší míře to platí o slovníku substantiv v textu V_w. Slovník předložek, počtem omezený (srov. výše), se statisticky významně neliší. Tuto tendenci v rozsahu slovníku skupiny nominální v podstatě dokládají i text Vančurův a Mařánkův. Naproti tomu v textu Olbrachtově a Horově jsou slovníky jednotlivých složek v této skupině svým rozsahem statisticky shodné, jak potvrdil test χ² na 5%ní hladině významnosti

χ² = 1,103 < χ² _0,05;2 = 5,99.

Srovnání s normou FSČ, popř. FSČ_A ukazuje jen v textu V_w u adjektiv celkem shodu s FSČ, resp. i FSČ_A (srov. tab. č. 2).

U rozsahu slovníku adjektiv a do jisté míry i substantiv v uměleckém stylu opět zřejmě převažuje charakteristický rys individuálního stylu autora. Stylistický záměr (zvláště u adjektiv) převládá nad gramatickou podstatou tohoto druhu slova, vyznačujícího se významovou i formální závislostí na substantivu.

B. skupina verbální: I ve slovníku slovních druhů příslušných do této skupiny existují statisticky významné rozdíly v textu V_w a P, jak ukázal test dobré shody χ². Liší se početně slovník (1.) sloves (je relativně vyšší v textu P) a (2.) adverbií (vyšší počet jich nacházíme v textu V_w). Totéž celkem platí i o slovníku zájmen a spojek.

Naproti tomu u Mařánka je počtem silnější slovník adverbií než slovník sloves, u Vančury je tomu naopak. Slovníky zájmen a spojek jsou v těchto textech do značné míry shodné. Poměrně stejné relace nacházíme i v druhých dvou textech, Olbrachtově a Horkého.

Slovník ve skupině verbální a zejména poměr jeho jednotlivých složek v jazyce současné české prózy závisí tedy zřejmě především na povaze (významové a formální) příslušných slovních druhů, v druhé řadě na individuálním stylu autora. Tento druhý zřetel převládá v próze u adverbií.

3. O nejčastějších slovech v slovníku V

Porovnejme frekvenční slovníky textů V_w a P, resp. prvních 10 nejčastějších slov s normou FSČ:
[5]V_w: (1.) a (spojka), (2.) v/e, (3.) být/ne, (4.) já, (5.) na, (6.) ten, (7.) že, (8.) říci, (9.) on, (10.) z/e;
P: (1.) on, (2.) ten, (3.) a, (4.) být/ne, (5.) na, (6.) že, (7.) v/e, (8.) k/e, (9.) do, (10.) se (zájm.);
FSČ: (1.) a (spojka), (2.) být/ne, (3.) ten, (4.) v/e, (5.) on, (6.) na, (7.) že, (8.) s/e, (9.) z/e, (10.) který.

Pokud jde o frekvenční slovník textu V_w, shoduje se v charakteru slovnědruhové příslušnosti i v jejich konkrétní podobě doložení v 80 % s nejčastějšími slovy ve FSČ. Kromě prvního nejčastějšího slova (spojky a), které představuje podle FSČ první nejčastější slovo v českém jazyce vůbec, především v projevech psaných, je pořadí prvních 10 nejčastějších slov v textu V_w ve srovnání s FSČ různě posunuto; závisí to zřejmě na omezené délce analyzovaného textu.

Uvedené konstatování v zásadě platí o frekvenci prvních nejčastějších slov v textu P. Frekvenční slovník tohoto textu se v 70 % rovněž shoduje s FSČ za stejných okolností (vzhledem k slovnědruhové příslušnosti a ke konkrétní podobě). Na rozdíl od frekvenčního slovníku textu V_w nacházíme jako první nejčastější slovo v textu P osobní zájmeno on (114×) a na druhém místě zájmeno ten (94×). V obou případech jde o relativně velkou početní převahu (srov. v textu V_w nejčastější slova a (79×), v/e (77×)).

Srovnáváme-li rozložení nejčastějších slov ve FSČ, odděleně ve stylu uměleckém a ve stylu věcném,[10] ukazuje se, že zájmeno on je relativně nejčastějším slovem v jazyce uměleckého stylu (v 79,52 %, v jazyce věcného stylu ve 20,48 %), druhým nejčastějším slovem zájmeno ten (v 73,44 %, v jazyce věcného stylu v 26,56 %); u ostatních druhů slov se relace v uměleckém stylu pohybuje v intervalu 68,66 % (u předložky s/e) – 60,99 % (u spojky že). Pod 50 % klesá v jazyce uměleckého stylu frekvence předložky v/e (49,44 %) a zájmena který (47,69 %); těžiště frekvence těchto dvou slov je v jazyce věcného stylu.[11]

Relativně vysoká frekvence zájmen on a ten ukazuje na charakteristické rysy jazyka uměleckého stylu, jednak vzhledem k formě textu (autorská řeč v 3. os., zvl. sg.) a jednak blízkost k mluvené formě projevu (využívání formy dialogu, resp. přímé řeči). Sem se hlásí i nejvíce frekventované osobní zájmeno já v textu V_w, který je napsán převážně v tzv. ich-formě. Toto zájmeno – podle FSČ – patří v češtině na začátek druhé desítky slov nejčastějších v jazyce vůbec.

Do prvních 10 nejčastějších slov v analyzovaných textech se – jak zřejmo – z hlediska významového hlásí tzv. slova gramatická, formální.[12] V textu V_w se me[6]zi ně dostalo i jediné slovo plnovýznamové, sloveso říci, které je ve FSČ třetím nejčastějším plnovýznamovým slovesem (na začátku 5. desítky nejčastějších slov). V textu P se vyskytuje rovněž jako první plnovýznamové sloveso, ale nacházíme je až v druhé polovině druhé desítky nejčastějších slov. Rozdíly v pořadí tohoto slova závisejí především na omezené délce analyzovaných textů, ale i na sémantické povaze tohoto slovesa. Jako jedno z nejčastějších tzv. sloves dicendi uvozuje přímou i polopřímou řeč v textu. Zvláště přímé řeči je v textu V_w a P velmi mnoho. Pro toto tvrzení nám bohužel dosud chybějí statisticky reprezentativní data.

S klesající frekvencí přibývá zvláště plnovýznamových slov různě závislých na řadě okolností.[13]

4. Délka věty

Při studiu frekvence slov v textech uměleckého stylu zaslouží si pozornosti nejen výběr slov z hlediska sémantického, ale i jejich úloha při výstavbě textu, a to jak v jeho relativně nejmenší jednotce – větě, tak i v jednotkách vyšších – v odstavcích, popř. kapitolách apod. To se projevuje zejména v délce věty (větného celku, popř. v jednotce dále strukturované z hlediska syntaktického). Je obecně známo, že právě délka věty byla již dávno hodnocena jako významná charakteristika individuálního stylu.[14]

Jako větu (větný celek) chápu v tomto příspěvku grafickou jednotku, tj. slovo nebo skupinu slov „od tečky k tečce“, resp. od velkého písmena na začátku ke koncovému znaménku (srov. pozn. 3, Využití statistických metod v gramatice, s. 11n., s. 134n.). Ponechávám zde stranou problematiku tohoto „mechanického“ pojetí věty, z hlediska kvantitativního má však jisté výhody zejména v tom, že zajišťuje co možná homogennost statistického souboru.

V obou analyzovaných textech ze současné české prózy, V_w a P, se výrazně liší průměrná délka věty. Na stejně dlouhý text (N = 3000 slov) připadá

v textu V_w 297 vět o průměrné délce 10,10 slov,

v textu P 444 vět o průměrné délce 6,67 slov.
Ve FSČ nebyla analogická data bohužel zpracována, z tehdejších technických důvodů to při rozsáhlém materiálu (korpusu) ani nebylo možné. K porovnání nám vhodná data mohou zatím poskytnout pouze dva texty, které jsem zpracovala z hlediska syntaktického sice k jiným účelům, ale podle stejných zásad, a to text K. Čapka (pozn. 1) a text I. Kříže.[15] Při stejné délce výběrů z obou textů (N = 3000 slov) nacházíme

[7]v textu Čapkově 639 vět o průměrné délce 4,69 slov,

v textu Křížově 628 vět o průměrné délce 4,78 slov.

Počet vět i jejich délka v textu Čapkově i Křížově jsou vzácně vyrovnané, naproti tomu délka vět v textech ze současné prózy je značně odlišná, a to výrazně delší. I když je známo, že o délce věty rozhoduje řada činitelů, které souvisejí se strukturou věty (srov. d. cit. v pozn. 4, Kvantitativní charakteristiky, zvl. s. 122n.), zaslouží si naši pozornost jasná tendence v ukázkách ze současné prózy – užívat poměrně dlouhou větu. Zvlášť to platí o textu V_w, kde najdeme např. větu, resp. větný celek o délce 93 slov[16] (s. 18, ř. 18–28):
(Alespoň krátce k mé třídě: někteří žáci byli, zjednodušeně řečeno, trochu problémoví a svůj vztah k nim jsem hledal hodně dlouho – avšak ještě i v letech, kdy už jsme vzájemně vycházeli celkem dobře, se celé třídy čas od času zmocnila jakási kolektivní nepříčetnost, během níž většinou rozházeli a rozdrtili po podlaze několik krabic barevných kříd, popřípadě za pomoci přezrálého pomeranče vytvořili na čerstvě vymalovaných stěnách nový osobitý vzorek – po mém rozlíceném příchodu potom jen klopili zrak, ještě celí zpocení a udýchaní, a když jsem jim vztekle zdvihal za bradu hlavy, v jejich očích byla jen dětská nevinnost.)
I když je větný celek uveden v závorkách, což naznačuje, že má charakter poznámky, je umístěn jako organická součást textu a jeho bohatá vnitřní strukturovanost (s obsáhlou vložkou vedlejších vět vzájemně na sobě závislých) se nevymykají z celkové výstavby větných struktur v textu V_w. Potvrzuje to i následující větný celek (s. 18, ř. 28–32); svou délkou (32 slov) se blíží spíše délce věty v jazyce stylu věcného (srov. pozn. 4, Kvantitativní charakteristiky, s. 220). Ale to už je problematika, která není předmětem tohoto příspěvku.

Také v textu P nacházíme delší větu, ačkoli výrazně kratší než v textu V_w. Srov. např. větu o 28 slovech (s. 16, ř. 19–23):
Občas se ohlédli na světlovlasého prvňáčka, který se usadil v rozevřeném okně, klátil nohama, pomalu jedl svačinu a obdivně pozoroval desetiletého kolegu, který bosky šplhal na zčernalou sochu Učitele národů.
Větné struktury v této ukázce dobře ukazují autorčinu tendenci užívat kratší větu hlavní a bohatěji rozvitou větu vedlejší. V rámci věty, ať již věty hlavní nebo tzv. klauze, dává autorka přednost několikanásobnému přísudku, jak dokládá i naše ukázka. Tato tvrzení by ovšem bylo třeba opřít o rozsáhlejší materiál, který by si zasloužil i podrobného rozboru z hlediska syntaktické statistiky vůbec. To samozřejmě platí i pro text V_w.

[8]Závěry

Opakování slovních druhů v textu uměleckého stylu současné české prózy je – podle očekávání – závislé jednak na jejich základní sémantické a funkční povaze, jednak na individuálním stylu autora. Ve skupině nominální převažuje – jako v textech FSČ, zvl. FSČ_A – vliv autorského stylu. Vyznačuje se v tomto stylu obvyklou zvláštní volností v užívání adjektiv a do jisté míry i substantiv, zřejmě vzhledem k významovému i formálnímu vztahu těchto dvou slovních druhů v jazyce vůbec. Ve skupině verbální uměleckého stylu současné prózy převládá gramatický charakter u většiny jejích složek nad individuálním výběrem těchto slov v autorském stylu. Připomeňme, že se do těchto složek hlásí spojky, zájmena a do jisté míry i adverbia (srov. pozn. 12), tedy slova gramatická, formální.

Co se týče rozsahu slovníku u jednotlivých druhů slov v jazyce současné české prózy, potvrzuje se základní tendence zjištěná u opakování slovních druhů v textu. Ve skupině nominální převládá vliv individuálního stylu autora (zvláště u slovníku adjektiv a do jisté míry i substantiv). U slovníku skupiny verbální se zřejmě v prvé řadě uplatňuje slovnědruhový charakter jednotlivých složek této skupiny. Individuální styl autora se projevuje v současné próze u slovníku adverbií, do značné míry ve vztahu ke slovesu. Vysvětlení lze hledat zvláště u slovníku plnovýznamových adverbií, popř. i v jejich vztahu k adjektivům, tedy napříč obou skupin, nominální a verbální.

U nejčastějších slov doložených v analyzovaných dvou textech ze současné prózy zjišťujeme shodu v tom, že to jsou – podle očekávání – opět slova gramatická, formální. Rozdíl mezi oběma texty je v tom, že v textu V_w to jsou celkem nejčastější slova v češtině vůbec (srov. první nejčastější slovo a), kdežto v textu P se tato slova více hlásí mezi slova nejčastější v jazyce uměleckého stylu (srov. první dvě nejčastější slova – zájmena on a ten). Tato slova spolu s relativně nejčastějším plnovýznamovým slovesem dicendi říci ukazují na častý výskyt přímé řeči v textu, na bohatý dialog ve stylu jazyka hovorového.

Uspořádání slov ve větě, ve větném celku různě vnitřně strukturovaném, se mimo jiné projevuje v délce věty, uznávané stylistické charakteristice (srov. pozn. 14). V textech současné české prózy se projevuje tendence užívat větu delší, resp. strukturovanější větné celky.

Tato i ostatní zjištění, která tu předkládám, bylo by ovšem třeba doložit na rozsáhlejším materiále. Kromě uvedených závěrů však podle mého názoru také ukazují, že FSČ je dosud platnou normou pro český jazyk, resp. pro jeho tzv. funkční styly z hlediska kvantitativního. Téměř půl století, kdy FSČ vznikl, je zřejmě krátká doba na to, aby se frekvence slov a jejich základních kategorií, zvláště gramatických a funkčních, významněji změnila. Konstantnost slovnědruhových kategorií a jejich fungování v českém jazyce a textu je v daném čase nepochybně silnější než variabilita individuálního stylu autorského.

[9]Frekvence slovních druhů v textu (N)
Text	V_w		P		FSČ	FSČ_A
Druh slova	počet		počet		počet
/
Skupina	absol.	%	absol.	%	%	%
Substantiva	782	26,07	691	23,03	27,77	25,12
Adjektiva	385	12,83	223	7,43	11,16	8,78
Předložky	291	9,70	258	8,60	10,12	9,97
Σ	1458	48,60	1172	39,06	49,05	43,87
Slovesa	540	18,00	774	25,80	18,15	20,17
Zájmena	315	10,50	383	12,77	10,91	12,57
Adverbia	371	12,37	339	11,30	10,29	10,97
Spojky	212	7,07	213	7,10	9,78	10,45
Σ	1438	47,94	1709	56,97	49,13	54,16
Ostatní	104	3,46	119	3,97	1,82	1,97
ΣΣ	3000	100,00	3000	100,00	100,00	100,00

Tab. č. 1

Rozsah slovníku (V) podle druhů slov
Text	V_w		P		FSČ	FSČ_A
Druh slova	počet		počet		počet
/
Skupina	absol.	%	absol.	%	%	%
Substantiva	488	32,91	404	30,31	38,93	37,34
Adjektiva	283	19,08	175	13,13	20,98	19,47
Předložky	37	2,49	21	1,58	0,74	0,55
Σ	808	54,48	600	45,02	60,65	57,36
Slovesa	314	21,17	442	33,16	27,05	30,60
Zájmena	37	2,49	33	2,47	1,03	0,87
Adverbia	231	15,58	186	13,95	9,04	9,13
Spojky	36	2,43	25	1,88	0,92	0,70
Σ	618	41,67	686	51,46	38,04	41,30
Ostatní	57	3,85	47	3,52	1,31	1,34
ΣΣ	1483	100,00	1333	100,00	100,00	100,00

Tab. č. 2

[1] M. Těšitelová, Frekvence slov a tvarů ve spise „Život a dílo skladatele Foltýna“ od Karla Čapka, NŘ 12, 1948, s. 126–130.

[2] J. Jelínek, J. V. Bečka, M. Těšitelová, Frekvence slov, slovních druhů a tvarů v českém jazyce, SPN, Praha 1961, FSČ.

[3] M. Těšitelová, Otázky lexikální statistiky, Academia, Praha 1974, OLS; Využití statistických metod v gramatice, Academia, Praha 1980; Quantitative Linguistics, Academia, Praha 1992; O historii české kvantitativní lingvistiky (Příspěvek k historii lingvistiky), rukopisná práce, Praha 1993.

[4] M. Těšitelová a kol., Kvantitativní charakteristiky současné češtiny, Academia, Praha 1985, Kvantitativní charakteristiky; M. Těšitelová, J. Petr, J. Králík, Retrográdní slovník současné češtiny, Academia, Praha 1986.

[5] Pokud nejsou z hlediska formálního zařazeny mezi substantiva a adjektiva, popř. adverbia.

[6] Tato kategorie slov nebyla ve FSČ uvedena samostatně; kolísala tehdy mezi adverbii a citoslovci, a proto byla zařazována převážně mezi adverbia. Během posledních 50 let se však konstituovala jako samostatný slovní druh; jeho frekvence je však do té míry nízká, že nemá vliv na číselné relace frekventovaných druhů slov ani jejich skupin. – K hranici těchto slov srov. M. Vondráček, Citoslovce a částice – hranice slovního druhu, NŘ 81, 1998, s. 29–37; týž, Příslovce a částice – hranice slovního druhu, NŘ 82, 1999, s. 72–78.

[7] FSČ_A se rozumí ve FSČ první skupina textů z beletrie – A, tj. texty č. 1–16, s. 20.

[8] Vzorec pro výpočet testu dobré shody χ² zde z nedostatku místa neuvádím (srov. OLS, s. 53n.). Totéž platí i pro výpočty tohoto testu, pokud zamítají hypotézu, že rozdíly v počtu slov mezi analyzovanými texty nejsou statisticky významné. Komentuji zde pouze některé dílčí výpočty při aplikaci tohoto testu.

[9] M. Těšitelová, On the so-called Vocabulary Richness, PSML 3, 1972, s. 103–120.

[10] Ve FSČ se do uměleckého stylu zařazují skupiny textů A, B, C, D (FSČ_A–D), do věcného stylu skupiny E, F, G, H (FSČ_E–H).

[11] M. Těšitelová a kol., Frekvenční slovník češtiny věcného stylu, interní tisk Ústavu pro jazyk český ČSAV, Praha 1983.

[12] M. Těšitelová, On the Frequency of Function Words, PSML 5, 1976, s. 9–28.

[13] K tomu srov. např. J. Kraus, Úvod do stylistiky pro informační pracovníky, Ústředí vědeckých technických a ekonomických informací, Praha 1977, s. 43n.

[14] G. U. Yule, Length as a Statistical Characteristic of Style in Prose, An Introduction to the Theory of Statistics, 1940, s. 250–280. – Ostatní literatura u M. Těšitelové Quantitative Linguistics, pozn. 4, zvl. s. 165n., 126n.

[15] Ivan Kříž, Úsek častých nehod (povídka První den mého syna), Mladá fronta, Praha 1965.

[16] Ve shodě s převažujícím pojetím slova v české lexikální statistice chápu zde „slovo“ jako grafickou jednotku, tj. písmeno nebo skupinu písmen mezi dvěma mezerami, přičemž respektuji narušení této zásady morfologickým systémem českého slovesa, některými syntagmatickými konstrukcemi aj. (OLS, s. 14n.).

Naše řeč, ročník 83 (2000), číslo 1, s. 1-9

Předchozí Z dopisů jazykové poradně

Následující Stanislava Kloferová: Vlastní jména v Českém jazykovém atlase

Menu
Úvod
Archiv
O archivu
Hledání v archivu:
Autor