Věra Vlková
[Reviews and reports]
-
Komplexní kvantitativní výzkum současné spisovné češtiny byl hlavní pracovní náplní úseku (odd.) matematické lingvistiky Ústavu pro jazyk český ČSAV již od 70. let.[1] Výsledkem tohoto výzkumu je nejen monografické zpracování některých zásadních otázek,[2] ale i mnohé studie časopisecké.[3] Vezmeme-li v úvahu i další, interně vydávané publikace pracovníků tohoto úseku, H. Confortiové, J. Králíka, M. Ludvíkové, I. Nebeské, L. Uhlířové a vedoucí autorského kolektivu M. Těšitelové, můžeme konstatovat, že výsledky kvantitativního výzkumu současného spisovného jazyka se nám tu dostávají do rukou ve třech různých podobách.
Setkáváme se tu jednak s podobou tradiční, tj. s frekvenčním slovníkem,[4] který slouží především ke studiu slovní zásoby, a to jak z hlediska jednotlivých složek věcného stylu, tak i z hlediska jejich vzájemné konfrontace.
Další dvě podoby zpracování kvantitativního výzkumu přináší řada Linguistica, která je vydávána pro interní potřebu ÚJČ ČSAV. Je to jednak kvantitativní popis a základní kvalitativní interpretace jednotlivých složek věcného [144]stylu,[5] jednak souhrn kvantitativních údajů ve formě tabulek, grafů a přehledů, týkajících se jednotlivých složek věcného stylu.[6]
Určitou syntézou statistických dat o gramatických jednotkách věcného stylu je práce, o které zde chceme informovat: Kvantitativní charakteristiky gramatických jevů v češtině věcného stylu. Tabulky a přehledy (Praha 1984, 77 s.). Výhodou tohoto nového, souhrnného způsobu zpracování gramatických (morfologických a syntaktických) jevů je to, že jednak umožňuje relativně úplné zachycení všech zkoumaných jevů a syntetické shrnutí materiálu zpracovaného v dílčích souborech statistických dat o jazyce jednotlivých složek věcného stylu, jednak vytváří optimální možnosti pro podrobnější výzkum gramatických jevů v současné češtině.
Soubor tabulek a přehledů se opírá o korpus věcného stylu v rozsahu 540 000 slov, který zahrnuje 180 000 slov (33 %) z funkčního stylu publicistického, 300 000 slov (56 %) ze stylu odborného a 60 000 slov (11 %) z administrativy. Materiálovou jednotku tvoří text, tj. 3 000 slov souvislého textu; to znamená, že celkem bylo zpracováno 60 textů publicistických, 100 textů odborných a 20 textů administrativních. Z toho na projevy psané připadá 75 % a na projevy mluvené 25 %. Všechny texty pocházejí z let 1972—1974. Tento materiál byl zpracován s použitím moderní výpočetní techniky, tj. samočinného počítače (např. Tesla 200 aj.), ve výpočetních střediscích ČSAV. Tím má práce průkopnický význam, nejen v kvantitativní lingvistice, ale i v lingvistice vůbec.
Při lexikální a gramatické analýze se pracovníci úseku matematické lingvistiky přidržovali třídění tradičního, které zatím poskytuje pro další kvantitativní i kvalitativní zpracování výhodné předpoklady. Je přitom samozřejmé, že s ohledem na různé možnosti kvantifikace na jednotlivých jazykových rovinách i s ohledem na různý stupeň zpracování jednotlivých rovin (kvantitativní popis syntaktických jevů je záležitostí teprve posledních let, neexistují proto ani dostatečné možnosti srovnání) dosahují výsledky zkoumání jednotlivých jazykových rovin různého stupně úplnosti a tím i různého stupně obecnosti.
Celá práce se dělí na dvě části. První část (tab. 1—38) je věnována přehledům frekvence slovních druhů a morfologických kategorií. V tabulkách a přehledech jsou systematicky zpracovány jednotlivé gramatické kategorie i jejich vzájemné kombinace a vztahy.
U každého slovního druhu je uvedena jeho frekvence, kvantitativní zpra[145]cování příslušných gramatických kategorií a seznam nejfrekventovanějších slov. Frekvenční seznamy nejfrekventovanějších slov slouží v této práci spíše jako ilustrace a doplnění materiálu. Jedním z důvodů jejich uvádění je i to, že frekvenční slovníky dílčích zkoumaných oblastí (stylu publicistického, odborného a administrativního) ani frekvenční slovník věcného stylu nejsou běžně dostupné. Největší důraz je kladen na co nejúplnější zachycení jednotlivých gramatických kategorií. Uvedený soubor tabulek tak dává možnost dalšího a hlubšího využití dat, jejich nových kombinací a souvislostí.
Druhá část práce (tab. 39—65) se soustřeďuje na frekvenci jevů syntaktických. V této oblasti je třeba ocenit především zaměření na kvantitativní výzkum funkce plnovýznamových slovních druhů na rovině syntaktické. Mnoho nových a cenných výsledků přináší i kvantitativní výzkum věty jednoduché a souvětí.
Interpretaci údajů získaných kvantitativním výzkumem současného spisovného jazyka bylo již věnováno mnoho místa.[7] Zde bychom chtěli vyzdvihnout především to, že uvedení kvantitativních charakteristik gramatických jevů v současné češtině ve formě tabulek a přehledů představuje v rámci výstupů kvantitativních výzkumů jazyka určité novum. (Platí to ovšem i o dílčích souborech tabulek a grafů pro jednotlivé složky věcného stylu — viz pozn. 5.) Dosud jsme se setkávali s uváděním tabulek, přehledů a grafů pouze jako s ilustrací v textu, nikoliv však v samostatném vydání. V uvedené publikaci se tak na minimálním prostoru podařilo shromáždit maximální množství dat relevantních pro kvantitativní i kvalitativní popis současného českého jazyka. Tyto údaje poskytují široké pole možností jak pro další, prohloubenější interpretaci a usouvztažnění, tak i pro uvádění jednotlivých kategorií do nových vztahů. To zajišťuje výsledkům kvantitativního výzkumu jazyka věcného stylu značně široké uplatnění, a to nejen pro češtinu, ale i pro kvantitativní výzkum jazyka vůbec.
[1] Viz např. M. Těšitelová, O kvantitativní analýze češtiny s pomocí moderní výpočetní techniky, NŘ 67, 1984, s. 47—50.
[2] M. Těšitelová, Otázky lexikální statistiky, Praha 1974; Kvantitativní lingvistika, Praha 1977; Využití statistických metod v gramatice, Praha 1980; M. Těšitelová a kol., Kvantitativní charakteristiky současné češtiny, Praha 1985.
[3] Srov. např. příspěvky ve sbornících Prague Studies in Mathematical Linguistics 7 a 8, Praha 1981 a 1983, The Prague Bulletin of Mathematical Linguistics č. 31, 32, Praha 1979 a v časopisech NŘ, SaS aj.
[4] Frekvenční slovník současné publicistiky, Praha 1980; Frekvenční slovník současné administrativy, Praha 1980; Frekvenční slovník současné odborné češtiny, Praha 1983; syntézou je pak Frekvenční slovník věcného stylu, Praha 1983.
[5] Kvantitativní charakteristiky současné české publicistiky, Linguistica II, Praha 1982; Psaná a mluvená odborná čeština z kvantitativního hlediska (v rámci věcného stylu), Linguistica IV, Praha 1983; Současná česká administrativa z hlediska kvantitativního, Linguistica XV, Praha 1985.
[6] Kvantitativní charakteristiky současné české publicistiky. Tabulky a grafy, Linguistica III, Praha 1982; Kvantitativní charakteristiky gramatických jevů v současné administrativě. Tabulky, Praha 1983; Kvantitativní charakteristiky současné odborné češtiny (v rámci věcného stylu). Tabulky a přehledy, Linguistica VII, Praha 1983.
[7] Srov. též recenzi J. Petra Kvantitativní charakteristiky současné češtiny, NŘ 69, 1986, s. 29—32.
Naše řeč, volume 69 (1986), issue 3, pp. 143-145
Previous Alena Polívková, Ivana Svobodová: O češtině každodenní
Next Emanuel Michálek: Vývoj spisovné češtiny