Neil Bermel
[Články]
The Rules of the Czech Orthography as carrot or stick? Orthography in the Czech National Corpus (part 1)
Otázka, jak vnímat a přijímat pravopisné změny z r. 1993, rozpoutala po vydání Pravidel bouřlivou diskusi mezi českými intelektuály, ale dodnes neupoutala velkou pozornost badatelů jako sociolingvistický fenomén.[1] Třináct let po uvedení této pravopisné úpravy je namístě se zeptat, jak se změny projevily v českých textech tohoto období.
Abychom zjistili, co se dá od takové analýzy očekávat, je poučné podívat se, co se o Pravidlech říkalo, když vycházela. Byla koncipována jako posun v pravopisné normě od jedněch variant k druhým, či jako otevření normy dalším pravopisným možnostem?
V předmluvě k akademickému vydání Pravidel z r. 1993[2] se od autorů dočteme, že:
„… chápeme pravopisná pravidla jako soubor doporučení pro vytříbené písemné vyjadřování, od nichž se lze ve zvláštních případech odchýlit, pokud to píšící považuje za potřebné a zdůvodněné.“ (PČP 1993, s. 9)
Z předmluvy vyznívá, že Pravidla jsou a priori všeobecně uznávanou autoritou a odchylek od ní se pisatel dopouští raději jen tehdy, když tím sleduje nějaký záměr nebo k tomu má nějaký důvod. Výsledkem kodifikace by asi měl být tedy spíš posun k nově kodifikovaným podobám v tištěných médiích. Výjimky by však nadále tvořily texty se zvláštním záměrem a stylizací, dejme tomu v beletrii.
Výroky jednotlivých autorů před vydáním Pravidel a po něm jsou však o něco méně kategorické. Zdeněk Hlavsa, který vedl autorský tým tzv. „akademické“ verze Pravidel, zformuloval svůj postoj takto:
„V žádném případě samozřejmě nechceme, aby se nová Pravidla stala bičem. Pro školy sice budou závazná, ale dospělým lidem by měla sloužit spíše jako soubor návodů, jak se jazykově kultivovaně chovat. Co si kdo vybere, je pak již jeho věc.“ (Český deník, 30. ledna 1993)
[2]Ačkoli Hlavsa tím připouští, že Pravidla nemají povahu právního kodexu, stejně namítá, že mají velkou kulturní váhu a že jenom ten, komu je jedno, jestli se chová kulturně nebo ne, je může ignorovat. Nicméně Hlavsovo mínění otvírá možnost, že rozhodnutí o přijetí či nepřijetí změn je na každém jednotlivci.
Olga Martincová z ÚJČ chápala situaci ještě třetím způsobem:
„Nová Pravidla českého pravopisu nejsou žádným zákonem, jedná se jen o doporučení Ústavu pro jazyk český, jak psát jednodušeji.“ (ZN noviny, 20. května 1993)
Martincová odpovídala za školní verzi Pravidel[3] a za styk se školstvím. I když školství bylo jedinou sférou, ve které se měla nová Pravidla uplatňovat bez diskuse a výjimek, názor Martincové je ještě mírnější než Hlavsův. Místo toho, aby apelovala na kulturní hodnotu Pravidel, zdůrazňuje možnosti volby a prosazuje funkčnost navržených změn (slibuje se snížená náročnost při psaní a pochopení psaného textu). Podle jejích výroků bychom nečekali v psaném úzu žádný rychlý posun, nýbrž otevření normy novým možnostem a následně značnou rozkolísanost v normě po dobu, než se díky jednoduchosti a průhlednosti změn úzus ustálí.
Tyto tři interpretace uplatňování pravopisných změn se dají ověřit na základě dat z českých tištěných médií 90. let. Jeden způsob, jak zhodnotit implementaci této pravopisné reformy, je analýza dat z velkých označkovaných korpusů, jakými jsou reprezentativní korpusy SYN2000 a SYN2005.[4] První z nich, SYN2000, je sestavený hlavně z textů devadesátých let, a to převážně z publicistiky, takže nabízí pohled na pronikání pravopisných novot před rokem 1993 a po něm – kdežto SYN2005 (s širším výběrem nenovinových textů, srov. níže část 2) umožňuje pohled na to, jak tyto trendy pokračovaly na prahu nového tisíciletí.
Zdůrazněme ale, že oba korpusy ukazují realizaci reformy jenom v oficiálních tištěných zdrojích, které již prošly pravopisnou redakcí. Chybí v něm indikátory pronikání změn do úzu v soukromé sféře a do psaní jednotlivců ještě před redakčními zásahy, protože texty tohoto typu, jako dopisy, zápisy, textové zprávy, rukopisy atd., tvoří jenom nepatrnou část SYN2000 i SYN2005.[5] Přesněji řečeno, naše údaje tedy dávají obraz toho, jak jednotlivé návrhy pravopisné reformy během 90. let minulého století pronikaly do tištěných médií, či naopak jimi nebyly přijímány.
Změny z r. 1993 byly většinou dílčí a nepřinesly žádné zásadní posuny. V psaní velkých písmen se značně rozšířil okruh institucí, u kterých píšeme velké písmeno [3]na začátku (např. u škol, fakult, soudů, úřadů); také v názvech ulic typu Na Příkopech se po předložce objevilo velké písmeno.
Největší dopad měly změny na psaní přejatých slov: (1) nová Pravidla zavedla u některých slov psaní -z- vedle -s- a u řady dalších slov toto nové psaní doporučila jako jediné; (2) znovu bylo zavedeno psaní krátkých samohlásek v poslední slabice kmenu cizích slov. Doporučeno bylo:
-z- místo -s- u slov univerzita, filozofie, prezident, kde byly od 70. let přípustné obě varianty;
-z- vedle -s- u slov typu diskuse, organismus;
krátká samohláska v poslední slabice tvarotvorného základu typu balon, archiv, galerie (ale ne vždy, slova byla přehodnocena jednotlivě, viz např. margarín).
Výsledkem pravopisných debat v r. 1993–94 byl tzv. Dodatek k Pravidlům, který znovu zavedl dříve vyřazené varianty se -s- a stanovil hierarchii přijatelnosti pro každou pravopisnou dvojici. Členy dvojice byly označeny buď jako základní, tj. neutrální, vhodné pro užití ve většině kontextů, nebo jako příznakové, tj. nikoli neutrální, něčím vybočující z normy denního úzu.[6] U slova kurs apod. byly jako základní označeny obě varianty, což umožnilo víceméně volný výběr mezi podobami:
výslovnost | pravopis „etymologický“ | pravopis „fonetický“ |
/s/ v konečné pozici, jinde /z/ | +kurs | +kurz |
/z/ uvnitř slova | ○universita | +univerzita |
/s/ či /z/ uvnitř slova | +diskuse | ○diskuze |
zakončení /zmus/ | +kapitalismus | ○kapitalizmus |
/o/ či /ó/ před koncovkou | +balon | ○balón |
/i/ či /ó/ před koncovkou | +archiv | ○archív |
+ stylisticky „základní/neutrální“
○ stylisticky „příznakové/neneutrální“
kurzivou se zvýrazňují podoby zavedené v nových Pravidlech r. 1993
Pravidla se měla používat v kombinaci s Dodatkem, takže souhra faktorů umožnila relativně širokou škálu možných interpretací. Budeme sledovat, jak se s tím vyrovnaly české tištěné texty, jejichž redaktoři byli zvyklí řídit se Pravidly z r. 1957 v pozdějších, nikterak zásadně odlišných verzích.
Jak řečeno výše, v našem výzkumu jsme se opírali o dva korpusy, které tvoří součásti Českého národního korpusu: SYN2000 a SYN2005.
Stomilionový korpus SYN2000 představuje reprezentativně vyváženou databázi textů z různých žánrů a období, valnou většinou z 90. let. Uvedené složení korpusu je následující: 60 % publicistika, 25 % odborná literatura, 15 % beletrie. Publicistiku tvoří noviny z let 1990–1999 v postupně stoupající kvantitě; největší objem textu pochází z deníků Mladá fronta Dnes a Lidové noviny.
Korpusový manažer v SYN2000 uvádí žánr, rok a přesný zdroj každého dokladu, což umožňuje, abychom podle těchto údajů různě zpracovali výsledky. Zkratky žánrů uvedené v korpusu a použité níže jsou:
ADM – administrativa | PUB – publicistika |
Zastoupení jednotlivých textů a titulů v korpusu působilo při naší analýze jisté potíže. Většina žánrů se neskládá z pravidelně se opakujících titulů, a proto je poněkud zavádějící sledovat je rok co rok: nemůžeme si být jisti, jestli srovnáváme texty skutečně srovnatelné. Publicistika naopak tvoří víc než polovinu korpusu, a proto se v ní dají sledovat posuny i po jednotlivých titulech. Objem textů rok od roku narůstá, takže obraz jazyka konce 90. let, který korpus dává, je tím věrnější. Hojně zastoupené deníky Lidové noviny a Mladá fronta Dnes jsou zařazovány od r. 1991 až do 1999 s jistou mezerou v roce 1995, kdy publicistiku zastupují Hospodářské noviny. Z menších časopisů a deníků je jenom Respekt v korpusu zastoupen průběžně za celé desetiletí; ostatní, jako např. Story, Reflex, Prostějovské noviny a Týden, se vyskytují jen v ojedinělých ročnících ke konci desetiletí. Velkou mezerou je nezařazení nejčtenějšího bulvárního tisku, např. Blesku, Špíglu atd., který by byl pro naše účely velice zajímavý.
Korpus SYN2005 je stejného rozsahu jak jeho předchůdce SYN2000 a je podobným způsobem lemmatizován a morfologicky označkován. Má však odlišnou strukturu a složení: beletrie tvoří 40 % korpusu, publicistika 33 % a odborná literatura 27 %. Oproti SYN2000 je v SYN2005 každý ročník publicistiky z 2001–2005 zastoupený ve stejném rozsahu a beletrie v něm pochází převážně z let 1990–2004. Publicistika navíc představuje širší výběr novin než v SYN2000, zahrnuje do nejfrekventovanějších titulů kromě LN a MF i Právo, Blesk a Hospodářské noviny.[7]
[5]Přes určité potíže, které představuje složení těchto dvou korpusů a rozdíly mezi nimi, se nicméně domníváme, že uplatňování určitých pravopisných jevů sledovat lze.
Opravdové posuny ve struktuře jazyka se v synchronním korpusu jen těžko odrazí: desetiletí (nebo pětiletí) je příliš krátká doba na to, abychom si všimli změn ve jmenných nebo slovesných tvarech. Pravopis je ale něco jiného, jelikož na rozdíl od opravdových změn ve struktuře české morfologie pravidla jednoho dne vyjdou a nabudou platnosti. Pokud je vydá nějaká víceméně uznávaná autorita, každá publikace či podnik na ně musí nějakým způsobem zareagovat: buď je přijme, nebo je odmítne, nebo si z nich něco vybere. Vzniká tím další fáze implementace kodifikace: přetlumočení a uplatňování „oficiálně“ kodifikovaných podob a pravidel. Tento fenomén bychom mohli nazvat „praktickou“ stránkou kodifikačního procesu.
V naší analýze probereme čtyři případy pravopisných variant, které se daly v korpusech snadno sledovat. Z nich dva představují variabilitu čistě pravopisnou, ve kterých pravopisná forma nemá na výslovnost žádné dopady (kurs/kurz a -ismus/-izmus), i když poměr mezi podobami uvnitř každé dvojice je podstatně odlišný. Ve třetím případě (až v příštím čísle NŘ) jde o výslovnostní dublety, ve kterých je nově uvedená varianta tradičně stigmatizovaná (diskuse/diskuze), a poslední příklad se týká variant způsobených neustálenou výslovností (citrón/citron).
Uvedení inovační podoby kurz a vyřazení tradiční podoby kurs v r. 1993 představovalo změnu čistě pravopisnou, bez dopadu na výslovnost; přesto tuto změnu brala česká veřejnost s velkou rezervou. Dodatkem z r. 1994 bylo užití nové podoby prohlášeno za volitelné a obě varianty byly uznány jako rovnocenné. Do jaké míry jsou rovnocenné opravdu, to se nám podařilo zjistit pomocí korpusu.
Celkem je v SYN2000 14 773 dokladů slova kurs/kurz. Z nich se v 11 897 případech (80,5 %) psalo -s-. Výskyt písmena -z- byl o něco vyšší u podob s koncovkou, kde výslovnost může vést k přijatelnosti nové varianty:
výslovnost | podoby na -s- | podoby na -z- |
SYN2000 | 11 897[8] (= 80,5 %) | 2876[9] (= 19,5 %) |
[s] | kurs (4758 = 84,5 %) | kurz (873 = 15,5 %) |
[z] | kurs- (7138 = 78,1 %) | kurz- (2003 = 21,9 %) |
| kursu (3369 = 80,7 %) | kurzu (805 = 19,3 %) |
| kursy (1723 = 72,9 %) | kurzy (640 = 27,1 %) |
| kurzů (397 = 22,1 %) | |
| kursem (397 = 86,5 %) | kurzem (62 = 13,5 %) |
| kursech (215 = 72,6 %) | kurzech (81 = 27,4 %) |
| kursům (36 = 67,9 %) | kurzům (17 = 32,1 %) |
| kurse (1 = 50,0 %) | kurze (1 = 50,0 %) |
SYN2005 | 5031 (= 55,3 %) | 4070 (= 44,7 %) |
[s] | kurs (1909 = 64,4 %) | kurz (1056 = 35,6 %) |
[z] | kurs- (3122 = 50,9 %) | kurz- (3014 = 49,1 %) |
| kursu (1516 = 56,7 %) | kurzu (1160 = 43,3 %) |
| kursy (786 = 48,8 %) | kurzy (824 = 51,2 %) |
| kursů (488 = 41,2 %) | kurzů (696 = 58,8 %) |
| kursem (170 = 53,3 %) | kurzem (149 = 46,7 %) |
| kursech (143 = 45,8 %) | kurzech (169 = 54, 2%) |
| kursům (16 = 51,6 %) | kurzům (15 = 48,4 %) |
| kurse (3 = 75,0 %) | kurze (1 = 25,0 %) |
Obdobné situace si všímáme i v SYN2005: převládají nadále starší podoby na kurs-, avšak na rozdíl od SYN2000 je výskyt -s- před koncovkou dokonce nižší než v koncové pozici. Nesmíme však přehlédnout častější výskyt nových podob na -z- v SYN2005, kde se poměr blíží 1 : 1 oproti 1 : 4 v SYN2000; vzhledem k odlišnému složení korpusů se k této otázce vrátíme až po podrobnější analýze zdrojů.
Obecný poměr této variace se příliš neliší od poměrů u podobných slov, jako jsou např. konkurs, impuls či puls, kde je konzervativní podoba zastoupena v 77 až 83 procentech dokladů v SYN2000 a v 62 až 74 procentech dokladů v SYN2005. Ve všech případech se v novějším korpusu vyskytují nové podoby o něco častěji.
Korpus | podoby na -s- | podoby na -z- |
SYN2000 | konkurs (3575 = 83,2 %) | konkurz (722 = 16,8 %), |
| impuls (2245 = 83,3 %) | impulz (449 = 16,7 %), |
| puls (331 = 77,2 %) | pulz (98 = 22,8 %), |
SYN2005 | konkurs (2141 = 71,9 %) | konkurz (838 = 28,1 %), |
| impuls (1816 = 74,3 %) | impulz (629 = 25,7 %), |
| puls (395 = 62,4 %) | pulz (238 = 37,6 %), |
Poněkud jiný obraz změn v tištěných médiích dává přehled zastoupených žánrů. Nejkonzervativnějším žánrem je bezesporu publicistika, kde tradiční podoba převládá v poměru 6 : 1. V beletrii rovněž převládá tradiční podoba, ale méně výrazně: přibližně 2 : 1. V populárně-naučné a vědecké literatuře a rovněž v administrativních textech naopak převládá koncovka inovační v poměru 2 : 1. Průlom v těchto textech se objevuje kolem roku 1996.
kurs- | kurz- | poznámky | |
SYN2000 |
|
|
|
NOV/COL | 128 (63,1 %) | 75 (36,9 %) |
|
ADM | 8 (34,8 %) | 15 (65,2 %) | z roků 1997–99 (-z- od 1997) |
POP | 302 (34,1 %) | 584 (65,9 %) | z roků 1978–1999 (-z- až od 1993, víc od 1997). |
SCI | 250 (38,1 %) | 407 (61,9 %) | z roků 1991–1999 (-s- až do 1996, od 1996 -z- čím dál víc) |
PUB | 10887 (86,5 %) | 1706 (13,5 %) | z roků 1990–99 (-z- již od 1991, a pravidelněji od r. 1992) |
SYN2005 |
|
|
|
NOV/COL | 648 (67,6 %) | 310 (32,4 %) | 190krát -s- před r. 1994 |
ADM | 6 (85,7 %) | 1 (14,3 %) | vše po roce 1993 |
POP | 470 (25,1 %) | 1403 (74,9 %) | 20krát -s- před r. 1994 |
SCI | 271 (22,6 %) | 927 (77,4 %) | 3krát -s- před r. 1994 |
PUB | 3215 (76,8 %) | 971 (23,2 %) | 2000–2004 |
Časovou posloupnost změn můžeme sledovat až v publicistice, která poskytuje dostatečné množství dokladů. Od samého počátku, dokonce i před zavedením nových Pravidel, je inovační podoba vždy zastoupena několikrát ročně. S výjimkou r. 1994 (viz níže) užití inovační podoby postupně stoupá, až dosáhne v r. 1999 poměr 1 : 3. Rozdílné složení korpusů znamená, že data nejsou přímo porovnatelná a nelze připisovat nějaký význam výraznému posunu mezi lety 1999 a 2000. V SYN2005 se poměr starších a inovačních podob pohybuje v rozmezí 1 : 7 až 1 : 5 v letech 2000–2003, v r. 2004 ale dochází k výrazné změně ve prospěch této podoby.
korpus | rok | kurs- | kurz- |
SYN2005 | 2004 | 444 (54,3 %) | 374 (45,7 %) |
| 2003 | 725 (83,3 %) | 145 (16,7 %) |
| 2002 | 695 (79,1 %) | 184 (20,9 %) |
| 2001 | 703 (84,5 %) | 129 (15,5 %) |
| 2000 | 648 (82,3 %) | 139 (17,7 %) |
SYN2000 |
|
|
|
| 1999 | 706 (67,2 %) | 345 (32,8 %) |
| 1998 | 1006 (74,9 %) | 338 (25,1 %) |
| 1997 | 1473 (79,1 %) | 390 (20,9 %) |
| 1996 | 3352 (96,6 %) | 117 (3,4 %) |
| 1995 | 1881 (97,0 %) | 58 (3,0 %) |
| 1994 | 1133 (77,8 %) | 323 (22,2 %) |
| 1993 | 593 (94,6 %) | 34 (5,4 %) |
| 441 (96,5 %) | 16 (3,5 %) | |
| 1991 | 224 (96,6 %) | 8 (3,4 %) |
| 1990 | 77 (97,5 %) | 2 (2,5 %) |
| neurčeno | 1 | 5 |
Data z jednotlivých novin svědčí o různorodosti přístupů ke změnám:
rok | LN | MF | Respekt | Prostějovské nov. | ||||
| kurs- | kurz- | kurs- | kurz- | kurs- | kurz- | kurs- | kurz- |
vše | 1832 | 298 | 3099 | 181 | 298 | 245 | 183 | 289 |
% | 86,1 | 13,9 | 94,5 | 5,5 | 54,9 | 45,1 | 38,8 | 61,2 |
1999 | 374 | 45 | 304 | 105 | – | – | – | – |
1998 | 0 | 6 | 203 | 53 | 0 | 64 | 35 | 138 |
1997 | 632 | 14 | 645 | 1 | 0 | 87 | 148 | 151 |
1996 | 395 | 7 | 837 | 7 | 1 | 68 | – | – |
1995 | 8 | 0 | 2 | 0 | 1 | 22 | – | – |
1994 | 197 | 185* | 697 | 6 | 83 | 1 | – | – |
1993 | 232 | 25 | 224 | 4 | 62 | 0 | – | – |
1992 | 214 | 9 | 187 | 5 | 40 | 1 | – | – |
1991 | 190 | 7 | – | – | 34 | 1 | – | – |
1990 | – | – | – | – | 77 | 1 | – | – |
* valná většina dokladů se -z- je z druhé poloviny roku
rok | LN | MF | Právo | HN | ||||
| kurs- | kurz- | kurs- | kurz- | kurs- | kurz- | kurs- | kurz- |
vše | 511 | 20 | 166 | 501 | 495 | 19 | 1313 | 31 |
% | 96,2 | 3,8 | 24,9 | 75,1 | 96,3 | 3,7 | 97,7 | 2,3 |
2004 | – | – | 12 | 279 | 117 | 0 | 182 | 6 |
2003 | 129 | 9 | 9 | 67 | 88 | 1 | 364 | 6 |
2002 | 164 | 4 | 5 | 107 | 98 | 1 | 250 | 8 |
2001 | 135 | 5 | 60 | 37 | 95 | 13 | 239 | 4 |
2000 | 88 | 2 | 80 | 11 | 97 | 4 | 278 | 7 |
rok | Respekt | Reflex | Blesk | Story | ||||
| kurs- | kurz- | kurs- | kurz- | kurs- | kurz- | kurs- | kurz- |
vše | 3 | 256 | 345 | 10 | 227 | 57 | 17 | 62 |
% | 1,2 | 98,8 | 97,2 | 2,8 | 79,9 | 20,1 | 21,5 | 78,5 |
2004 | 1 | 51 | 51 | 0 | 20 | 35 | – | – |
2003 | 1 | 29 | 65 | 3 | 39 | 19 | – | – |
2002 | 0 | 63 | 77 | 0 | 59 | 0 | – | – |
2001 | 0 | 49 | 103 | 5 | 62 | 1 | 9 | 15 |
2000 | 1 | 64 | 49 | 2 | 47 | 2 | 8 | 47 |
[9]V roce 1994 začala v Lidových novinách převažovat podoba na -z-, ale hned v r. 1995 těchto podob ubylo. Zřejmě šlo o pokus zavést nová Pravidla, který pak ztroskotal; inovační podoba je v tomto deníku doložena jen výjimečně (z pozdějších textů v korpusu SYN2000 a potom v SYN2005). Naopak v Mladé frontě je výskyt inovační podoby velice nízký až do r. 1998, kdy začíná stoupat poměr výskytů až na 1 : 4 a pak 1 : 3. Po dalších několika letech, během nichž podob na -z- nadále přibývá, se situace stabilizuje ve prospěch nové podoby a výskyty tradiční podoby na -s- jsou od r. 2002 řídké. Důvod by se dalo vypátrat a zřejmě vězí ve změnách buď v interní kodifikaci, nebo u dodavatelů textů (tiskových agentur atd.).
V Respektu je situace jasnější. Týdeník evidentně přešel plně na inovační podobu roku 1995 a při tom zůstalo. Regionální Prostějovské noviny (týdeník), evidované v korpusu jen za léta 1997–98, nabízejí smíšené výsledky, ale rozhodně v prospěch nové podoby.
Tiskoviny Reflex, Právo a Hospodářské noviny, které jsou doloženy převážně až v SYN2005, se drží víceméně konzistentně starší podoby, ačkoli v každém ročníku najdeme stopy nové podoby. Méně jasné svědectví najdeme v bulvárním deníku Blesk a v ženském časopise Story. Blesk se přiklání k tradiční podobě, ačkoli od r. 2003 je více dokladů podob na -z-. Story, která je v korpusu zastoupena jenom v letech 2000 a 2001, dává přednost nově kodifikované variantě, ale starší podoba se vyskytuje ve více než pětině dokladů.
Z výsledků se dá vyvodit, že nový způsob psaní slova kurz se během devadesátých let vesměs ujal v široké škále odborných i neodborných textů. Jeho absence v největších kvalitních denících a jinde v tisku však měla nepochybný podíl na pokračující rozkolísanosti v psaní tohoto slova. Nejistota kolem psaní tohoto slova a jeho odvozenin, která byla vždy aktuální pro píšící veřejnost, se tedy v 90. letech odrážela v tištěných textech čím dál víc.
Další příklad čistě pravopisné variability vnesené reformou r. 1993 je zavedení podob na -izmus. Na rozdíl od slova kurz se inovační podoby považovaly ze začátku za rovnocenné se staršími podobami na -ismus; Dodatek toto rozhodnutí odvolal a nové podoby označil za příznakové.
Korpusy potvrzují, že tyto inovační podoby se většinou neujaly. Obecný výskyt v SYN2000 je pod dvěma procenty (-ismus 56 063, tj. 98,7 %, oproti -izmus 753, tj. 1,3 %) a v SYN2005 pod třemi procenty (-ismus 48 152, tj. 97,4 %, oproti -izmus 1 306, tj. 2,6 %).[10] Při malém počtu dokladů je na místě dodat, že v některých případech (hlavně v publicistice) v SYN2000 jde přímo o příklady nového pravopisu.
[10]V jednotlivých žánrech jsme pak sledovali slovo organismus, které má relativně vysokou frekvenci a poněkud zvýšený počet dokladů s inovační podobou (v SYN2000 231 ze 4 370 dokladů (5,3 %) a v SYN2005 510 z 5 901 (8,6 %)). Dokladů této podoby je přesto málo ve většině žánrů.
korpus | vybrané žánry | organism- | organizm- | poznámky |
SYN 2000 | NOV/COL | 181 (96,8 %) | 6 (3,2 %) |
|
| TXB | 672 (98,2 %) | 12 (1,8 %) | -z- všechny z jedné učebnice, dokonce je v ní také -s-. |
| POP | 1 291 (93,8 %) | 86 (6,2 %) | -z- až od 1994 |
| SCI | 461 (82,0 %) | 101 (18,0 %) | -s- až do 1993 ve Vesmíru, -z- od 1993 tam a v jiných zdrojích |
| PUB | 1 628 (99,1 %) | 15 (0,9 %) | -z- od 1994, jen ojedinělé výskyty v LN, MF atd. |
SYN 2005 | NOV/COL | 326 (97,9 %) | 7 (2,1 %) |
|
| TXB | 1 193 (87,7 %) | 168 (12,3 %) | -z- výhradně u nakl. Karolinum |
| POP | 1 590 (93,8 %) | 105 (6,2 %) |
|
| SCI | 749 (80,2 %) | 185 (19,8 %) |
|
| PUB | 1 142 (99,3 %) | 8 (0,7 %) |
|
Poněkud překvapivé výjimky tvoří žánry populárně-naučných a vědeckých textů, ve kterých 6 % a 18 % dokladů slova organismus je inovačních. Z toho vyplývá, že jde o několik nakladatelství či redakcí, které se rozhodly řídit podle nových Pravidel striktněji než jinde.
Rozšířené možnosti vyhledávání v SYN2005 vrhnou na tuto otázku jiné světlo. Tříděním podle nakladatelství zjistíme, že všech 168 dokladů podoby organizm- z učebnic se vyskytlo v produkci nakladatelství Karolinum. V jiných textech z téhož nakladatelství však nacházíme dalších 713 dokladů podoby organism-, a proto nelze tvrdit, že nakladatelství „přešlo“ v tomto případě na nová Pravidla.
Ačkoli SYN2005 má víc dokladů nové podoby na -z-, než má SYN2000, zkoumáním frekvenční distribuce se dozvíme, že na roku vydání nezáleží. Nárůst používání nových variant není v porovnání po sobě jdoucích let lineární:
rok | počet -z- | počet -s- |
1965–1992 | 0 (0 %) | 81 (100 %) |
1993 | 2 (5,6 %) | 34 (94,4 %) |
1994 | 0 (0 %) | 496 (100 %) |
1995 | 48 (20,6 %) | 185 (79,4 %) |
1996 | 75 (10,4 %) | 647 (89,6 %) |
1997 | 143 (28,3 %) | 362 (72,3 %) |
6 (1,5 %) | 397 (98,5 %) | |
1999 | 18 (3,3 %) | 522 (96,7 %) |
2000 | 20 (2,7 %) | 722 (97,3 %) |
2001 | 33 (4,2 %) | 759 (95,8 %) |
2002 | 119 (20,7 %) | 456 (79,3 %) |
2003 | 17 (4,2 %) | 386 (95,8 %) |
2004 | 2 (0,8 %) | 261 (99,2 %) |
není uvedeno | 27 (-) | 59 (-) |
Letmý přehled zdrojů, ve kterých jsou doloženy podoby na organizm-, nás však vede k závěru, že ani uvnitř jednoho zdroje nemůžeme spoléhat na konzistentnost. Ve vybraných zdrojích najdeme jak organism-, tak organizm-:
Zdroje v SYN2005 | -s- | -z- |
Biologie buňky I | 3 | 17 |
Ikárie | 68 | 7 |
Soudní psychiatrie pro právníky | 5 | 1 |
Mezinárodní pravidla pro práci v chemických a biologických laboratořích | 16 | 47 |
Dětská traumatologie | 5 | 23 |
Semináře z lékařské chemie | 3 | 13 |
Kapitoly z klinické biochemie | 85 | 11 |
Transplantologie pro mediky | 1 | 10 |
Všechny ženy mohou být krásné | 1 | 9 |
Fyziologie a patologie dětské výživy | 4 | 7 |
Speciální metody molekulární biologie | 6 | 6 |
Speciální otorinolaryngologie | 5 | 1 |
Říční krajina | 6 | 4 |
Základy vědecké práce ve farmacii a v medicíně | 9 | 3 |
V textech, ve kterých se vyskytuje podoba na -z-, jsou ve valné většině případů doloženy i podoby na -s-, ale opačně to neplatí. Přechod na nové varianty totiž neproběhl hladce a valná většina dodavatelů textů zřejmě nebyla s to zabránit použití tradičních podob vedle záměrného uvedení nových variant. Nové podoby tedy zanesly variabilitu tam, kde (na rozdíl od slova kurz) před vydáním nových Pravidel žádná variabilita v korigovaných textech nebyla.[11]
Výsledky u dalších slov s příponou -izmus/-ismus jsou různé, ale potvrzují okrajový charakter inovační varianty. Oproti relativně stabilní situaci v SYN2000 jsou [12]výsledky ze SYN2005 rozkolísanější s vyšším výskytem nových podob u slova mechanismus, hlavně v oblasti textů populárně-naučných (329), vědeckých (173) a v učebnicích (102). Zase tu vedou nakladatelství Karolinum a Galén, i když jsou u nich rovněž zastoupeny tradiční podoby na -s-.
| podoby na -s- | podoby na -z- |
SYN2000 | mechanismus (4 256 = 94,1 %) | mechanizmus (265 = 5,9 %) |
| komunismus (3 860 = 96,4 %) | komunizmus (14 = 3,6 %) |
| socialismus (3 309 = 99,5 %) | socializmus (16 = 0,5%) |
SYN2005 | mechanismus (4 659 = 88,3 %) | mechanizmus (620 = 11,7 %) |
| komunismus (2 251 = 100 %) | komunizmus (0 = 0 %) |
| socialismus (2 094 = 99,6 %) | socializmus (9 = 0,4 %) |
Situace u slova na -asmus/-azmus se od -ismus/-izmus podstatně neliší, celková frekvence inovačních variant je vzhledem k dřívější kodifikaci této podoby o několik procent vyšší. Některá slova s tímto sufixem jsou velmi knižní (ikonoklasmus, chiliasmus, hésychasmus, orgasmus, chiasmus) a nevyskytuje se u nich ani jeden doklad se -z-. Zvýšený počet dokladů inovační podoby u slova spasmus tvoří zřejmě výjimku, protože ani u slova stejného registru orgasmus není situace stejná.[12]
| podoby na -s-[13] | podoby na -z- |
SYN2000 | -asmus (925 = 95,9 %) | -azmus (40 = 4,1 %) |
| spasmus (8 = 29,6 %) | spazmus (19 = 70,4 %) |
| orgasmus (328 = 97,3 %) | orgazmus (9 = 2,7 %) |
| marasmus (193 = 99,0 %) | marazmus (2 = 1,0 %) |
SYN2005 | -asmus (1 594 = 96,0 %) | -azmus (67 = 4,0 %) |
| spasmus (25 = 38,5 %) | spazmus (40 = 61,5 %) |
| orgasmus (805 = 99,8 %) | orgazmus (2 = 0,2 %) |
| marasmus (104 = 98,1 %) | marazmus (2 = 1,9 %) |
V pokračování této analýzy (příště) probereme výskyt pravopisných jevů spojených se změnami či kolísáním ve výslovnosti a dospějeme k závěrům ohledně uplatnění kodifikace během posledních 15 let.
[1] Srov. BERMEL, N. Linguistic Authority, Language Ideology, and Metaphor: The Czech Spelling Wars. Berlin : Mouton de Gruyter, 2007; monografie mj. mapuje reakce laické i odborné veřejnosti na Pravidla českého pravopisu (1993).
[2] Pravidla českého pravopisu. Praha : Academia, 1993.
[3] Pravidla českého pravopisu. Školní vydání. Praha : Pansofia, 1993.
[4] Viz http://ucnk.ff.cuni.cz.
[5] Od r. 2006 je zpřístupněn přes Bonito nový Korpus soukromé korespondence, který otevře jiný pohled na psaní v soukromé sféře.
[6] Pro délku samohlásek neoznačuje Dodatek k Pravidlům žádnou z dvou variant jako základní ani příznakovou. Z následujícího textu o nutnosti stylistické shody a z příkladů nicméně vyplývá, že varianty s krátkou samohláskou máme považovat za základní a varianty se samohláskou dlouhou za příznakové ve slovech, u nichž Pravidla 1993 uvádějí jen psaní se samohláskou krátkou a předchozí Pravidla jen se samohláskou dlouhou. Výjimku by zřejmě měla tvořit např. slova jako margarín, nadále psaná ve slovníku s délkou.
[7] Vzhledem k odlišnému složení korpusů by bylo zavádějící srovnávat data bez úpravy hrubých výsledků. (O způsobech matematického srovnání korpusů viz KŘEN, M. Srovnávací frekvenční seznamy z korpusů SYN2000 a SYN2005, na stránce http://ucnk.ff.cuni.cz/srovnani.html, 2006.) Zvolíme proto jinou cestu pro konfrontaci dat ze SYN2000 s daty ze SYN2005: konfrontujeme jenom výsledky ze stejných zdrojů, a to jenom v procentech, nikoli v hrubých počtech dokladů. Tam, kde se SYN2000 a SYN2005 rozcházejí ve zdrojích, bereme jejich výsledky jako doplňující, nikoli kontrastivní.
[8] Vyhledávka [(word=“…[Ss].*“) & (lemma=“kurs“)].
[9] Vyhledávka [(word=“…[Zz].*“) & (lemma=“kurs“)].
[10] Vyhledávky: [(word=“.*[Ii][Ss][Mm].*“) & (lemma=“.*ismus“)] a [(word=“.*[Ii][Zz][Mm].*“) & (lemma=“.*ismus“)]. Výsledky v tabulce se opírají o subkorpusy vytvořené podle žánrů.
[11] Otázka ovšem je, zda verze textů získané pro korpus, v nichž nejsou -izmy/-ismy sjednocené, jsou verze publikované; může jít o nefinální verze nakladatelského/redakčního zpracování.
[12] Pozoruhodné je slovo entusiasmus, doložené v korpusech SYN2000 a SYN2005 v následujících podobách: entusiasm- (7, 25), entuziasm- (139, 125), entuziazm- (4, 2). Dodejme, že např. PČP z r. 1957 a Slovník spisovného jazyka českého mají jak variantu entusiasmus, tak i entuziasmus.
[13] Vyhledávky [(word=“.*[Aa][Zz][Mm].*“) & (lemma=“.*a[sz]mus“)] a [(word=“.*[Aa][Zz][Mm].*“) & (lemma=“.*a[sz]mus“)]. Museli jsme použít tzv. „regulární“ výrazy uvnitř lemmatu kvůli nepravidelnému přiřazení těchto slov k lemmatům, viz níže 7.
Naše řeč, ročník 91 (2008), číslo 1, s. 1-12
Předchozí Z dopisů jazykové poradně
Následující Tomáš Jelínek: Nové značkování v Českém národním korpusu