Časopis Naše řeč
en cz

Česká příjmení statisticky

Pavel Vašák

[Articles]

(pdf)

-

Statistické údaje o výskytu příjmení jsou potřebné a zajímavé nejen z hlediska čistě onomastického, ale vhodné např. i pro sestavování různých kartoték, adresářů, seznamů aj. Rovněž při některých sociologických, ekonomických i demografických výzkumech je třeba znát základní statistická data o rozložení příjmení.

Statistickým údajům o českých příjmeních byla zatím věnována poměrně malá pozornost. V jedné z posledních obsažných onomastických prací uvádí J. Beneš[1] orientační údaje o výskytu příjmení obsažených v Pražském adresáři z r. 1937. Beneš udává výskyt některých příjmení v počtu sloupců adresáře; zjistil, že adresář obsahuje 1685 stran po 4 sloupcích a ve sloupci je asi 90 adres. Uvádí např. nejčastější české příjmení Novák — v mužské podobě má 45 a ½ sloupce, v ženské podobě skoro 15 sloupců; následuje (podle celkového součtu) Novotný — 25¾ sloupce v mužské podobě, 8 sloupců v podobě ženské atd. Budeme-li považovat počet adres ve sloupci (tj. 90) za odhad průměru pro celý adresář, potom adresář obsahuje asi 1685. 4. 90 = 606 600 adres. Shrneme-li mužskou i ženskou podobu příjmení do jediného číselného údaje, potom dostaneme např. pro příjmení Novák 60 a ½ sloupce, tj. asi 5445 výskytů. Vydělíme-li tento počet celkovým počtem výskytů, tj. vypočítáme-li poměr 5445/606 600, dostaneme 0,008976, tzn. 0,8976 %. Můžeme tedy zhruba tvrdit, že [301]v průměru nalezneme v jednom tisíci osob asi devět nositelů příjmení Novák.

Podobným způsobem jsme přepočetli zbývající Benešovy údaje a získané výsledky jsou shrnuty v tabulce I. Protože od vydání Pražského adresáře z r. 1937 uplynul již delší čas, mohly nastat v těchto orientačních údajích jisté změny. Bude zároveň jistě zajímavé zjistit, zda relativní zastoupení příjmení zůstává na stejné úrovni. V Benešově práci zcela chybějí údaje o četnosti počátečního písmene u příjmení, a právě tato data slouží při nejrůznějších administrativně-organizačních pracích.

Položme si proto dvě otázky: (1) která jsou nejčastější česká příjmení a jaká je jejich četnost výskytu; (2) jaká je četnost jednotlivých počátečních písmen u příjmení.[2] Při řešení uvedených otázek není v silách jednotlivce statisticky zpracovat příjmení všech obyvatel českých zemí; v každém případě je nutno se spokojit s určitým odhadem získaným na základě vhodně zvoleného obrazu, resp. výběru. Vzhledem k pohybu i velkému počtu obyvatel je možno Prahu považovat za dostatečný a vhodný obraz k získání statistických dat.[3] Ovšem i v tomto případě je zhruba milión údajů nad síly jednotlivce, zvláště když údaje o všech obyvatelích Prahy nejsou k dispozici. Omezili jsme se proto na příjmení uvedená v telefonním seznamu.[4] Je to postup nepochybně korektní, protože jistě není závislost mezi příjmením a vlastnictvím telefonu.

Postup zpracování byl tento: Pro větší počet sloupců jsme vypočetli počet příjmení (resp. výskytů) a jejich průměrný počet jsme považovali za odhad průměru pro celý seznam. Zjistili jsme, že použitý seznam obsahuje asi 130 316 výskytů jednotlivých příjmení. Do tohoto [302]počtu jsou zahrnuta i příjmení ženská, tj. telefonní číslo uvedené pod ženskou podobou příjmení.

Výsledky, které jsme dostali, jsou shrnuty v tab. I a II; druhá polovina tab. I obsahuje naše výsledky a porovnává je s údaji, které získal Beneš. Uvádíme rovněž pořadí; to se na několika místech liší od pořadí uvedeného Benešem. Jestliže Beneš zjistil pro prvních pět příjmení pořadí Novák, Novotný, Svoboda, Dvořák a Černý, z našeho zpracování vyplynulo pořadí Novák, Svoboda, Novotný, Černý a Dvořák. Můžeme porovnáním zjistit některé významnější přesuny v pořadí: příjmení Pokorný, které mělo pořadí 8, má v našich výsledcích až pořadí 11. Největší posun nastal u příjmení Zeman (dříve 13, nyní 18) a Fiala (dříve 14, nyní 19).

Z výzkumu vyplývá tedy toto pořadí nejčastějších českých příjmení (viz tab. I, která je sestavena podle našeho pořadí): Novák, Svoboda, Novotný, Černý, Dvořák, Procházka, Veselý, Kučera, Hájek, Jelínek, Pokorný, Růžička, Beneš, Horák, Marek, Král, Čermák, Zeman, Fiala.

Výsledky uvedené v tabulce I umožňují zjistit (např. pomocí tzv. Pearsonova testu), pro která příjmení nastaly v relativním zastoupení největší změny. Výpočtem jsme zjistili, že relativně největší posun nastal pro příjmení Procházka (dříve 0,3412 %, nyní 0,4435 %), Svoboda (dříve 0,4995 %, nyní 0,5924 %), Pokorný (dříve 0,3165 %, nyní 0,2617 %) atd.

Údaje uvedené v tabulce I naznačují, že by na jejich základě bylo možno studovat i tzv. Zipfův-Mandelbrotův zákon. Tento zákon byl původně navržen pro lexikální jednotky, resp. jejich výskyty v textu a zhruba tvrdí, že součin četnosti slova a jeho pořadí se nemění. Tabulka I potvrzuje, že tento zákon, který je pro celou řadu problémů nepochybně užitečný, platí pro každé opakující se jednotky uspořádané do pořadí podle počtu výskytů. Zdá se, že se stejnými omezeními platí pro slova, velikosti měst podle počtu obyvatel, vklady ve spořitelně, výskyty příjmení aj.

Tabulka II obsahuje četnosti jednotlivých počátečních písmen pro česká příjmení vcelku. Čteme-li v této tabulce např., že nejčastějším počátečním písmenem je K (tj. 13,726 %), znamená to, že asi 13 % obyvatel Prahy (zobecněné i českých zemí) nosí příjmení začínající od tohoto písmene. Tento údaj nic neříká o tom, zda je od uvedeného písmene rovněž nejvíce různých příjmení.

Statistické údaje, které jsme uvedli, se mohou a nepochybně budou [303]lišit pro jednotlivé obce, města i kraje. Výsledky získané na základě telefonního seznamu pro Prahu jsou určitým neutrálním obrazem českých příjmení vůbec. Nelze proto požadovat, aby plně platily i pro každou malou obec, ve které silný rod mohl způsobit malou rozmanitost příjmení.[5] V každém případě jsou však získané údaje podle našeho názoru zcela dostačující k řadě praktických úkolů. Naše výsledky ještě v nepublikované podobě posloužily při sociologickém výzkumu a při vytváření kartotéky.

 

Tabulka I

příjmení

údaje Benešovy

údaje autorovy

rel. četnost v %

pořadí

rel. četnost v %

pořadí

Novák

0,8976

1

0,8426

1

Svoboda

0,4995

3

0,5924

2

Novotný

0,5007

2

0,5088

3

Černý

0,4303

5

0,4804

4

Dvořák

0,4748

4

0,4535

5

Procházka

0,3412

7

0,4435

6

Veselý

0,3524

6

0,3208

7

Kučera

0,3041

9

0,2985

8

Hájek

0 2596

11

0,2878

9

Jelínek

0,2819

10

0,2778

10

Pokorný

0,3165

8

0,2617

11

Růžička

0,2337

12

0,2509

12

Beneš

0,2077

16

0,2425

13

Horák

neuvedeno

-

0,2310

14

Marek

0,1966

17

0,2271

15

Král

0,2176

15

0,2233

16

Čermák

0,1929

18

0,2179

17

Zeman

0,2300

13

0,2156

18

Fiala

0,2201

14

0,2141

19

 

[304]Tabulka II

písmeno

četnost v %

písmeno

četnost v %

K

13,726

Z

2,405

H

8,592

Č

2,235

P

8,356

G

1,054

S

8,038

Ch

0,996

B

6,880

A

0,829

M

6,880

W

0,810

V

6,743

C

0,800

Š

6,051

O

0,710

J

3,696

U

0,692

N

3,565

Ž

0,686

D

3,319

Ř

0,582

R

3,103

E

0,580

T

2,939

I

0,122

L

2,806

Q

0,008

F

2,797

 

 

součet

 

 

100,000    


[1] J. Beneš, O českých příjmeních, Praha 1962; viz též jeho články v NŘ 28, 1944, s. 141n., s. 165n.

[2] Jak bude dále uvedeno, vycházeli jsme z pražského telefonního seznamu. Proto termín „české příjmení“ vlastně znamená „příjmení uvedené v pražském telefonním seznamu“. Protože získané údaje mají sloužit i administrativně-organizačním účelům, nebylo by podle našeho názoru správné omezovat se pouze na příjmení etymologicky česká, i když použitý telefonní seznam obsahuje i příjmení, která nejsou českého původu (např. německá aj.), příjmení slovenská, v mizivé míře i příjmení cizích státních příslušníků. To, že se v řadě nejčastějších příjmení vyskytují pouze příjmení „česká“, je náhoda; kdybychom zjistili např. pro příjmení Mülller vysokou četnost výskytu, zařadili bychom je na odpovídající místo.

[3] Bylo by velice zajímavé srovnat údaje získané pro Prahu s jiným velkým městem v českých zemích, např. s Brnem. I když je Praha směs, a lze ji proto považovat za neutrální obraz, při srovnání s Moravou by se pravděpodobně ukázaly typové rozdíly.

[4] Použili jsme pražský telefonní seznam z r. 1964.

[5] Beneš uvádí (viz NŘ 28, 1944, s. 148n.), že v Lomnici nad Lužnicí je asi 100 Kartáků, Nový Hrozenkov má z 5000 obyvatel 2000 Orságů, v Sedlčánkách u Českého Brodu má skoro polovina obyvatel příjmení Arazim apod. Benešovy údaje se ovšem vztahují k r. 1940.

Naše řeč, volume 54 (1971), issue 5, pp. 300-304

Previous Alexandr Stich: Neologismy v Havlíčkově publicistickém slohu (K stopadesátému výročí Havlíčkova narození)

Next Jaromír Spal: Místní jména na Moravě a ve Slezsku