Radek Skarnitzl
[Articles]
Two kinds of i in the pronunciation of Czech
The study examines the pronunciation of Czech /ɪ/ and /i:/ in the speech of Czech Radio newsreaders. This vocalic contrast has been traditionally described as consisting in duration. The analyses reveal that the duration of the phonologically long /i:/ is only approximately 30% greater than that of the phonologically short /ɪ/. As for the analysis of formant values, the short /ɪ/ appears to lie closer to vowels of the /e/-quality than to its long counterpart /i:/. The morphological status of the syllables with /ɪ/ and /i:/, as well as the position within an utterance have been taken into account. The results also indicate interesting idiosyncratic tendencies.
Key words: Czech, vowel, vowel quality, vowel quantity
Klíčová slova: čeština, samohláska, vokalická kvalita, vokalická kvantita
„Čeština má pět krátkých a pět dlouhých samohlásek a kvalita krátkého vokálu se od dlouhého v dané dvojici neliší“ je poučení, kterého se ve škole dostalo mnohým z nás. Zdrojem takovýchto zjednodušujících tezí mohou být pro příručky určené pro laickou veřejnost (viz např. Havránek – Jedlička, 1996, s. 12). V tomto příspěvku se podíváme, jak to s českými samohláskami, jejich kvalitou, tj. barvou, a trváním ve skutečnosti je.
České samohlásky byly předmětem zájmu našich fonetiků prakticky od samých počátků systematického bádání (Frinta, 1909, s. 49n.; Chlumský, 1928; Hála, 1941; Borovičková – Maláč, 1967, s. 13n.; Petr et al., 1986, s. 27n.). Tyto tradiční popisy jsou založeny na analýzách velmi různorodého řečového materiálu (od jednoslabičných logatomů až po souvislou řeč), ale všechny představují české monoftongy jako relativně jednoduchý a symetrický systém sestávající z pěti párů vokálů, jejichž členy jsou odlišeny fonologickou délkou (tedy zjednodušeně zapisováno i-í, e-é, a-á, o-ó, u-ú). A právě délka se pro všechny vokalické páry uvádí jako hlavní rozlišující znak. Trvání dlouhého vokálu se přitom udává jako přibližně dvojnásobné oproti krátkému vokálu dané kvality (pro shrnutí výše zmíněných výzkumů viz Palková, 1994, s. 179 a Machač, 2006, s. 61).
Z hlediska vokalické kvality jsou české krátké a dlouhé vokály považovány za prakticky totožné. Jistou výjimečnost tyto publikace připisují vysokým (zavřeným) předním samohláskám, tedy i-í: krátké i je popisováno jako o něco otevřenější než [142]dlouhé í (např. Hála, 1962, s. 166; Petr et al., 1986, s. 33). O sklonu krátkého i k otevřenosti se mnohdy hovoří v souvislosti s jeho podobností samohlásce e (Hála, 1941, s. 225), a to dokonce při jinak spisovné výslovnosti; Hála zmiňuje zaslechnuté příklady jako „Dě prééč!“, „stav selnic“ či „Dnes máme leteratúru“ (Hála, 1962, s. 168–169). Protože o kvalitativním rozdílu mezi krátkým i a dlouhým í nepanují pochybnosti, budeme pro ně v tomto příspěvku používat transkripční symboly odpovídající mezinárodním konvencím: fonologicky krátké, otevřenější i bude dále /ɪ/ a dlouhé zavřenější í bude v textu našeho příspěvku /i:/. Je důležité zmínit, že termíny otevřenost a zavřenost se týkají vzdálenosti hřbetu jazyka od paterní klenby, nikoli (jak se laik někdy domnívá) otevřenosti retní štěrbiny.
V posledních letech se českými samohláskami hlouběji zabývali pouze Volín a Studenovský (2007), kteří studovali účinnost různých metod pro normalizaci hodnot vokalických formantů. Jako materiál použili nahrávky, které načetlo 75 vysokoškolských studentů, a měřili formanty u osmi zástupců každého krátkého vokálu od každého mluvčího, celkem tedy 3000 samohláskových realizací (75 mluvčích × 5 vokálů × 8 realizací); viz také obr. 5.
V naší předchozí studii (Podlipský et al., 2009) jsme se zabývali konkrétně rozdílem mezi vokály /ɪ/ a /i:/, avšak především z percepčního hlediska. Cílem bylo zjistit, zda pro rozlišení těchto samohlásek využívají čeští posluchači převážně temporální rozdíly, jak by bylo možné se z literatury domnívat, nebo zda k rozlišení napomáhají i rozdíly spektrální (kvalitativní) povahy. Výsledky jednoznačně ukazují, že se čeští posluchači kvalitativními rozdíly při percepci řídí, někteří dokonce více než rozdíly temporálními.
Tento článek si za cíl klade doplnit popis českých předních vysokých vokálů ve studii Podlipského et al. (2009) o detailnější produkční data z oblasti trvání i vokalické kvality, tedy formantových hodnot. Kromě samotných hodnot prvního a druhého formantu uvedeme i poměr F2/F1, který se tradičně používá jako údaj o otevřenosti vokálů.
Pro účely této studie jsme analyzovali šest zpravodajských relací Českého rozhlasu, které byly přečteny šesti hlasateli (třemi mluvčími ženského a třemi mužského pohlaví). Důvodem naší volby je fakt, že hlasatelé Českého rozhlasu zpravidla bývají považováni za nositele spisovné výslovnosti. Trvání jedné relace, očištěné od vstupů dalších reportérů či hostů, je přibližně čtyři minuty, což odpovídá asi 500 slovům. Nahrávky byly rozděleny na nádechové úseky a po automatické hláskové segmentaci (Pollák et al., 2007) byly hranice všech hlásek v rámci budování Pražského fonetického korpusu (Skarnitzl, 2010) zarovnány manuálně podle pravidel pro fonetickou segmentaci, která sestavili Machač a Skarnitzl (2009). Celkově jsme pak pracovali s více než 7100 vokály, přibližně 1700 z nich byly vokály i-ové (viz četnosti
n | trvání | SD | poměr V: / V | poměr V: / V | poměr V: / V | |
ɪ | 1 049 | 53,5 | 19,9 | 1,29 | 1,23 | 1,45 |
i: | 691 | 68,9 | 36,3 | |||
e | 1 595 | 53,5 | 16,2 | 1,72 | 1,59 | 2,24 |
e: | 211 | 91,8 | 37,1 | |||
a | 1 217 | 63,1 | 20,9 | 1,79 | 1,83 | 1,60 |
a: | 436 | 113,0 | 26,3 | |||
o | 1 259 | 51,7 | 15,4 | 1,73 | 1,77 |
|
o: | 5 | 89,3 | 17,7 | |||
o͡u | 96 | 102,8 | 26,4 | 1,99 | 1,99 | 1,89 |
u | 423 | 57,3 | 22,9 | 1,60 | 1,42 | 1,46 |
u: | 133 | 91,4 | 49,5 |
Tab. 1 Průměrné trvání a poměr trvání dlouhých/krátkých vokálů (upraveno podle studie Podlipský et al., 2009, která je založena na totožném materiálu). (Údaje pro /u/-/u:/, ač zdánlivě nelogické, jsou skutečně správné.)
v tabulce 1). Pro každý vokál byla navíc určena příslušnost k typu morfému, v němž se nachází (kořenový morfém, derivační morfém a koncovka). Odečtení hodnot trvání hlásek a frekvencí formantů bylo prováděno ve volně přístupném softwarovém nástroji Praat určeném k fonetické analýze řeči (Boersma – Weenink, 2009).
Je dobře známo, že žádný extraktor formantových hodnot není zcela spolehlivý. Např. při extrakci nabízené programem Praat dochází jak k detekci „chybného“ formantu, tak i k „vynechání“ konkrétního spektrálního vrcholku. První případ je relativně častý právě v případě dlouhého /i:/, u něhož může být F2 chybně detekován v oblasti kolem 1000 Hz. Je zřejmé, že se nemůže jednat o druhý formant předního zavřeného vokálu: tento spektrální vrcholek ve skutečnosti odpovídá nazálnímu formantu. (Mnohé výzkumy ukázaly, že /i:/ bývá i v nenazálních kontextech, tj. když v jeho okolí není vyslovena nazální souhláska, nazalizováno; viz např. Rochet – Rochet, 1999, pro češtinu Skarnitzl, 2008.) S vynecháním formantu se setkáme spíše v případech slabšího F1.
Při manuálních opravách těchto chyb jsme jako první krok vypočítali průměrné hodnoty F1 a F2 pro /ɪ/ a /i:/ u všech šesti mluvčích. Hodnoty, které se od průměru daného mluvčího lišily o více než 20 procent, jsme následně zkontrolovali a případně opravili přímým odečtem ze spektra.
Po získání finálních hodnot jsme formanty převedli z fyzikální jednotky hertz na jednotku ERB (Equivalent Rectangular Bandwidth; viz Moore – Glasberg, 1983). Erb je psychoakustická jednotka, která lépe vyjadřuje, jak výškové rozdíly registruje lidský sluchový systém. V tomto článku budeme uvádět formantové hodnoty
Obr. 1 Průměrné trvání /ɪ/ a /i:/ a 95% intervaly spolehlivosti pro jednotlivé hlasatele. Mluvčí MSA, ZLZ a GVA jsou ženského pohlaví, mluvčí HRB, JPC a ULR jsou mužského pohlaví. |
v hertzích i v erbech. Za primární však budeme považovat erby, přičemž hodnoty v hertzích mohou sloužit spíše pro orientaci v technickém smyslu.
Pro veškeré statistické analýzy byla použita česká verze programu Statistica 7 od firmy StatSoft.
Shrnutí hodnot trvání pro jednotlivé vokalické páry přináší tabulka 1 (podle studie Podlipský et al., 2009). Diftong /o͡u/ je uveden v šedé barvě jako „náhradní“ protějšek krátkého /o/; dlouhé /o:/ se v domácí české slovní zásobě nevyskytuje, a proto je i jeho zastoupení v našem vzorku v podstatě zanedbatelné, jak ukazuje druhý sloupec tabulky 1. Následující dva sloupce zobrazují průměrné hodnoty trvání a jejich směrodatné odchylky.
Nejdůležitější informace přináší pátý sloupec, který uvádí poměr trvání dlouhého a krátkého vokálu. Na první pohled je patrné, že žádný z dlouhých vokálů není dvakrát delší než jeho krátký protějšek. (Poměru 2:1 téměř dosahuje pouze pseudodvojice /o͡u/-/o/). Zásadní je však rozdíl mezi poměrem trvání vysokých předních vokálů a ostatních dvojic: fonologicky dlouhé /i:/ je jen o necelých 30 procent delší než krátké /ɪ/, zatímco dlouhé vokály ostatních párů jsou delší minimálně o 60 procent.
Protože je dobře známo, že ve finálních pozicích delších prozodických celků dochází k poklesu artikulačního tempa, neboli k závěrovému zpomalení (např. Klatt, 1976; Wightman et al., 1992; viz také Volín – Skarnitzl, 2007 pro češtinu), zobrazují poslední dva sloupce tabulky 1 poměr trvání dlouhého /i:/ a krátkého /ɪ/ zvlášť
Obr. 2 a) Průměrné trvání i-ových vokálů v závislosti na morfologické příslušnosti slabiky. b) Průměrné trvání /ɪ/ a /i:/ v závislosti na morfologické příslušnosti slabiky. |
pro vokály, které byly v promluvovém úseku finální, a pro vokály v nefinálních pozicích. Je zřejmé, že se jednotlivé vokalické páry v tomto ohledu nechovají stejně. Největší rozdíly mezi finálními a nefinálními vokály jsou patrné u vokálů, které se často vyskytují v adjektivních koncovkách, tedy u /i: e: a:/. Z hlediska sledovaného páru /i:/-/ɪ/ je zajímavý velmi malý rozdíl v nefinálních slabikách: dlouhé /i:/ je jen o 23 procent delší než krátké /ɪ/.
Pojďme se nyní na hodnoty trvání podívat blíže. Obr. 1 ukazuje průměrné trvání /ɪ/ a /i:/ pro jednotlivé mluvčí. (Vyjádření rozptylu hodnot 95% intervaly spolehlivosti je využito i u následujících obrázků.)
Jak vidíme, trvání krátkého /ɪ/ je u všech mluvčích dosti podobné (průměrné hodnoty se pohybují mezi 51 a 57 milisekundami), ke značným individuálním rozdílům však dochází u /i:/. Zatímco průměrné trvání /i:/ u mluvčí MSA je přibližně 85 milisekund, což odpovídá poměru V:/V zhruba 1,55, trvá průměrné fonologicky dlouhé /i:/ u mluvčího JPC stejně dlouho jako /ɪ/ (poměr V:/V 0,99). Samozřejmě nás bude zejména v případě mluvčího JPC zajímat, zda se od sebe oba vokály liší více než u ostatních mluvčích z hlediska spektrálního (jinými slovy, zda tento mluvčí bude vyšším rozdílem v poměru F2/F1 u /ɪ/ a /i:/, tedy v jejich vokalické kvalitě, kompenzovat setřený rozdíl v temporální oblasti).
Dále nás zajímalo, zda je trvání českých vysokých předních samohlásek ovlivněno morfologickou příslušností slabiky, v níž se nacházejí. Celkovou situaci pro všechny i-ové vokály ukazuje obr. 2a (F(2, 1667) = 15,73; p < 0,001), z něhož je patrné výrazně delší trvání v koncovkových morfémech (Scheffého testy: p < 0,001). To může samozřejmě, alespoň do jisté míry, souviset s výše zmíněnou tendencí závěrového zpomalení ve vyšších prozodických jednotkách. Vztahy vyplývající z obr. 2a, tedy vyšší hodnoty trvání i-ových vokálů v koncovkových morfémech, však naznačují, že by podobný mechanismus mohl fungovat i v rámci slova.
Je ovšem důležité zaměřit se na každý z vokálů zvlášť. Pak se objeví velmi zajímavá interakce (F(2, 1667) = 15,86; p < 0,001) mezi fonologickou povahou vokálu a typem morfému (obr. 2b). Z této analýzy jasně vyplývá, že efekt popsaný výše je
ve skutečnosti způsoben pouze prodlužováním krátkého /ɪ/ v koncovkových morfémech. Obrázek zároveň ukazuje tendenci (ač statisticky nevýznamnou) k vyšším hodnotám trvání obou vokálů v kořenových morfémech než v morfémech derivačních.
Vrátíme-li se ke koncovkám, je očividné, že realizace /i:/ silně podléhá zřejmě individuálním tendencím (obr. 3). U dvou mluvčích je fonologicky krátké /ɪ/ v koncovkách dokonce delší než fonologicky dlouhé /i:/, i když rozdíl je jen u mluvčího JPC okrajově významný (Tukeyho HSD test: p < 0,1).
Rozdíly v barvě, nebo také kvalitě samohlásek zachycují zejména jejich první dvě rezonanční frekvence, kterým říkáme formanty. První formant, F1, koresponduje s vertikální polohou jazyka, zatímco F2 odpovídá současně horizontální poloze ja-
Obr. 5 Formantové oblasti českých vokálů: /ɪ/ a /i:/ podle současné studie, ostatní krátké vokály pro orientaci podle studie Skarnitzl a Volín (2012). Elipsy odpovídají jedné směrodatné odchylce od průměru. |
zyka a míře zaokrouhlení retní štěrbiny. Tyto dimenze zachycuje tzv. vokalický čtyřúhelník (viz níže obr. 5).
V tomto oddíle se napřed podíváme na oba formanty, F1 a F2, u cílových vokálů /ɪ/ a /i:/ zvlášť. Následně nás bude zajímat poměr F2/F1, který tradičně vyjadřuje míru zavřenosti či otevřenosti daného vokálu. Zopakujme, že hodnoty formantů budeme vyjadřovat primárně v erbech a že hodnoty v hertzích zařazujeme pouze jako technický údaj. Výhody použití psychoakustické jednotky oproti jednotce fyzikální názorně ukazuje obr. 4 ve formě schématického spektrogramu: zatímco ze zobrazení v hertzích (nalevo) by se mohlo zdát, že rozdíl mezi oběma vokály je pětkrát větší u F2 než u F1 (365 Hz oproti 68 Hz), zobrazení v erbech (napravo) ukazuje, že percepčně se jedná o hodnotu téměř identickou (1,41 ERB a 1,18 ERB). Rovněž směrodatná odchylka (v obrázku naznačena tloušťkou čáry) ukazuje, že z percepčního hlediska (v erbech) je variabilita F1 a F2 velmi podobná, zatímco údaje v hertzích (tedy jednotce objektivní, ale nereflektující lidské vnímání) by svědčily o výrazně vyšší variabilitě u F2.
Průměrné hodnoty F1 a F2 pro oba vokály, společně pro všechny mluvčí i odděleně pro ženské a mužské mluvčí, představuje tabulka 2 (první dva sloupce tedy ukazují stejné hodnoty jako obr. 4). Obr. 5 pak zasazuje aktuální hodnoty získané
| všichni mluvčí | ženy | muži | |||
/ɪ/ | /i:/ | /ɪ/ | /i:/ | /ɪ/ | /i:/ | |
F1 ERB | 7,90 | 6,72 | 8,17 | 6,96 | 7,58 | 6,49 |
F2 ERB | 21,02 | 22,43 | 21,81 | 23,18 | 20,10 | 21,70 |
F1 Hz | 338,4 | 270,4 | 355,4 | 282,9 | 318,8 | 258,4 |
F2 Hz | 2046,1 | 2411,6 | 2239,7 | 2628,1 | 1823,3 | 2203,3 |
Tab. 2 Průměrné hodnoty F1 a F2 pro /ɪ/ a /i:/ pro všechny mluvčí a zvlášť pro ženské a mužské mluvčí.
Obr. 6 Průměrné hodnoty F1 a F2 krátkého /ɪ/ v závislosti na místě artikulace předcházejícího a následujícího konsonantu. |
z vokálů všech analyzovaných mluvčích do kontextu českých vokálů ve formě vokalického čtyřúhelníku. Ostatní průměrné formantové hodnoty byly převzaty ze studie Volín a Studenovský (2007), v níž byly analyzovány krátké vokály českých studentů; je proto třeba mít na paměti, že řečový materiál není přímo srovnatelný s naším a že zakreslené hodnoty slouží pouze pro orientační srovnání.
U samotných absolutních hodnot formantů nacházíme dále významný efekt místa artikulace okolních konsonantů. Konsonantická místa artikulace jsme seskupili do tří tříd: koronální (tzn. alveolární a postalveolární hlásky), dorzální (zahrnující palatální a velární hlásky) a nelingvální (obsahující labiální a laryngální hlásky; tyto hlásky skutečně někdy bývají díky některým podobným akustickým vlastnostem sdružovány do jedné skupiny). Zkoumáme zvlášť efekt předcházejícího a následujícího konsonantu; možné interakce obou kontextů jsme prozatím neanalyzovali. Výsledky ukázaly, že formanty dosahují extrémnějších hodnot (tzn. nižší F1 a vyšší F2) v kontextu dorzálních (tedy palatálních či velárních) hlásek než v kontextu ostatních míst artikulace. Jak ukazuje obr. 6, efekt místa artikulace je vysoce významný pro krátké /ɪ/ (podle Scheffého testu ve všech kombinacích p < 0,001); u dlouhého /i:/ je vliv okolního kontextu ve většině případů nevýznamný. Tyto výsledky jsou vcelku logické: artikulace vysokých předních vokálů vyžaduje zdvihnutí hřbetu jazyka, přičemž u zavřeného /i:/ je pohyb výraznější. Artikulace dorzálních hlásek vyžaduje ještě intenzivnější zdvihnutí hřbetu jazyka. Je zřejmé, že rozdíl mezi postavením
Obr. 7 Průměrné hodnoty a intervaly spolehlivosti poměru F2/F1 pro /ɪ/ a /i:/, pro srovnání rovněž průměrná hodnota poměru F2/F1 pro /e/. a) poměr F2/F1 počítán z hodnot v erbech; b) poměr F2/F1 počítán z hodnot v hertzích. |
jazyka u otevřenějšího /ɪ/ a u dorzálního konsonantu bude větší, a tedy koartikulační vliv dorzálního konsonantu bude silnější než u zavřenějšího /i:/.
Dále se již podíváme na jednoznačnější ukazatel vokalické otevřenosti či zavřenosti, na poměr F2/F1. Do obr. 7 jsme pro lepší srovnání kromě hodnot pro /ɪ/ a /i:/ zanesli i průměrnou hodnotu poměru F2/F1 pro české e-ové vokály, /e e:/, již jsme pro účely tohoto srovnání z našeho vzorku dopočítali. Tyto vokály jsou v češtině tradičně považovány za středové, ale výsledky studie Volín a Studenovský (2007) nasvědčují spíše polootevřenému charakteru dnešního /e/; pro komparativní účely bychom tedy v mezinárodní fonetické transkripci použili spíše /ε/. Porovnáme-li vztahy v obr. 7, je rozdíl mezi /ɪ/ a /i:/ jednoznačný. Ze zobrazení v erbové stupnici nalevo je navíc zřejmé, že krátké /ɪ/ je z hlediska poměru F2/F1 podobnější e-ovým vokálům než svému kvantitativnímu protikladu, dlouhému /i:/.
Z výše uvedené analýzy a z obr. 6 můžeme vyvodit, že poměr F2/F1 bude u otevřeného /ɪ/ významně vyšší v sousedství dorzálních hlásek, a statistická analýza tuto významnost potvrzuje (Scheffého test: p < 0,001). Další lingvisticky motivované vlivy, například závislost poměru F2/F1 na morfologické příslušnosti slabiky, se však v našem materiálu neprojevily. Analýzu formantů proto ukončíme porovnáním poměru F2/F1 u jednotlivých mluvčích z našeho vzorku.
Jak ukazuje obr. 8, mluvčí se v míře otevřenosti /ɪ/ a /i:/ do jisté míry liší. Již jsme uvedli výše, že nás nejvíce bude zajímat mluvčí JPC, u něhož bylo průměrné trvání /ɪ/ a /i:/ téměř totožné (viz obr. 1) a v určitých kontextech bylo /i:/ dokonce kratší než /ɪ/ (obr. 3). Vyvstala tedy otázka, zda mluvčí JPC bude absenci rozdílu mezi oběma i-ovými vokály v oblasti trvání kompenzovat výraznějšími rozdíly v oblasti vokalické kvality.
Z obr. 8 je patrné, že mluvčí JPC skutečně ze skupiny ostatních mluvčích nápadně vystupuje. Jeho poměr F2/F1 se u obou vokálů od ostatních liší na úrovni p < 0,001 (Scheffého test); výjimkou je téměř totožná hodnota poměru u /ɪ/ ve výslovnosti ženské mluvčí MSA. Hodnoty poměru F2/F1 uvedené u kódů mluvčích navíc naznačují, že rozdíl mezi oběma poměry F2/F1, pro /ɪ/ a /i:/, je u tohoto mluvčího nejvyšší (0,89). Zdá se tedy, že výslovnost mluvčího JPC skutečně vykazuje jistou míru kvalitativní kompenzace v rámci dvojice /i:/-/ɪ/ za absenci rozdílu v oblasti trvání. Dodejme,
Obr. 8 Poměr F2/F1 u /ɪ/ a /i:/ pro jednotlivé mluvčí. Mluvčí MSA, ZLZ a GVA jsou ženského pohlaví, mluvčí HRB, JPC a ULR jsou mužského pohlaví. Pod kódy mluvčích je pro každého z nich uveden rozdíl mezi průměrnou hodnotou poměru F2/F1 u /i:/ a průměrnou hodnotou poměru u /ɪ/. |
že na první poslech tento mluvčí nepůsobí nijak neobvykle a že jej tedy můžeme považovat za reprezentanta jednoho z „normálních“ trendů v hlasatelské mluvě.
Výsledky našeho měření ukazují, že české i-ové vokály – alespoň ve výslovnosti moderátorů Českého rozhlasu – skutečně vytvářejí opozici, která se liší trváním, jak se obecně předpokládá. Ovšem fonologicky dlouhé /i:/ je jen přibližně o čtvrtinu delší než krátké /ɪ/ a v některých pozicích a u některých mluvčích se rozdíl mezi nimi v oblasti trvání zcela stírá. Naproti tomu hodnoty formantů a zejména poměru F2/F1 vyjádřené v psychoakustické jednotce ERB naznačují, že krátké /ɪ/ leží z hlediska míry otevřenosti mezi /i:/ a /e/ a že je dokonce e-ovým vokálům o něco blíže. Výsledky zároveň potvrzují, že do hry vstupují i individuální zvyklosti mluvčího.
Naše analýza ukazuje na zavřenější výslovnost krátkého /ɪ/ v kontextu dorzálních hlásek. Silného vlivu palatálních hlásek si povšiml již Dolanský (1899; citován v práci Frinta, 1909, s. 64–65). Dolanský tak rozlišuje i po palatálních hláskách od i po ostatních hláskách, a to bez ohledu na kvantitu vokálu (ve slovech sirotek a babí je tak pro i-ové vokály použit stejný transkripční symbol, podobně jako ve slovech ticho a tíže). Kvalitativní rozdíl mezi krátkým /ɪ/ a dlouhým /i:/ tedy Dolanský ve své době buď nezaznamenal, nebo nechtěl připustit.
Při zobecňování našich výsledků je důležité mít na paměti, že čtená řeč ve veřejnoprávním rozhlase představuje specifický mluvní styl, a že by tedy výsledky analýz odlišného typu řečového materiálu mohly být jiné. Machač (2006) například v rámci své disertace analyzoval trvání vokálů v okolí exploziv realizovaných v semispontánních projevech českých studentů (vyprávění příběhu podle obrázků). Poměr trvání [151]dlouhého a krátkého vokálu dané kvality v tomto materiálu a v naší studii porovnává tabulka 3. Rozdíl je patrný zejména u i-ových vokálů, u nichž je poměr trvání V:/V v Machačově materiálu podobnější ostatním vokalickým párům. Domníváme se, že tento rozdíl skutečně může být způsoben i tím, že semispontánní projevy jsou prozodicky více členěné. To by vedlo k většímu poměru hlásek ve finálních pozicích, u nichž, jak jsme zmínili na začátku třetího oddílu, trvání vykazuje specifické tendence (závěrové zpomalování).
Poslední dva sloupce tabulky 3 pro srovnání ukazují trvání vokálů v korpusu GAP (část Pražského fonetického korpusu s manuálně opravenými hranicemi hlásek; blíže viz Volín et al., 2005). Korpus GAP obsahuje čtené nahrávky pořízené rovněž od vysokoškolských studentů (do jisté míry se dokonce jednalo o tytéž studenty jako v Machačově studii). Zde vidíme větší podobnost se čteným rozhlasovým materiálem představeným v tomto článku. Fonologicky dlouhé /i:/ je dokonce průměrně kratší než fonologicky krátké /ɪ/; značně nízký poměr V:/V je patrný také u u-ových vokálů. Takovéto rozdíly mohou být způsobeny i skladbou čteného textu. V korpusu GAP se například dvacet procent vokálů /ɪ/ nachází v poslední slabice promluvového úseku, kde lze očekávat výrazné závěrové zpomalování. V každém případě tato srovnání názorně ukazují, že (nejen) v lingvistickém výzkumu je třeba závěry zobecňovat s velkou opatrností.
| Machač (2006) | současná studie | korpus GAP | |||
vokál | trvání | poměr | trvání | poměr | trvání | poměr |
ɪ | 56,2 | 1,63 | 53,5 | 1,29 | 67,7 | 0,90 |
e | 63,6 | 1,72 | 53,5 | 1,72 | 67,6 | 1,75 |
a | 69,5 | 2,22 | 63,1 | 1,79 | 69,0 | 1,85 |
u | 54,1 | 1,73 | 57,3 | 1,60 | 85,3 | 1,23 |
Tab. 3 Porovnání průměrného trvání a poměru trvání dlouhých/krátkých vokálů. Nalevo údaje podle Machače (2006, s. 105), uprostřed hodnoty zopakované z tabulky 1, napravo hodnoty z korpusu GAP.
Výsledky této studie ukazují, že vokalický systém češtiny není tak symetrický, jak bývá v tradičních popisech představován. Asymetričnost přitom nespočívá pouze v odlišné kvalitě vysokých předních vokálů, ale i v poměru trvání mezi fonologicky dlouhým /i:/ a krátkým /ɪ/. Je to právě rozdíl ve vokalické kvalitě, který umožňuje značné stírání rozdílu v doméně temporální. Lze říci, že /i:/ si může „dovolit“ být [152]relativně krátké, protože díky významnému spektrálnímu rozdílu mu nehrozí ztráta kontrastu s /ɪ/. Kvalitativní rysy těchto vokálů, jak ukazují výsledky Podlipského (připravováno), navíc hrají významnou roli při percepční identifikaci dvojice /i:/-/ɪ/.
Poděkování
Tato studie vznikla za podpory grantů GA ČR 406/12/0298 a VZ MŠM 0021620825.
LITERATURA
BOERSMA, P. – WEENINK, D. (2009): Praat: doing phonetics by computer (Version 5.1) [online]. Cit. 2009-02-01. <http://www.praat.org>.
BOROVIČKOVÁ, B. – MALÁČ, V. (1967): The spectral analysis of Czech sound combinations. Praha: Academia.
FRINTA, A. (1909): Novočeská výslovnost: pokus o soustavnou fonetiku jazyka českého. Praha: Česká akademie císaře Františka Josefa pro vědy, slovesnost a umění.
HÁLA, B. (1941): Akustická podstata samohlásek. Praha: Česká akademie věd a umění.
HÁLA, B. (1962): Uvedení do fonetiky češtiny na obecně fonetickém základě. Praha: ČSAV.
HAVRÁNEK, B. – JEDLIČKA, A. (1996): Stručná mluvnice česká. Praha: Fortuna.
CHLUMSKÝ, J. (1928): Česká kvantita, melodie a přízvuk. Praha: Česká akademie věd a umění.
KLATT, D. H. (1976): Linguistic uses of segmental duration in English: Acoustic and perceptual evidence. Journal of the Acoustical Society of America, 59, s. 1208–1221.
MACHAČ, P. (2006): Temporální a spektrální struktura českých explozív. Nepublikovaná disertační práce, Fonetický ústav FF UK v Praze.
MACHAČ, P. – SKARNITZL, R. (2009): Fonetická segmentace hlásek. Praha: Nakladatelství Epocha.
MOORE, B. C. J. – GLASBERG, B. R. (1983): Suggested formulae for calculating auditory-filter bandwidths and excitation patterns. Journal of the Acoustical Society of America, 74, s. 750–753.
PALKOVÁ, Z. (1994): Fonetika a fonologie češtiny. Praha: Karolinum.
PETR, J. et al. (1986): Mluvnice češtiny 1. Praha: Academia.
PODLIPSKÝ, V. J. (připravováno). Nejen délka, ale i kvalita ovlivňuje vnímání českého i a í.
PODLIPSKÝ, V. J. – SKARNITZL, R. – VOLÍN, J. (2009): High Front Vowels in Czech: a Contrast in Quantity or Quality?. In: Proceedings of the 10th Annual Conference of the International Speech Communication Association (Interspeech 2009). Brighton: ISCA, s. 132–135.
POLLÁK, P. – VOLÍN, J. – SKARNITZL, R. (2007): HMM-Based Phonetic Segmentation in Praat Environment. Proceedings of the XIIth International Conference „Speech and computer – SPECOM 2007“. Moscow: MSLU, s. 537–541.
ROCHET, A. P. – ROCHET, B. L. (1999): Patterns of assimilation nasality in English as a function of vowel height. Proceedings of 15th ICPhS. San Francisco, s. 699–702.
SKARNITZL, R. (2008): Vowel Nasalance in Czech and English. In: J. Volín – J. Janoušková (eds.), AUC Philologica 2/2007, Phonetica Pragensia XI. Praha: Karolinum, s. 131–143.
SKARNITZL, R. (2010): Prague Phonetic Corpus: status report. AUC Philologica 1/2009, Phonetica Pragensia, XII. Praha: Karolinum, s. 65–67.
[153]SKARNITZL, R. – VOLÍN, J. (2012): Referenční hodnoty vokalických formantů pro mladé dospělé mluvčí standardní češtiny. Akustické listy, 18, s. 7–11.
VOLÍN, J. – SKARNITZL, R. – POLLÁK, P. (2005): Confronting HMM-based Phone Labelling with Human Evaluation of Speech Production. In: Proceedings of the 9th Annual Conference of the International Speech Communication Association (Interspeech 2005). Lisbon: ISCA, s. 1541–1544.
VOLÍN, J. – SKARNITZL, R. (2007): Temporal downtrends in Czech read speech. In: Proceedings of the 8th Annual Conference of the International Speech Communication Association (Interspeech 2007). Antwerpen: ISCA, s. 442–445.
VOLÍN, J. – STUDENOVSKÝ, D. (2007): Normalization of Czech vowels from continuous read texts. In: Proceedings of the 16th ICPhS. Saarbrücken: Organizing Committee, s. 185–190.
WIGHTMAN, C. W. – SHATTUCK-HUFNAGEL, S. – OSTENDORF, M. – PRICE, P. J. (1992): Segmental durations in the vicinity of prosodic phrase boundaries. Journal of the Acoustical Society of America, 91, s. 1707–1717.
Fonetický ústav FF UK
nám. Jana Palacha 2, 116 38 Praha 1
radek.skarnitzl@ff.cuni.cz
Naše řeč, volume 95 (2012), issue 3, pp. 141-153
Previous Josef Štěpán: Široce způsobové vedlejší věty zájmenně-částicové
Next Václav Velčovský: Jazyk jako hodnota – hodnoty v jazyce