Pavel Machač
[Articles]
Articulatory, perceptional and acoustic variability of Czech affricates – an electropalatographic study
This study is a part of a wider research of articulatory weakening (fricativization) of the voiceless affricates /ts/ and /t∫/ in contemporary Czech. The affricates were analysed in three respects: (a) auditorily, (b) articulatorily, with the use of electropalatography, and (c) acoustically. Auditorily, three perceptual categories were established: canonical, weakened and fricativized. The legitimacy of these categories was subsequently supported by acoustic measurements and articulatory data. The results show the relative stability of the intervocalic affricates, a strong tendency towards fricativization as a consequence of dissimilation processes, and furthermore, dependence on speaker and gender. A methodology of a complex analysis of affricate reduction was created.
Key words: affricates, electropalatography, fricativization, lenition
Klíčová slova: afrikáty, elektropalatografie, frikativizace, artikulační oslabování
Jedním ze zásadních předmětů fonetického bádání je artikulační variabilita hlásek a její vliv na percepci. Její význam, šíře a systematičnost se ukazuje při různých typech hláskových, a tedy i slovních redukcí. Jedná se především o oslabenou artikulaci, kdy artikulační orgány nedosáhnou cílové artikulační pozice (přečti [př̥ešťɪ̞]), o elizi, při níž z dané hlásky nezbude ve slově žádná stopa (vlastně [asňe]), a o paralelní artikulaci, která označuje současnou artikulaci fonetických rysů sousedních hlásek (nebo [ǝ͂bo]) (Machač – Zíková, 2013a).
Jako podstatná se jeví skutečnost, že redukované výslovnostní formy jsou v proudu řeči pro posluchače zcela nenápadné, přirozené a nemají negativní vliv na srozumitelnost sdělení. Lze je tak považovat za organickou součást běžné komunikace a zřejmě i za jednotky inventáře fonetických slovních forem v daném jazyce. Přes zmíněnou artikulační variabilitu je nutné, aby v akustickém signálu zůstala obsažena vodítka pro odpovídající percepci v daném kontextu (Machač – Zíková, 2013b).
Výsledky zkoumání hláskových a slovních redukcí přispívají například k modelování vztahu produkce a percepce řeči (Kohler, 1990; Ernestus et al., 2002), z hlediska diachronního k modelování (potenciálních) jazykových změn (např. [27]Ohala, 1981; Hamann, 2009), v oblasti řečových technologií slouží k vyšší úspěšnosti při rozpoznávání řeči a v oblasti didaktické jsou využitelné jak při osvojování cizího jazyka, tak při snaze o osvojení prestižní formy projevu v jazyce mateřském.
Na artikulační odchylky od kanonické podoby, které jsou základem redukovaných tvarů, a na míru těchto odchylek se v českém prostředí – při absenci artikulografických zařízení – donedávna usuzovalo především na základě akustických ukazatelů, případně na základě pečlivého poslechu (např. Skarnitzl – Machač, 2012; podrobněji viz odd. 3). S relativně nedávným příchodem elektropalatografu (EPG) mají čeští fonetikové možnost upřesňovat poznatky o artikulaci v čase alespoň u těch hlásek, které jsou tvořeny jazykem proti paterní klenbě. V tomto ohledu stojí za pozornost nedávná elektropalatografická studie věnovaná artikulaci českých palatálních exploziv [ť] a [ď] (Skarnitzl – Bartošová, 2013) přinášející evidenci o jejich až nečekaně výrazné artikulační variabilitě. Elektropalatograf snímá a zaznamenává v čase dotyk jazyka s umělým patrem (lingvopalatální kontakt), které je osazeno 62 elektrodami (Hardcastle et al., 1991). Podrobný popis podávají Skarnitzl a Bartošová (2013).
Cílem této studie je konfrontace našich dosavadních pozorování výslovnosti afrikát [c] a [č] s objektivizující artikulografickou metodou v provázanosti s percepčními a některými akustickými ukazateli. Afrikáty popisujeme jako hlásky, jejichž první, závěrová fáze přechází do fáze úžinové, šumové. V češtině se jedná o alveolární [c] a postalveolární [č] a jejich znělé protějšky [dz] a [dž], které vznikají v důsledku asimilace znělosti.
Ze zmíněných pozorování plyne vysoká variabilita afrikát ve smyslu jejich artikulačního zjednodušování, tedy oslabování až odstraňování závěrové fáze. Tento redukční proces, který ústí až v nahrazení afrikáty frikativou, nazýváme frikativizace.
Neméně podstatným cílem je pokus o vytvoření metodologie k identifikaci redukovaných forem frikativ na základě akustických hodnot.[1]
Pro účely výzkumu za pomoci EPG jsme sestavili sadu vět tak, aby sloužily zkoumání artikulace různých hlásek, nejen afrikát. Mluvčí nevěděli, které typy hlásek budou předmětem analýzy.
Každý mluvčí byl instruován tak, aby sadu vět přečetl nejprve s vyšším artikulačním úsilím (spíše explicitně) a po přestávce s výslovností pokud možno přirozeně nedbalou (spíše implicitně). Samozřejmě si nelze dělat iluze o tom, [28]že by řeč s umělým patrem, od něhož vedou retní štěrbinou drátky, kopírovala skutečnou spontánní mluvu. Na druhé straně je třeba uvést, že všichni mluvčí jsou zvyklí nahrávat ve studiových podmínkách a mají zkušenosti s imitací různých typů projevu. I přes výše uvedené omezení se tak nakonec podařilo pořídit elektropalatografické záznamy projevů s odlišnou mírou artikulačního úsilí. Výběr lexikálních a morfologických prostředků byl při sestavování vět přizpůsoben požadavku přirozenosti při snaze o nedbalost, např. Jo, to se vás ale vůbec netýká, člověče. Dyť von se šel něco učit, asi angličtinu nebo co. apod.
Materiál: 17 afrikát ([c] 9×, [č] 8×) × 8 mluvčích (4 muži, 4 ženy) × 2 styly (explicitní, implicitní), tj. celkem 272 zkoumaných položek. Tři položky nebyly mluvčími realizovány, takže celkem pracujeme s 269 cílovými hláskami.
Cílem našeho zájmu je ověřit míru korespondence percepční, artikulační a akustické analýzy, abychom variabilitu cílových hlásek mohli popsat v jejich fonetické celistvosti. Při zkoumání realizace afrikát proto používáme tři přístupy, které uvádíme do vzájemných souvislostí:
a) pečlivý poslech (viz níže),
b) elektropalatografii,
c) akustická měření.
Smyslem (a) pečlivého poslechu je stanovit percepční kategorie pro rozmanitost realizace cílových hlásek, smyslem (b) elektropalatografické a (c) akustické analýzy je ověřit objektivní základ percepčně stanovených kategorií.
Při chápání výsledků je samozřejmě nutno mít stále na zřeteli fakt, že pečlivý poslech, jako metoda fonetické analýzy, ze své podstaty probíhá jinak a na jiných principech než vnímání řeči a řečových jednotek v každodenní komunikaci; zásadní je už skutečnost, že při výzkumu takovéhoto typu je experimentátorovi předem znám obsah a zamýšlená fonetická struktura sdělení, jež tak nechává stranou své pozornosti, zatímco se soustředí na svůj cíl – na zachycení fonetických rysů, které utvářejí auditivní podobu cílové hlásky (viz 3.1).[2] V běžné komunikaci je tomu naopak.
Pečlivý poslech byl prováděn vždy ve dvou základních podobách: v širším kontextu (text, spojení slov, slovo) a v užším kontextu (cílová afrikáta v minimálním až nulovém kontextu, její fáze jednotlivě). Posuzována byla percepční [29]nápadnost kontrastu mezi závěrovou a úžinovou fází afrikáty. V některých sporných případech byla pomocným vodítkem konzultace s dalším experimentátorem, případně akustické zobrazení.
Na základě pozorování jsme pro afrikáty určili tři základní percepční kategorie:
Při zkoumání variability afrikát [c] a [č] stojí v centru naší pozornosti artikulační děje, které se odehrávají ve střední části alveol. Právě to je oblast, kde při kanonické realizaci očekáváme v závěrové fázi úplný kontakt jazyka s paterní klenbou a následně jeho uvolnění při přechodu do fáze úžinové.
Sledování aktivace všech elektrod na celém umělém patře by bylo v případě alveolárních a postalveolárních afrikát nadbytečné, a to zejména proto, že laterální kontakt (okraje jazyka s dásněmi) lze očekávat v obou fázích obou afrikát v obou stylech. Laterální kontakt slouží jako doplňková informace o individuální variabilitě mluvčích.
Jako kritickou oblast lingvopalatálního kontaktu v závěrové a úžinové fázi jsme proto zvolili dva prostřední „sloupce“ ve čtyřech řadách od přední části umělého patra, tj. osm elektrod (obr. 1). První dvě řady bývá zvykem interpretovat jako oblast alveolární, třetí a čtvrtou řadu jako postalveolární. Vzhledem k různorodosti vytvarování paterní klenby u různých mluvčích však nelze toto rozdělení absolutizovat.
Obr. 1 Kritická lingvopalatální oblast (bílý obdélník).
[30]Údaje v malých obdélnících na obr. 1 vyjadřují relativní čas, po který se jazyk během měřeného intervalu dotýkal patra. S uvedenými hodnotami pracujeme jako s bodovým vyjádřením kontaktu. Pokud by se tedy – zcela teoreticky – jazyk dotýkal patra na všech osmi elektrodách po celou dobu měření, dosáhne lingvopalatální kontakt hodnotu 800. Při úplné frikativizaci předpokládáme nulový kontakt.
Podle výzkumu temporálních vlastností afrikát (Vyhnálková, 2011) tvoří závěrová fáze kanonicky realizovaných afrikát v češtině průměrně přibližně třetinu jejich trvání, úžinová fáze pak zbývající dvě třetiny. Míra lingvopalatálního kontaktu byla zjišťována kolem středu každé z těchto fází přibližně v pásmu jedné třetiny trvání dané fáze (obr. 2).
Obr. 2 Intervaly pro měření lingvopalatálního kontaktu v závěrové a úžinové fázi.
Zvolili jsme dvě oblasti akustických parametrů, u nichž jsme chtěli ověřit, do jaké míry mohou zachycovat různou míru produkční preciznosti afrikát. Jednou z nich je trvání hlásky, druhou změny v intenzitě a jejich rozložení. Očekáváme, že u realizací, které byly percepčně označeny jako kanonické, bude trvání hlásky nejdelší, rozdíl intenzit v závěrové a úžinové fázi největší, průběh intenzity nejstrmější a že minimální intenzitu jednoznačně najdeme v oblasti odpovídající fázi závěrové, zatímco maximální v oblasti fáze úžinové. Podrobné informace o očekáváních a výsledcích uvádíme pro větší přehlednost společně v oddíle 4.3.1.
Trvání hlásky usouvztažňujeme se získanými percepčními kategoriemi. Hranice hlásek stanovujeme v souladu s pravidly pro segmentaci řečového signálu (Machač – Skarnitzl, 2009).
Intenzitu jsme měřili v jedenácti ekvidistantních krocích. Ke srovnání intenzit v obou fázích jsme zvolili krok třetí (zhruba okolo poloviny trvání závěrové fáze) a krok osmý (přibližně v polovině fáze úžinové). Při zjišťování strmosti intenzitního průběhu jsme z jedenácti kroků vypustili po dvou krocích z každé strany a vzali tak v úvahu interval od třetího do devátého kroku, abychom pokud možno eliminovali vliv okolních hlásek.
Údaje v tabulce 1 ukazují na relativně vysokou četnost krajních realizací afrikát: více než polovina (53 %) kanonických na jedné straně a více než třetina (36 %) frikativizovaných na straně druhé. Oslabená realizace byla zaznamenána zhruba v desetině případů (11 %).
Tab. 1 Četnost afrikát v jednotlivých percepčních kategoriích v obou typech projevu.
Je zajímavé, že obsazenost jednotlivých kategorií se u alveolárních a postalveolárních afrikát jeví jako poměrně vyrovnaná.
Výsledky EPG jednoznačně ukazují snižování lingvopalatálního kontaktu v souladu s percepční kategorizací kanonické > oslabené > frikativizované. Z prostého pohledu na jednotlivé sloupce tabulky 2 je zřejmé prudké zmenšování dotykové plochy artikulujících orgánů ve výše uvedeném směru. Ubývání dotykové plochy ve sloupci „závěr“ ([c] 243 > 103 > 48; [č] 302 > 152 > 20) můžeme interpretovat jako ubývání fonetického rysu závěrovost, ubývání ve sloupci „úžina“ je spíše důsledkem celkově uvolněnější artikulace, nikoli příznakem ubývání rysu úžinovost, neboť frikativní šum je u všech položek přesvědčivě přítomen.
Nejpřesvědčivějším ukazatelem frikativizace afrikát je třetí sloupec u každé afrikáty (tab. 2, „rozdíl“). Ten vyjadřuje snižování rozdílu lingvopalatálního
Tab. 2 Ubývání průměrného lingvopalatálního kontaktu v závěrové a úžinové fázi afrikát v závislosti na percepčních kategoriích.
Obr. 3 Ukázka kanonické realizace [c] ve slově sice – EPG, oscilogram (mluvčí F3).
Obr. 4 Ukázka frikativizované realizace [c] ve slově sice – EPG, oscilogram (mluvčí M2).
kontaktu mezi závěrovou a úžinovou fází opět ve směru kanonické > oslabené > frikativizované ([c] 158 > 61 > 24; [č] 247 > 110 > 1). Čím menší rozdíl, tím menší kontrast a tím větší míra frikativizace afrikát.
Testování rozdílů (ANOVA) provedené mezi percepčními kategoriemi kanonické, oslabené, frikativizované přesvědčivě ukazuje nenáhodnost a) rozdílů lingvopalatálního kontaktu v závěrových fázích[3] (sloupce „závěr“) a b) rozdílů mezi lingvopalatálním kontaktem v závěrové a úžinové fázi[4], který zřejmě koreluje s velikostí kontrastu mezi fázemi a percepčně podporuje dojem „afrikátnosti“.
Závěr: Stanovené percepční kategorie jsou podle našeho materiálu v souladu s výsledky artikulografické metody, a proto můžeme hovořit o kategoriích percepčně-artikulačních.
V oblasti akustické jsme se věnovali těmto parametrům:
a) rozdílu intenzity v závěrové a úžinové fázi,
b) relativní časové distribuci minima a maxima intenzity v průběhu realizace afrikáty,
c) průběhu intenzity,
d) trvání hlásky.
V souladu s percepční a artikulační kategorizací afrikát jsme v pořadí kanonické – oslabené – frikativizované předpokládali:
ad a) snižování rozdílu intenzity v závěrové a úžinové fázi.
Odůvodnění: Velikost rozdílu mezi nejnižší a nejvyšší intenzitou chápeme jako akustický indikátor míry kontrastu mezi oběma fázemi hlásky. V úžinové fázi očekáváme bez ohledu na kategorie obdobné artikulační nastavení a srovnatelné hodnoty intenzity. Největší rozdíl intenzit je očekávatelný při vytvoření úplné překážky (závěr, „tichá“ fáze), tj. v kategorii kanonických. Čím více je překážka v závěrové fázi nedovřená (oslabené, frikativizované), tím silněji je přítomna šumová složka a závěrová fáze se tím více podobá fázi úžinové, takže rozdíl intenzit bude nižší.
ad b) snižování rozdílu v časové distribuci minima a maxima intenzity.
Odůvodnění: Minimum intenzity očekáváme v závěrové fázi (ticho), tedy zhruba do 30 % trvání hlásky, její maximum pak v úžinové fázi (šum), přibližně od 50 % trvání hlásky dále. Při vyrovnávání artikulačního nastavení v obou fázích, a tedy při vyrovnávání intenzity šumu (frikativizace), považujeme za pravděpodobné stírání rozdílů v časové distribuci intenzitních extrémů, tj. pozice minima a maxima intenzity nemusí odpovídat předpokládaným fázím.
ad c) snižování strmosti průběhu intenzity.
Odůvodnění: Toto pozorování je detailnější modifikací bodu (a). U kanonických realizací lze předpokládat prudké stoupání intenzity v důsledku artikulačního a akustického kontrastu mezi oběma fázemi. U obou dalších kategorií, kde očekáváme vyšší hodnoty intenzity v závěrové fázi v souladu s mírou „nedovřenosti“ závěru, a tím i nižší míru kontrastu, bude intenzita stoupat pozvolněji, případně může být u plně frikativizovaných realizací „rovná“.
ad d) snižování hodnot trvání.
Odůvodnění: Míra implicitní výslovnosti je často v úměře s trváním hlásky. Při extrémně krátkém trvání nebývají hlásky realizovány plně. U afrikát to znamená právě oslabení nebo ztrátu rysu závěrovost, a tedy různou míru frikativizace.
Obr. 5 Kategorie afrikát – relativní časová distribuce minima a maxima intenzity, rozdíl mezi maximem a minimem intenzity, trvání.
_kan – kanonické, _osl – oslabené, _fri – frikativizované, (+)/(–) – relativní vyjádření časové distribuce maxima/minima intenzity v průběhu hlásky (v % dle osy y), xx dB – rozdíl maxima a minima intenzity, šipka – směr narůstání intenzity, xx ms – trvání afrikáty.
Výsledky měření akustických parametrů (a), (b) a (d) jsou pro obě afrikáty v jednotlivých percepčně-artikulačních kategoriích shrnuty v jednom grafu (obr. 5), aby byla na pohled zřejmá provázanost akustických hodnot v jednotlivých parametrech a percepčně-artikulačních kategoriích (viz vysvětlivky pod grafem).
ad a) Snižování rozdílu intenzity v závěrové a úžinové fázi.
Tento parametr výrazně přispívá ke vzájemnému rozlišení všech tří percepčně artikulačních kategorií. Zatímco se průměrný rozdíl intenzity mezi závěrovou a úžinovou fází u kanonických afrikát pohybuje kolem 20 dB (p < 0,0001)[5], u oslabených realizací činí okolo 10 dB (p < 0,001) a u frikativizovaných se pohybuje kolem hodnoty 0 dB (p > 0,1). Statistická nevýznamnost tohoto výsledku odráží fakt, že u frikativizovaných variant už nelze hovořit o rozdílu mezi dvěma fázemi – jednak proto, že je zanedbatelný, a jednak proto, že minimum intenzity již není příznakem závěrovosti, neboť o tento rys hláska přišla. Minimum [35]intenzity se tak nemusí nacházet v první fázi hlásky (viz níže). Nepatrný rozdíl intenzit v případě frikativizace proto nemůže být indikátorem míry kontrastu.
Statistická významnost rozdílů mezi jednotlivými kategoriemi je ve všech případech vysoká.[6] Dodejme, že velikost rozdílu je dána způsobem realizace závěrové fáze (a tomu odpovídající intenzitou třecího šumu), neboť průměrné hodnoty intenzity v úžinových fázích jsou pro [c] i [č] ve všech třech kategoriích relativně srovnatelné: c_kan 63 dB, č_kan 64 dB, c_osl 63 dB, č_osl 63 dB, c_fri 61 dB, č_fri 61 dB.[7]
Intenzitní rozdíl mezi závěrovou a úžinovou fází je významným nositelem akustického kontrastu, na němž je zřejmě založena percepční „afrikátnost“.
ad b) Snižování rozdílu v časové distribuci minima a maxima intenzity.
V kategoriích kanonické a oslabené se intenzitní minimum i maximum nacházejí v očekávatelných časových oblastech (viz 4.3.1): minimum v pásmu 17–26 % trvání hlásky (odpovídá závěrové fázi; spodní obdélník na obr. 5), maximum v pásmu 72–81 % trvání (odpovídá úžinové fázi; horní obdélník na obr. 5).
U kategorie frikativizovaných (přerušovaná elipsa) může vypadat uspořádání hodnot poněkud chaoticky: minimum intenzity u [c] se nachází až v polovině hlásky a je značně blízko maxima, u [č] je dokonce pořadí minima a maxima „přehozené“. Tento stav není překvapující, neboť rozdíl intenzit, jak se zmiňujeme výše, se pohybuje kolem hodnoty 0 dB.
Časová distribuce minima a maxima intenzity tedy navzájem vymezuje kategorie kanonické a oslabené na jedné straně a na straně druhé kategorii frikativizované, kde dochází k setření akustického kontrastu.
ad c) Snižování strmosti průběhu intenzity.
Obr. 6 je detailnější ilustrací poznatků o distribuci intenzitních extrémů v rámci každé kategorie u obou afrikát (viz výše).
Nejstrmější narůstání intenzity mají dle očekávání kanonické realizace, méně strmý pak realizace oslabené, zatímco u frikativizovaných afrikát je intenzita v průběhu hlásky poměrně vyrovnaná.
Pro snáze uchopitelné grafické a číselné vyjádření strmosti intenzitního průběhu afrikát v jednotlivých kategoriích (obr. 7) jsme zvolili gradient spojnice minima a maxima intenzity.[8] Čím vyšší je hodnota (c_kan 5,15; č_kan 4,50), tím
Obr. 6 Průběh intenzity při realizaci kanonických, oslabených a frikativizovaných afrikát v jednotlivých krocích.
strmější je stoupání intenzity, záporná hodnota indikuje její klesání (c_fri –0,73; č_fri –1,20). Nejstrmější stoupání vykazují kanonické realizace, zatímco u realizací frikativizovaných zaznamenává zvolený ukazatel spíše intenzitní pokles.
ad d) Snižování hodnot trvání.
I v oblasti trvání obou afrikát se ukazuje odůvodněnost používaných percepčně-artikulačních kategorií (horní řádek na obr. 5): hodnota trvání klesá ve směru kanonické (144 a 132 ms) > oslabené (110 a 120 ms) > frikativizované (92 a 95 ms).[9] Lze se domnívat, že nižší hodnoty trvání souvisejí s artikulačním zjednodušením ve smyslu snížené nebo chybějící realizace fonetického rysu závěrovost.
Vliv stylu je velmi těžké posuzovat, neboť individuální artikulační zvyklosti a možná i schopnost přirozené artikulace s umělým patrem způsobují prostupnost hranice mezi stylem implicitním a explicitním. Materiál byl ovšem primárně sbírán s cílem nashromáždit doklady pro analýzu hlásek realizovaných s různým stupněm artikulačního úsilí, nikoli podle stylů (viz odd. 2). Z poslechu nahrávek, ze zběžného pozorování akustického zobrazení signálu, a zejména z výsledků EPG plyne značně vysoká variabilita mezi mluvčími, u některých z nich bez ohledu na to, zda se právě snažili o ten či onen styl.
Obr. 7 Strmost průběhu intenzity při realizaci kanonických, oslabených a frikativizovaných afrikát podle minima a maxima intenzity.
Uveďme extrémní případy, u nichž je zřejmé, že se očekávání precizní artikulace afrikát v tzv. explicitním stylu a spíše náznakové artikulace ve stylu implicitním míjí se skutečností. Pro orientační srovnání uvádíme v tab. 3 hodnoty lingvopalatálního kontaktu v závěrové fázi afrikát u trvale „implicitního“ mluvčího M2, u převážně „explicitní“[10] mluvčí F4 a průměrné hodnoty celé skupiny mluvčích.
Začněme konstatováním, že M2 vytvořil úplný závěr v pouhých 3 případech z celkových 32 (cca 9 %). Všechny tři plné realizace závěru pocházejí z 15 položek v zamýšleném explicitním stylu, takže i přes vysoké artikulační úsilí bylo zbývajících 12 afrikát (tj. 80 %) vysloveno bez úplného závěru. Přes 90 % afrikát realizoval M2 oslabeně nebo frikativizovaně. Na opačném konci pomyslné škály preciznosti stojí mluvčí F4, která i při snaze o implicitní výslovnost připravila afrikáty o rys závěrovost pouze v jedné třetině případů a bez ohledu na styl nevytvořila úplný závěr jen ve 24 % případů oproti více než 90 % u mluvčího M2.
Na první pohled je zřejmé, že se míra lingvopalatálního kontaktu u M2 pohybuje více či méně hluboce pod průměrnými hodnotami celé skupiny mluvčích, zatímco F4 většinou průměr výrazně převyšuje. Záporné hodnoty u M2 na řádcích „rozdíl“ naznačují v našem materiálu jev ojedinělý – závěr je tvořen artikulačně „poctivěji“ při snaze o přirozeně nedbalou výslovnost než při vysokém artikulačním úsilí.
průměr | M2 | F4 | |
c_EXP | 169 | 41 | 230 |
rozdíl | 32 | -36 | 44 |
č_EXP | 236 | 89 | 338 |
rozdíl | 89 | -5 | 91 |
Tab. 3 Průměrný lingvopalatální kontakt v závěrové fázi afrikát u všech mluvčích (průměr) a u mluvčích M2 a F4 ve stylu explicitním (EXP) a implicitním (IMP).
Zmíněné extrémy pouze dokumentují vysokou variabilitu dat získaných pomocí EPG a – opatrněji řečeno – vysokou artikulační variabilitu afrikát obecně. Její původ lze hledat například v různých segmentálních i suprasegmentálních strategiích při nedbalé výslovnosti, v různých individuálních návycích a přirozeně také v různosti tvarů paterní klenby jednotlivých mluvčích.
Ve zkoumaném materiálu se zřetelně projevil rozdíl v míře preciznosti artikulace podle pohlaví mluvčího.
Všimněme si v tab. 4, že hodnoty lingvopalatálního kontaktu jsou ve sloupcích F (ženy) bez výjimky vyšší než odpovídající hodnoty ve sloupcích M (muži), a to jak ve fázi závěrové, tak – možná překvapivě – i ve fázi úžinové. Mezi silně vyznačenými hodnotami jsou rozdíly statisticky významné (t-test; p < 0,05). Hodnoty ve sloupci „rozdíl závěr–úžina“ svědčí o vyšším artikulačním kontrastu mezi závěrovou a úžinovou fází u žen. Řádek „rozdíl“ naznačuje jistou tendenci žen k diferencovanější artikulaci mezi projevy explicitními a implicitními, než je tomu u mužů.
| závěr | úžina | rozdíl závěr–úžina | |||
| M | F | M | F | M | F |
c_EXP | 128 | 206 | 43 | 82 | 85 | 124 |
rozdíl | 15 | 45 | 10 | 15 | 5 | 30 |
č_EXP | 155 | 312 | 26 | 60 | 129 | 252 |
rozdíl | 62 | 112 | 0 | 8 | 62 | 104 |
Tab. 4 Průměrný lingvopalatální kontakt u mužů a u žen v projevech explicitních (EXP) a implicitních (IMP).
Obr. 8 Procentuální obsazení percepčně akustických kategorií podle pohlaví mluvčích (M 133 položek, F 137 položek).
S tímto zjištěním souvisejí i rozdílné tendence v obsazenosti jednotlivých percepčně-artikulačních kategorií podle pohlaví mluvčích. Bílé šipky na obr. 8 ukazují jasnou převahu kanonických realizací nad frikativizovanými u žen (bílé sloupce, F), zatímco černé šipky ilustrují větší počet realizací frikativizovaných než kanonických u mužů (černé sloupce, M).
Výsledky korespondují s obecnou tendencí žen k pečlivější artikulaci, jak uvádějí některé studie (např. Whiteside, 1996; Elyan, 1978 cit. podle Simpson – Ericsdotter, 2003).
Afrikáty jsme podrobili analýzám v těchto hláskových okolích: v intervokalické pozici, před závěrovou hláskou a po ní, před alveolární nazálou a po ní.
Jako nejvhodnější prostředí pro vytvoření úplné překážky v závěrové fázi se jeví vokalické okolí (kanonicky [c] 60 %, [č] 69 %).
Podobně se chová [č] po alveolární nazále [n] (kanonicky 69 %). Ve spojení [nč] lze totiž u [n] předpokládat regresivní koartikulační posun jazyka, tedy vytvoření lamino-postalveolárního[11] závěru (jako u [č]), který – již „připravený“ [40]pro další hlásku – zůstává po zdvižení měkkého patra při přechodu na lamino-postalveolární [č] v nezměněné podobě.
Méně stabilní závěr můžeme konstatovat v sekvencích afrikáta – závěrová hláska, kde probíhají spíše disimilační procesy. Různou míru neúplnosti závěru, tedy příslušnost ke kategorii oslabené nebo frikativizované, jsme zaznamenali u sekvence [cn] v 69 %, u [čť] v 68 %, u [čc] v 51 % pro [č] a v 65 % pro [c].
Za významný výstup experimentu považujeme fakt, že položil metodologické základy pro další, detailnější analýzu frikativizace afrikát.
Tato studie, založená na elektropalatografických nahrávkách, nahlíží na afrikáty [c] a [č] ze tří vzájemně propojených perspektiv: percepční, artikulační a akustické. Prvním krokem několikanásobné analýzy nahrávek bylo percepční rozčlenění realizací afrikát do tří kategorií podle stupně preciznosti, které probíhalo metodou pečlivého poslechu: kanonické, oslabené, frikativizované. Následovala analýza dat z EPG, která potvrdila jejich korespondenci s percepčními kategoriemi, takže dále mluvíme o kategoriích percepčně-artikulačních.
Kanonické realizace se percepčně vyznačují jednoznačnou „afrikátností“ a artikulačně největším lingvopalatálním kontaktem v (post)alveolární oblasti (viz EPG). Percepčně i artikulačně na druhém pólu jsou realizace frikativizované, vyznačující se percepční „frikativností“, podobností se [s], [š] a minimálním či nulovým dotykem jazyka v oblasti očekávaného závěru.
Také akustické analýzy vykazují korespondenci s percepčně-artikulačními kategoriemi. V pořadí kategorií kanonické – oslabené – frikativizované dochází ke:
a) snižování rozdílu intenzity v závěrové a úžinové fázi: o zhruba 10 dB mezi jednotlivými kategoriemi;
b) snižování rozdílu v časové distribuci minima a maxima intenzity: u kanonických a oslabených realizací nachází intenzitní minimum v pásmu od 17 do 26 % trvání hlásky, což odpovídá závěrové fázi, a maximum v pásmu od 72 do 81 % trvání, nicméně u realizací frikativizovaných je časové uspořádání krajních hodnot nevyhraněné, obecně se však časový rozdíl mezi minimem a maximem stírá;
c) snižování strmosti průběhu intenzity: značně strmý nárůst intenzity vykazují kanonické realizace, pozvolnější pak realizace oslabené, u realizací frikativizovaných je průběh spíše plochý až mírně klesavý.
d) snižování hodnot trvání: rozdíl mezi kanonickou a frikativizovanou realizací činí u [c] přes 50 ms, u [č] téměř 40 ms.
Jako nejvhodnější hláskové okolí pro stabilitu závěrové fáze, tedy i celé frikativy, se ukazuje okolí oboustranně vokalické. Naopak v sousedství závěrových [41]obstruentů se pod vlivem disimilačních procesů závěr nejčastěji oslabuje nebo zcela chybí.
Data rovněž ukazují na pečlivější artikulaci afrikát u žen než u mužů.
Výsledky studie ukazují na analýzách afrikát realizovaných s různým stupněm artikulační preciznosti provázanost všech tří základních fonetických aspektů popisu zvukové stránky jazyka – percepčního, artikulačního a akustického. Přitom je nutno brát v úvahu, že percepční hledisko je založeno na tzv. pečlivém poslechu. V rámci probíhajícího širšího výzkumu afrikát, jehož je tato studie součástí a který využívá především nahrávky spontánních projevů, plánujeme provést percepční testování afrikát prostřednictvím laických posluchačů a modifikovat tak významnost percepčních kategorií.
Poděkování
Tato studie vznikla za podpory grantu GA ČR 406/12/0300. Děkuji Radku Skarnitzlovi za technickou podporu.
ELYAN, O. (1978): Sex differences in speech style. Women Speaking, 4, s. 4–8.
ERNESTUS, M. – BAAYEN, R. H. – SCHREUDER, R. (2002): The recognition of reduced word forms. Brain and Language, 81(1–3), s. 162–173.
HAMANN, S. (2009): The learner of a perception grammar as a source of sound change. In: P. Boersma – S. Hamann (eds), Phonology in perception (Phonology and Phonetics 15). Berlin: Mouton de Gruyter, s. 111–149.
HARDCASTLE, W. J. – GIBBON, F. – NICOLAIDIS, K. (1991): EPG data reduction methods and their implications for studies of lingual coarticulation. Journal of Phonetics, 19, s. 251–266.
KOHLER, K. J. (1990): Segmental reduction in connected speech in German: phonological facts and phonetic explanations. In: W. J. Hardcastle – A. Marchal (eds.), Speech Production and Speech Modelling. Dordrecht: Kluwer Academic Publishers, s. 69–92.
MACHAČ, P. – SKARNITZL, R. (2009): Fonetická segmentace hlásek. Praha: Nakladatelství Epocha.
MACHAČ, P. – ZÍKOVÁ, M. (2013a): Redukční procesy v řeči z hlediska fonetických rysů. In: O. Uličný – M. Prošek (eds.), Studie k moderní mluvnici češtiny 5: K české fonetice a pravopisu. Olomouc: Univerzita Palackého v Olomouci, s. 17–44.
MACHAČ, P. – ZÍKOVÁ, M. (2013b): Redukční procesy v percepci mluvené češtiny: robustnost fonetických rysů. In: O. Uličný – M. Prošek (eds.), Studie k moderní mluvnici češtiny 5: K české fonetice a pravopisu. Olomouc: Univerzita Palackého v Olomouci, s. 69–86.
OHALA, J. J. (1981): The listener as a source of sound change. In: C. S. Masek – R. A. Hendrick – M. F. Miller (eds.), Papers from the Parasession on Language and Behavior. Chicago: Chicago Ling. Soc., s. 178–203.
SIMPSON, A. P. – ERICSDOTTER, CH. (2003): Sex-specific durational differences in English and Swedish. In: Proceedings of the XVth ICPhS. Barcelona, s. 1113–1116.
[42]SKARNITZL, R. – BARTOŠOVÁ, P. (2013): Výzkum lingvální artikulace pomocí elektropalatografie na příkladu českých palatálních exploziv. Naše řeč, 96, s. 246–258.
SKARNITZL, R. – MACHAČ, P. (2012): Míra rušivosti parazitních zvuků v řeči mediálních mluvčích. Naše řeč, 95, s. 3–14.
VYHNÁLKOVÁ, L. (2011): Temporální charakteristicky českých intervokalických afrikát. Klauzurní práce. Fonetický ústav FF UK (nepublikováno).
WHITESIDE, S. P. (1996): Temporal-based acoustic-phonetic patterns in read speech: Some evidence for speaker sex differences. Journal of the International Phonetic Association, 26, s. 23–40.
[1] Studie je součástí komplexnějšího zkoumání stability českých afrikát /c/, /č/ a jejich případné tendence k frikativizaci, tj. k oslabování až odstraňování závěrové artikulační fáze.
[2] V rámci širšího výzkumu realizace afrikát, který je současně prováděn zejména na spontánní řeči, je plánováno percepční testování laickými posluchači.
[3] [c] F (2, 141) = 75,16, p < 0,0001; [č] F (2, 123) = 66,11, p < 0,0001.
[4] [c] F (2, 141) = 51,32, p < 0,0001; [č] F (2, 123) = 75,44, p < 0,0001.
[5] Významnost rozdílů byla ověřována pomocí t-testů.
[6] [c] F (2, 141) = 170,39, p < 0,0001; [č] F (2, 123) = 98,93, p < 0,0001 (ANOVA).
[7] Směrodatná odchylka se ve fázi úžinové pohybuje v intervalu 4,5–7,5 dB, v závěrové fázi 4,1–5,5 dB.
[8] Rychlost stoupání intenzity za jeden krok je spočítána jako tangens úhlu mezi osou x a přímkou spojující minimum a maximum, tj. (y2 – y1) / (x2 – x1), kde y2 je hodnota maximální intenzity, y1 hodnota minimální intenzity, x2 poloha (krok) maximální intenzity na ose x a x1 poloha (krok) minimální intenzity.
[9] [c] F (2, 141) = 11,44, p < 0,0001; [č] F (2, 123) = 27,43, p < 0,0001 (u [č] není signifikantní rozdíl mezi kategoriemi kanonické a oslabené) (ANOVA).
[10] Obě pracovní označení mluvčích s krajními hodnotami se samozřejmě týkají pouze realizace afrikát.
[11] V intervokalickém postavení, bez asimilačních či koartikulačních vlivů okolních, můžeme [n] považovat spíše za nazálu apiko-alveolární.
Ústav obecné lingvistiky FF UK
nám. Jana Palacha 2, 116 38 Praha 1
pavel.machac@ff.cuni.cz
Naše řeč, volume 97 (2014), issue 1, pp. 26-42
Previous Josef Štěpán: Přirovnávací vedlejší věty se spojkami jako a než
Next Ivana Bozděchová: O naší řeči