Ludmila Uhlířová
[Reviews and reports]
The new Brno corpus of personal correspondence
The article is a review of Zdeňka Hladká a kolektiv: 111 let českého dopisu v korpusovém zpracování. Brno: Masarykova univerzita, 2013. 2 CD; Zdeňka Hladká a kolektiv: Soukromá korespondence jako lingvistický pramen. Brno: Masarykova univerzita, 2013. 187 s.; Zdeňka Hladká – Olga Martincová: Slova v soukromých dopisech. Lexikografická sonda. Brno: Masarykova univerzita, 2012. 138 s.
Péčí nakladatelství Masarykovy univerzity v Brně byly v letech 2012–13 vydány tři publikace, jejichž ústředním tématem jsou soukromé dopisy. Tyto publikace se mezi sebou liší nejen médiem prezentace – jedna je elektronická a dvě jsou tištěné, ale tištěné rovněž odborným žánrem – jedna z nich je kolektivní monografie o sedmi studiích a druhá je výkladový slovník. Dohromady však tvoří dokonale propojený, jedinečný triptych, přinášející lingvistickou reflexi korespondence za mimořádně dlouhé časové období více než celého století, a to včetně jejího korpusového zpracování. I když jak známo soukromé osobní dopisy, zejména dopisy známých osobností 19. a 20. století (např. Boženy Němcové, Karla Čapka, Jiřího Voskovce a Jana Wericha a dalších[1]) opakovaně poutaly a stále poutají pozornost našich jazykovědců, stejně jako editorů, literárních vědců a historiků, teprve v 90. letech 20. století se v Ústavu českého jazyka Filozofické fakulty Masarykovy univerzity jako na vůbec prvním vědeckém pracovišti u nás započalo se sběrem, archivací, digitalizací, korpusovým zpracováním a lingvistickou, stylistickou, sociolingvistickou a pragmatickou analýzou tradičních, ručně psaných osobních dopisů řadových pisatelů. Zahájen byl projekt velkorysý a dlouhodobý, po všech stránkách náročný a pracný. První reprezentativní výsledky byly (v návaznosti na dílčí studie, články a referáty na konferencích) komplexně představeny v publikaci Z. Hladké a kol., vydané v r. 2005 a nazvané Čeština v současné soukromé korespondenci. Dopisy, e-maily, SMS (Brno: Masarykova univerzita), k níž jsou přiložena dvě CD. V této publikaci, která právem vzbudila velice kladný ohlas,[2] byly položeny obsahové a metodologické základy jazykovědného výzkumu korespon[211]dence, na kterých pak bylo možno dále stavět a které byly v dalších letech intenzivně propracovávány. V čele kolektivního výzkumu stojí od samého počátku neúnavný spiritus agens – Zdeňka Hladká. Možná právě skutečnost, že svou vědeckou kariéru původně zahájila jako úspěšná dialektoložka[3], ovlivnila její rozhodnutí zajímat se o další, rovněž „mizející“ či „ohroženou“ oblast jazykové komunikace, jíž je tradiční, ručně psaný dopis, s cílem „zachytit a zmapovat jeho pravděpodobně poslední vývojovou fázi“ (s. 7).
Od roku 2005 bylo vykonáno velké množství práce: Zatímco v publikaci z r. 2005 šlo o 2 000 dopisů z přelomu 20. a 21. stol. (a dále o 1 000 e-mailů a cca 2 000 SMS)[4], na dvou CD z r. 2013 byl sběr a následné zpracování soukromých dopisů rozšířeno na celé 20. stol. a dosavadní korpus byl tak obohacen o diachronní rozměr; spolu s elektronickými nosiči nově přibyly také dvě výše citované publikace tištěné (vedle řady článků a referátů, jejichž bibliografii čtenář najde v obou tištěných publikacích) a je jasné, že i pro budoucnost jde o projekt perspektivní.
Vezme-li čtenář do ruky nejdříve CD, jak je to ostatně v dnešní korpusové éře stále obvyklejší, je mu nabídnuta celá řada rozmanitých možností a úhlů pohledu, jak k dopisům přistoupit. Především: Na jednom CD si může dopisy číst, a to hned v dvojí podobě: K dispozici je úplná textová podoba dopisů jednotně přepsaných (podle pečlivě stanovených pravidel, zohledňujících např. zacházení s nečitelnými slovními segmenty, s někdy nepředvídatelnou delimitací skupin slov apod.) a vedle přepsaných podob rovněž digitální fotokopie originálů dopisů. I kdyby nebylo k dispozici vůbec nic jiného než toto jediné CD, jednalo by se o neobyčejně cenný materiál, využitelný nejen k lingvistickým analýzám, nýbrž dobře se hodící k probádání i v dalších společenskovědních oborech. Už sama četba dopisových textů obohacuje čtenáře o poznání toho, o čem si během posledních sto jedenácti let (tj. mezi léty 1902 až 2012) psali „běžní“ pisatelé, přátelé, partneři či rodinní příslušníci, co je zajímalo, trápilo či těšilo, o čem přemýšleli, jak „šel život“, jakou češtinou a jakým stylem se vyjadřovali, jak se měnil epistolární i jazykový úzus i jak vypadaly a proměňovaly se grafické rysy dopisů, které nelze postihnout přepisem, včetně výtvarných prvků, zvláštností písma aj. To vše u dvou tisíců různých pisatelů[5], a tedy ve dvou tisících různých idiolektech. Využitelnost tohoto unikátního jazykového materiálu je na druhém CD znásobena propojením textů dopisů s jejich paralelní prezentací ve formě korpusového zpracování. Texty jsou uloženy pod vyhledávacím manažerem Bonito (tedy pod manažerem, s nímž jsme dosud byli zvyklí pracovat jako uživatelé Českého národního korpusu), který je přizpůsoben specifice epistolárních dat a obohacen o některé [212]vyhledávací možnosti. Z dat na CD lze získávat všechny druhy lingvistických informací (lexikálních, kontextových, frekvenčních, statistických atd.) jako z jiných (sub)korpusů Českého národního korpusu, a navíc jsou data opatřena informacemi, které zpracovatelé skromně nazývají „doprovodné“, ale které jsou exkluzivní. Jsou to sociologické údaje o věku, pohlaví a vzdělání pisatelů a adresátů, o vztahu (rodinném, mileneckém/partnerském, kamarádském a o vztahu pouhé známosti) mezi pisatelem a adresátem, o roce napsání dopisu a dialektologické informace o teritoriálním zázemí pisatelů. Programové vybavení mj. umožňuje jednoduché filtrování vyhledávek podle libovolné kombinace těchto údajů.
Komplet dvou CD se vyznačuje dokonalou souhrou několika faktorů. Především je třeba zdůraznit důkladně promyšlené (v publikaci z r. 2005 už metodicky prověřené) obsahové a ediční zpracování CD, dále trvale efektivní spolupráci s pracovníky Fakulty informatiky Masarykovy univerzity při programovém a technickém zpracování CD a v neposlední řadě vstřícné porozumění mezi lingvistickým vedením projektu a zúčastněnými, zaujatými studenty a doktorandy brněnské bohemistiky, kteří se na projektu rovněž podíleli. Zároveň je vidět, že ve skutečně kvalitním díle, jakým brněnský projekt bezesporu je, se nutně a se synergickým efektem prostupují poznatky dosažené v různých oblastech/oborech lingvistiky – již jsme zmínili lingvistiku korpusovou nebo dialektologii. Například lokalizační údaje a číselný kód zařazující lokalitu dopisu/pisatele odpovídají nářečním oblastem podle Českého jazykového atlasu[6]. Nářeční značkování zavedli autoři jako první v české korpusové lingvistice v korpusu dopisů z r. 2005; toto značkování pak přejali např. autoři mluvených korpusů řady ORAL.
O tom, jak veliký výzkumný potenciál představují epistolární korpusy, přesvědčují obě publikace tištěné. Slovník Hladké a Martincové (2012) časově předchází vydání kompletu CD, o kterém byla řeč výše. Je založen na výběru dopisů z korpusu publikovaného v r. 2005 a v současné době již veřejně přístupného v ČNK (viz výše). Z tohoto korpusu autorky vybraly sto dopisů, které napsali v letech 1997–2003 pisatelé do třiceti let věku pocházející z celého území České republiky, a představily je, jak v úvodu píší, jako „pramen pro lexikologický výzkum a lexikografickou reflexi“. Logicky se jejich lingvistická „sonda“ do jazyka soukromé korespondence soustředila nejprve na lexikum, protože právě v lexiku se nejvýrazněji projevují charakteristické rysy soukromého epistolárního žánru, především typologická šíře nejrůznějších příznakových lexémů, jejich vysoká koncentrace a vzájemné propojení na malé textové ploše. To dokazuje už rozsah slovníku – má přes osm set hesel, doplněných v příloze ještě seznamem frazémů. Uvážíme-li, že průměrná délka dopisu je přibližně dvě stě slov[7], znamená to, že každé desáté slovo v textu nese nějaký příznak, což je podíl neobvykle vysoký. Do slovníku jsou zařazeny výrazy charakterizované (a hodnocené) jako obecněčeské, oblastní, nářeční, slangové, hovorové, knižní, dále výrazy expresivní (v jejich rámci slova s kladným citovým zabarvením, slova hanlivá, zhrubělá a vulgární), lexikální prostředky zastarávající a zastaralé, výrazy s charakteristickou frekvencí a výrazy příznakové z dobového hlediska. Podstatné je, že kritéria příznakovosti nebyla uplatňována mechanicky podle dosavadních popisů ve výkladových slovnících češtiny, ale že autorky přistupovaly k charakteristikám příznakových lexikálních jednotek na základě empirickém; skutečný úzus ověřovaly ještě [213]v synchronních korpusech ČNK a v internetových textech (z těchto důvodů se charakteristiky některých lexikálních jednotek liší od charakteristik uváděných v českých výkladových slovnících – ani v těch ovšem nejsou vždy stejné).
Heslová slova jsou bohatě lexikograficky propracovaná. Uvedeny jsou slovnědruhové a tvaroslovné charakteristiky, stylové kvalifikátory, význam slova / slovního spojení a příklady, v nichž se v maximální míře uchovává autentické znění dokladů. Každý doklad je opatřen identifikačním číslem dopisu, což umožňuje propojení se subkorpusem dopisů v ČNK.
Význam takto vytvořeného „malého“ slovníku je několikerý. Především dokonale splňuje bezprostřední cíl, pro který byl sestaven – je reprezentativním vzorkem, který vypovídá o příznakové slovní zásobě v soukromých dopisech mladé generace. (Pro konkrétní příklady hesel odkazujeme čtenáře přímo na slovník.) Zadruhé přesvědčivě ukazuje, že soukromá korespondence může být dobře využita ke studiu příznakové slovní zásoby dnešní češtiny vůbec (i proto je tak záslužné začlenění epistolárních korpusů do ČNK). A zatřetí se vyznačuje tím, co některé jiné lexikografické práce o nespisovné slovní zásobě do určité míry postrádají, ale bez čeho by se žádný lexikografický přístup neměl obejít, má-li být lingvisticky spolehlivý. Obsahuje totiž konzistentně formulované zásady popisu příznakového lexika, opřené o obecná teoretická východiska. Úvodní studii v slovníku (s. 5–24) lze proto doporučit jako důkladně promyšlený teoretický základ či model, vzor, návod i inspiraci vhodnou k následování. Je třeba ovšem připomenout, že takto kvalitní studie by nemohla být napsána, kdyby se neopírala o dlouholetou lexikografickou zkušenost autorek.[8]
Cílem kolektivní monografie z r. 2013, tj. třetí z výše jmenovaných publikací, je prezentovat soukromou korespondenci jako mnohostranně využitelný lingvistický pramen a naznačit metodickou škálu současných analýz tohoto materiálu. V hutně a přehledně napsané vstupní studii Z. Hladká podává základní informace o historii vzniku archivu dopisů v Ústavu českého jazyka na Filozofické fakultě v Brně a utváření korpusů soukromé korespondence. Vykládá, co všechno bylo nutno udělat, aby bylo možno pracovat s texty, které specifickým způsobem oscilují mezi spisovností a nespisovností, vyznačují se emocionalitou, dialogičností, individuálností i konvenční stylizovaností a které odrážejí pestrost územního původu pisatelů, žánrové posuny v epistolární komunikaci a vývoj jazykového úzu vůbec. Poukazuje na dosavadní lingvistickou reflexi korespondenčního materiálu (s bibliografickými odkazy na články již publikované) a připravuje čtenáře na četbu dalších studií v monografii, které jsou věnovány dílčím tématům a které napsali spolupracující autoři.
Morfologie substandardních (obecněčeských, interdialektových, tradičně teritoriálních dialektových) lexémů a substandardních tvarů (D. Hlaváčková) byla jedním z velkých problémů, které bylo nutno řešit při zpracování dopisového korpusu publikovaného v r. 2005. Bylo zřejmé, že v oblasti morfologického tagování lze sice využít již hotového, velmi podrobného morfologického analyzátoru ajka[9], ale nikoli v té podobě, v které slouží k analýze běžných psaných [214]textů. Autorka umožňuje ve své stati čtenářům nahlédnout přímo do „tagovací kuchyně“, když mj. zdůvodňuje, proč bylo zapotřebí výrazně rozšířit počet variantních koncovek (např. jen v instr. pl. substantiv bylo nutno nově počítat se zakončeními -ama, -ema, -ma, -ěma, -íma, -ýma, -ima), které nové tagy bylo nutno zavést (např. S-atribut pro nesamostatný morfém -s: ses, musels, cos…) a jak velký podíl ruční práce bylo třeba vynaložit pro desambiguaci (vzhledem k vysoké míře homonymie ohebných tvarů i synsémantik). Ukazuje se, že přibližně 95 % tvarů lze v podobných v textech smysluplně a efektivně (polo)automaticky morfologicky označkovat. Řada zkušeností z morfologického tagování dopisových textů je použitelná rovněž pro značkování textů mluvených. To je jeden z důležitých výsledků korpusového zpracování dopisů.
Svou epistolární etiketou patří dopisy bezpochyby k ideálním materiálovým zdrojům pro studium hypokoristik (J. Machalová – K. Osolsobě). Nápad analyzovat slovotvornou strukturu hypokoristik z rodných jmen přinesl pozoruhodné výsledky, včetně přehledu sufixů a jejich zastoupení v korpusu dopisů a včetně retrográdního morfematického slovníku hypokoristik. Studie patří k průkopnickým v dané oblasti české slovotvorby, nejen materiálovým bohatstvím, ale také metodicky: Např. na rozdíl od anketních výzkumů odrážejí hypokoristika zkoumaná v dopisech skutečný úzus, jejich fungování v přirozeném kontextu, jak je doloženo (nejen) v oslovení adresáta a v podpisu pisatele, přinášejí objektivnější údaje o frekvenci jednotlivých podob, a proto mohou být východiskem i pro pragmaticky, sociolingvisticky a funkčně orientované výzkumy. Kromě toho lze z dat vytěžit další poznatky a poučení, např. pravopisná (viz např. známý problém variant Niki/y, Dani/y, Teri/y, Jari/y).
Cestu k analýze teritoriálních a sociálních diferencí v jazyce osobní korespondence otevřela (v návaznosti na své předchozí práce[10]) v obsáhlé stati prezentující některé kvantitativní a sociolingvistické metody zpracování korespondenčních textů Z. Hladká. Zjištěné diference mezi územ českým, moravským a slezským na rovině hláskové a morfologické, doložené podrobnými percentuálními údaji, mj. ukázaly, že „o významnějším šíření prvků obecné češtiny za hranice tradičních nářečních izoglos lze hovořit jen v případě diftongu ej, a to pouze do oblasti střední Moravy“ (s. 80), a celkově potvrdily „širší funkční využití spisovného jazyka na Moravě a zejména ve Slezsku nežli v Čechách“ (s. 89). Stať Hladké je příspěvkem k dlouhodobě se táhnoucí, někdy velmi nekonsensuální diskusi mezi českými lingvisty o expanzi jevů obecné češtiny na území Česka. Příspěvkem důležitým a přesvědčivým už proto, že se opírá o autentická data z žánru, v němž je tradiční sepětí psanosti se spisovností narušeno a v němž se uplatnil poměrně výrazně vliv faktorů mluvenostních. Vedle toho je čtenářům stati nabídnuta spousta nejrůznějších postřehů dalších, týkajících se například vlastností slov a slovních spojení v textové struktuře. Autorka si například povšimla „tendence spisovných začátků“ (s. 82), a to v celých dopisech, v odstavcích a větných celcích, a postupného uvolňování prostoru prostředkům nespisovným při dalším rozvíjení textu. Konstatovala vázanost nespisovné hláskové nebo morfologické formy na význam a stylový příznak slov. Všimla si, že míra nespisovnosti je větší u mladších pisatelů, s nižším vzděláním – a také u žen. Myšlenkově bohatá stať s příkladnou logickou výstavbou může přinést inspiraci lingvistům nejrůznější metodologické a oborové orientace i mnohým odborníkům nelingvistům.
[215]Od soukromých dopisů „běžných“ uživatelů se v druhé části monografie přechází k soukromé korespondenci význačných osobností 19. stol. M. Nekula a L. Rychnovská analyzují jazyk česky psaných dopisů B. Smetany. Rovněž jejich fundovaná analýza, prezentující sociolingvistickou metodu jazykových biografií a ve druhé části zaměřená na detailní rozbor gramatických jevů skladatelova jazyka, se opírá o speciální korpusové zpracování Smetanovy odeslané i přijaté korespondence.[11] Zkoumajíce Smetanovu „jazykovou biografii“, vidí jeho češtinu nejen jako jazyk „průměrného dobového mluvčího češtiny“, ale zároveň jako „modelový příklad, který ukazuje, jak vypadaly nejen česky psané projevy Bedřicha Smetany, ale šířeji i celé jeho generace“ (s. 131). Druhou velkou osobností, jejíž korespondenci je v monografii věnována pozornost, je Božena Němcová. Autoři R. Adam, J. Janáčková, A. Macurová a F. Martínek se věnují výzkumu korespondence Němcové po řadu let a přehled jejich dosavadních edičních i analytických aktivit, který ve stati podávají, budí úctu, stejně jako bibliografie připojená ke stati. A konečně Karlu Čapkovi a Janu Nerudovi se dostalo pozornosti v příspěvku J. Hoffmannové s aplikací pragmatické kategorie temperatury (s odkazem na polskou badatelku A. Kalkowskou[12]). Stať Hoffmannové zároveň výborně rámuje celou monografii, uzavírajíc ji (v druhé části autorčiny stati) syntaktickým rozborem mluvenostních rysů v dopisech mládeže, opět na základě brněnského epistolárního korpusu. „Rozmanitě profilovaný pohyb mezi psaností a mluvností“ (s. 173) je dokládán řadou dobře zvolených úryvků z dopisů, které tvoří poutavou i inspirativní tečku za celým svazkem.
Vynikající renomé patří ke konstantním atributům brněnské univerzitní bohemistiky. Netřeba v závěru opakovat, že trojice publikací, o nichž jsme zde referovali, je plně potvrzuje a aktivně rozvíjí.
[1] Například: Janáčková, J. – Macurová, A. a kol. (2001): Řeč dopisů, řeč v dopisech Boženy Němcové. Praha: ISV nakladatelství. – Saicová Římalová, L. (2005): Komunikační strategie v dopisech Boženy Němcové. Praha: Karolinum. – Hoffmannová, J. (1999): Pragmalingvistický pohled na dopisy Karla Čapka. Naše řeč, 82, s. 113–121. – Hoffmannová, J. – Štícha, F. (2012): O jazyce a stylu korespondence Jiřího Voskovce a Jana Wericha. Korpus – Gramatika – Axiologie, 5, s. 3–33. – R. H. [= Rudolf Havel] v Naší řeči, 58, 1975, s. 41, informuje o 17. svazku Sborníku Národního muzea v Praze (řada C, 1972), v němž P. Pešta a Š. Vlašín vybrali z pozůstalosti a otiskli část soukromé korespondence Františka Trávníčka s názvem Spisovatelé Františku Trávníčkovi.
[2] Müllerová, O. (2007): Soukromá korespondence jako svědectví doby i zdroj poznání současné češtiny. Naše řeč, 90, s. 40–43. – Štícha, F. (2007): Zdeňka Hladká a kol: Čeština v současné soukromé korespondenci. Dopisy, e-maily, SMS. Slovo a slovesnost, 68, s. 66–69.
[3] Hladká, Z. (2000): Přenesená pojmenování rostlin v českých dialektech. K sémantickému tvoření lexikálních jednotek v nářečích. Brno: Masarykova univerzita. – Viz recenze: Jančák, P. (2001): Nová práce o jménech rostlin. Naše řeč, 84, s. 101–104; Bachmannová, J. (2002): Přenesená pojmenování rostlin v českých dialektech. Slovo a slovesnost, 63, s. 57–60.
[4] Část věnovaná dopisům se v roce 2006 stala samostatnou složkou Českého národního korpusu; viz KSK-DOPISY; <http://ucnk.ff.cuni.cz>. Počítá se s tím, že také nejnovější korpus, mapující 111 let českého dopisu, bude do Českého národního korpusu začleněn, a bude tedy pro veřejnost přístupný.
[5] Anonymita „běžných“ pisatelů a adresátů (= přímých účastníků korespondenčního styku nebo jejich dědiců, kteří explicitně souhlasili s jejich zveřejněním a využitím pro nekomerční studijní účely), je zachována, identifikační údaje jsou ve fotokopiích začerněny a v přepsaných textech nahrazeny zástupnými symboly.
[6] Praha: Academia, 1993, s. 43.
[7] Rozsah korespondenčního korpusu dvou tisíc dopisů 2005 činí (Hladká, 2013, s. 9) celkem 223 672 pozic, tj. 184 084 slovních výskytů.
[8] Pod vedením O. Martincové vyšly neologické slovníky Nová slova v češtině. Slovník neologizmů, sv. 1 a 2, Praha: Academia, 1998 a 2004. – Viz též Martincová, O. (1996): Dopisy čtenářů jako zdroj nového lexika. In: R. Šrámek (ed.), Spisovnost a nespisovnost v současné jazykové a literární komunikaci. Brno, Masarykova univerzita, s. 117–119.
[9] Sedláček, R. – Smrž, P. (2001): A New Czech Morphological Analyser ajka. In: V. Matoušek – P. Mautner – R. Mouček – K. Taušer (eds.), Proceedings of the 4th International Conference Text, Speech and Dialogue. Berlin: Springer Verlag, s. 100–107.
[10] Hladká, Z. (2001): Spisovnost a nespisovnost v jazyce soukromé korespondence (se zřetelem k teritoriální příslušnosti pisatelů). Naše řeč, 84, s. 225–234.
[11] Rychlý, P. – Hladká, Z. – Rychnovská, L. (2009): Korpus odeslané a přijaté česky psané korespondence Bedřicha Smetany. Brno: ÚJČ FF MU. CD-ROM.
[12] Kalkowska, A. (1993): Językowe wykładniki pragmatycznej funkcji listów. Stylistyka, 2, s. 187–204.
Nýřanská 12, 153 00 Praha 5
lidauhlirova@seznam.cz
Naše řeč, volume 96 (2013), issue 4, pp. 210-215
Previous Robert Adam: Autorské textové změny a jazyková kultura: povídky K. V. Raise
Next Hana Konečná: Vysokoškolská příručka o slovenských nářečích