Martin Beneš, Ondřej Dufek, Martina Rybová, Michal Hořejší
[Editor's notice]
Discussion on open data: Editor's introduction
Vážené čtenářky, vážení čtenáři,
po osvědčených tematických číslech přicházíme v tomto sešitě Naší řeči poprvé s novým formátem – komponovanou diskusí, v tomto případě o otevřeném sdílení lingvistických dat. Návrhy na realizaci diskusního čísla (po vzoru některých zahraničních lingvistických časopisů) se objevily při rozhovorech redakce s odbornou radou časopisu už několikrát v minulosti, když se nás tedy v minulém roce kolegové Václav Cvrček a Jan Chromý zeptali, jestli bychom měli v redakci zájem o diskusní příspěvek na téma sdílení otevřených dat, jejich nabídku jsme přivítali – výsledkem je sešit, který držíte v rukou.
Úvodní diskusní příspěvek kolegů Cvrčka a Chromého, který argumentuje pro otevřené sdílení dat, jsme rozeslali vybraným českým lingvistům, o nichž je známo, že oni nebo jejich pracoviště spravují významné datové soubory, a lze tedy u nich předpokládat specifické zkušenosti s jejich nakládáním, a poprosili je o stručnou reakci na výchozí článek.[1] Na tuto výzvu se rozhodlo reagovat jedenáct autorů či autorských týmů z šesti pracovišť po celé České republice (Praha – FF UK, MFF UK, ÚJČ AV ČR, Brno – MU, ÚJČ AV ČR, Ostrava – OU, Liberec – TUL). Na základě jejich příspěvků pak kolegové Cvrček a Chromý sepsali svou závěrečnou shrnující reakci. Neznamená to samozřejmě, že by to mělo být v diskusi o otevřených datech poslední slovo. Další příspěvky s připomínkami, argumenty, doplněními, tématy a zkušenostmi, které se dosud v diskusi neobjevily, redakce uvítá. Všem, kdo se do diskuse rozhodli přispět, děkujeme.
Diskusní příspěvky neprošly recenzním řízením, byly však samozřejmě redakčně komentovány a na základě toho autory upraveny. Důvodem je skutečnost, že jde o vědecké nebo vědecko-provozní názory jednotlivých autorů, které nemůžou podléhat takovému typu kritiky, jenž se žádá od recenzentských posudků (ani u studie recenzent nemá posuzovat, zda souhlasí s vědeckým názorem či závěrem článku, nýbrž zda je tento závěr vzhledem k datům, metodě, typu analýzy, argumentaci atp. vědecky opodstatněný).
Kolegové Cvrček a Chromý ve svém úvodním příspěvku uvádějí důvody, proč by podle nich měla být data, která lingvisté získají, volně dostupná i jejich kolegům a vůbec všem, kdo o ně projeví zájem. Diskusní reakce řadíme podle toho, jak moc s touto obecnou tezí souzní – od textů, které ji podporují a „jen“ doplňují dalšími, novými argumenty, přes texty, které i přes obecný souhlas s ní její všeobecnou platnost a uplatnitelnost relevantními argumenty omezují, až po text, který ji odmítá.
Diskuse osvědčila svou potřebnost a užitečnost už v této prvotní fázi. Jakkoliv je totiž rozsáhlá, ukazuje se, že jde stále o první, počáteční krok – řada otázek a problémů, často velmi základních, se tu teprve otevírá. Diskuse mj. prokázala, že jednotliví autoři chápou nestejně už samotný její předmět – odlišně konceptualizují jak „data“ (skutečně hrubá data vs. před/zpracovaná, vyčištěná, opravená data), tak „zveřejnění“ (excelová tabulka nebo textový soubor s kódovanými daty vs. internetová aplikace umožňující s daty ihned strukturovaně, pohodlně, byť predeterminovaným způsobem pracovat).
Na několika místech se autoři diskusních textů vyjadřují i o roli a úloze odborných časopisů. Považujeme proto za vhodné říct něco o tom, jak se k podnětům stavíme v redakci Naší řeči. Prvním z nich je návrh podmiňovat publikování studie jistou mírou přístupnosti dat, na nichž je výzkum postaven. Jelikož souhlasíme s myšlenkou kolegů Cvrčka a Chromého, že ověřitelné závěry nebo možnost podrobit data novým, odlišným zkoumáním jsou pozitivní cíle, a jelikož cítíme, že právě časopisy mají v otázce kultivace vědecké komunity nemalý díl zodpovědnosti, máme v úmyslu v budoucnu na tuto výzvu reagovat, a to přinejmenším požadavkem, aby autoři deklarovali, kde a jak jsou data přístupná, případně z jakých důvodů přístupná být nemohou. Druhým podnětem je dostupnost časopisecky publikovaných textů v režimu open access. I tomu jsme v redakci nakloněni a zahájíme v tomto směru jednání s vydavatelem. Oba posuny podpořila i odborná rada Naší řeči.
V průběhu přípravy čísla jsme v redakci také zaznamenali názor, že otevřená diskuse o sdílení dat není žádoucí, neboť přístup k nakládání s daty je především záležitost rozhodnutí a závazků konkrétních institucí, a nikoli vůle jednotlivých badatelů. Domníváme se, že je tomu právě naopak: Jen díky veřejné, otevřené debatě se může ustavit všeobecně sdílený, nebo alespoň uznávaný ideál dobré praxe, o kterém se hovoří už v přítomné diskusi. Jednotlivá pracoviště se tak můžou dozvědět (nejen o sobě, ale i o sobě navzájem), nakolik jsou mu blízko či daleko, odpovědět si na otázku, zda se mu chtějí přibližovat, a pokud ano, inspirovat se u kolegů tím, jak to ve svých specifických podmínkách udělat. Jen díky veřejné diskusi pak na ně také může vzniknout, byť třeba dočasně nepříjemný, ale v konečném důsledku pro celou lingvistickou obec blahodárný tlak, který je k tomuto ideálu dobré praxe nasměruje.
Diskusní část čísla je doplněna texty ze standardních rubrik – dvojrecenzí knihy o historii české terminologie a knihy o vývoji české slovotvorby a drobností z oblasti dialektologie.
Vážené čtenářky, vážení čtenáři, věříme, že se Vám diskusní číslo bude líbit, a přejeme inspirativní čtení!
Martin Beneš, Ondřej Dufek, Martina Rybová, Michal Hořejší
[1] Osloveným autorům jsme nabídli možnost přidržet se při strukturování reakce tří základních otázek: 1. Jaká máte vlastní empirická data? Zveřejňujete je? Pokud ano, jak a proč? Pokud ne, proč? 2. Nesouhlasíte s něčím, co autoři tvrdí? 3. Myslíte, že je třeba říct k tomu i něco, co autoři opomíjejí?
Naše řeč
Ústav pro jazyk český AV ČR
Letenská 4, 118 51 Praha 1
naserec@ujc.cas.cz
Naše řeč, volume 104 (2021), issue 1
Previous Z jazykové poradny
Next Jan Chromý, Václav Cvrček: Lingvistika jako otevřená a transparentní disciplína