Klára Osolsobě, Jaroslava Hlaváčová, Vladimír Petkevič, Martin Svášek, Josef Šimandl
[Články]
A new automatic morphological analysis of Czech
A detailed morphological description of word forms in any language is one of the necessary conditions for the successful automatic processing of linguistic data.
The aim of this paper is to present a project aimed at a new description of Czech morphology, especially the planned changes in the tagset. The key changes are as follows:
1) the unambiguous description of variants;
2) the concept of a multiple lemma;
3) the revision of part-of-speech definitions.
Key words: automatic morphological analysis, lemmatization, natural language processing, part-of-speech tagging, tagset
Klíčová slova: automatická morfologická analýza, lemmatizace, počítačové zpracování přirozeného jazyka, slovnědruhové značkování, tagset
Text je on-line k dispozici v databázi CEEOL.
Jaroslava Hlaváčová
Ústav formální a aplikované lingvistiky MFF UK
Malostranské náměstí 2, 118 00 Praha 1
hlavacova@ufal.mff.cuni.cz
Klára Osolsobě
Ústav českého jazyka FF MU
Arna Nováka 1, 602 00 Brno
osolsobe@phil.muni.cz
Vladimír Petkevič
Ústav teoretické a komputační lingvistiky FF UK
Celetná 13, 110 00 Praha 1
vladimir.petkevic@ff.cuni.cz
Martin Svášek
martin.svasek@centrum.cz
Josef Šimandl
Ústav pro jazyk český AV ČR
Letenská 4, 118 51 Praha 1
simandl@ujc.cas.cz
Naše řeč, ročník 100 (2017), číslo 4
Předchozí Hana Mžourková, Jana Nová, Helena Pernicová: Proměny lékařské terminologie v jednojazyčných výkladových slovnících
Následující Markéta Klimešová: Adverbia rovně, zrovna, jejich funkce a významové obměny v čase