Časopis Naše řeč
en cz

Nová automatická morfologická analýza češtiny

Klára Osolsobě, Jaroslava Hlaváčová, Vladimír Petkevič, Martin Svášek, Josef Šimandl

[Articles]

(pdf)

A new automatic morphological analysis of Czech

A detailed morphological description of word forms in any language is one of the necessary conditions for the successful automatic processing of linguistic data.
The aim of this paper is to present a project aimed at a new description of Czech morphology, especially the planned changes in the tagset. The key changes are as follows:
1) the unambiguous description of variants;
2) the concept of a multiple lemma;
3) the revision of part-of-speech definitions.

Key words: automatic morphological analysis, lemmatization, natural language processing, part-of-speech tagging, tagset
Klíčová slova: automatická morfologická analýza, lemmatizace, počítačové zpracování přirozeného jazyka, slovnědruhové značkování, tagset

Text je on-line k dispozici v databázi CEEOL.

Jaroslava Hlaváčová
Ústav formální a aplikované lingvistiky MFF UK
Malostranské náměstí 2, 118 00 Praha 1
hlavacova@ufal.mff.cuni.cz
Klára Osolsobě
Ústav českého jazyka FF MU
Arna Nováka 1, 602 00 Brno
osolsobe@phil.muni.cz
Vladimír Petkevič
Ústav teoretické a komputační lingvistiky FF UK
Celetná 13, 110 00 Praha 1
vladimir.petkevic@ff.cuni.cz
Martin Svášek
martin.svasek@centrum.cz
Josef Šimandl
Ústav pro jazyk český AV ČR
Letenská 4, 118 51 Praha 1
simandl@ujc.cas.cz

Naše řeč, volume 100 (2017), issue 4

Previous Hana Mžourková, Jana Nová, Helena Pernicová: Proměny lékařské terminologie v jednojazyčných výkladových slovnících

Next Markéta Klimešová: Adverbia rovně, zrovna, jejich funkce a významové obměny v čase