Result Details
Nalezení slovních kořenů v češtině
CHMELAŘ, P.; HELLEBRAND, D.; HRUŠECKÝ, M.; BARTÍK, V. Nalezení slovních kořenů v češtině. CEUR Workshop Proceedings, 2011, roč. 2011, č. 802, s. 1-12. ISSN: 1613-0073.
Type
journal article
Language
Czech
Authors
Chmelař Petr, Ing., FIT (FIT), DIFS (FIT)
Hellebrand David, Ing.
Hrušecký Michal
Bartík Vladimír, Ing., Ph.D., DIFS (FIT)
Hellebrand David, Ing.
Hrušecký Michal
Bartík Vladimír, Ing., Ph.D., DIFS (FIT)
Abstract
Cílem bylo vytvořit stematizační algoritmus pro český jazyk
založený na gramatických pravidlech jako doplněk k metodám používa-
jícím slovník pro vyhledávání a dolování českého textu. Článek obsahuje
základy slovotvorby českého jazyka pro různé slovní druhy, popis problematiky stematizace a několika stematizačních a lematizačních algoritmů.
Hlavním přínosem této práce je Snowball implementace stematizačního
algoritmu českého jazyka na základě kompletní sady všech předpon a
přípon, které se mohou v českém jazyce vyskytovat.
English keywords
Lemmatization, stemmization, Snowball, Czech, grammar.
URL
Published
2011
Pages
1–12
Journal
CEUR Workshop Proceedings, vol. 2011, no. 802, ISSN 1613-0073
Book
Selected papers from the 10th annual Czech and Slovak knowledge technology conference (Znalosti 2011)
Publisher
Aachen University of Technology
Place
Aachen
BibTeX
@article{BUT91156,
author="Petr {Chmelař} and David {Hellebrand} and Michal {Hrušecký} and Vladimír {Bartík}",
title="Nalezení slovních kořenů v češtině",
journal="CEUR Workshop Proceedings",
year="2011",
volume="2011",
number="802",
pages="1--12",
issn="1613-0073",
url="http://www.ceur-ws.org/Vol-802"
}
Projects
Security-Oriented Research in Information Technology, MŠMT, Institucionální prostředky SR ČR (např. VZ, VC), MSM0021630528, start: 2007-01-01, end: 2013-12-31, running
Research groups
Departments