Detail publikace

Nalezení slovních kořenů v češtině

CHMELAŘ Petr, HELLEBRAND David, HRUŠECKÝ Michal a BARTÍK Vladimír. Nalezení slovních kořenů v češtině. In: Znalosti 2011: Sborník příspěvků 10. ročníku konference. Stará Lesná: VŠB Technická univerzita Ostrava, 2011, s. 66-77. ISBN 978-80-248-2369-0.
Název anglicky
Czech Stemming Algorithm
Typ
článek ve sborníku konference
Jazyk
čeština
Autoři
Chmelař Petr, Ing. (UIFS FIT VUT)
Hellebrand David, Ing. (FIT VUT)
Hrušecký Michal (MFF UK)
Bartík Vladimír, Ing., Ph.D. (UIFS FIT VUT)
Klíčová slova

Lemmatizace, stematizace, Snowball, český jazyk, gramatika.

Abstrakt

Cílem bylo vytvořit stematizační algoritmus pro český jazyk založený na gramatických pravidlech jako doplněk k metodám používajícím slovník pro vyhledávání a dolování českého textu. Článek obsahuje základy slovotvorby českého jazyka pro různé slovní druhy, popis problematiky stematizace a několika stematizačních a lematizačních algoritmů. Hlavním přínosem této práce je Snowball implementace stematizačního algoritmu českého jazyka na základě kompletní sady všech předpon a přípon, které se mohou v českém jazyce vyskytovat.

Rok
2011
Strany
66-77
Sborník
Znalosti 2011: Sborník příspěvků 10. ročníku konference
Konference
Znalosti 2011, Hotel Academia Stará Lesná, SK
ISBN
978-80-248-2369-0
Vydavatel
VŠB Technická univerzita Ostrava
Místo
Stará Lesná, SK
BibTeX
@INPROCEEDINGS{FITPUB9473,
   author = "Petr Chmela\v{r} and David Hellebrand and Michal Hru\v{s}eck\'{y} and Vladim\'{i}r Bart\'{i}k",
   title = "Nalezen\'{i} slovn\'{i}ch ko\v{r}en\r{u} v \v{c}e\v{s}tin\v{e}",
   pages = "66--77",
   booktitle = "Znalosti 2011: Sborn\'{i}k p\v{r}\'{i}sp\v{e}vk\r{u} 10. ro\v{c}n\'{i}ku konference",
   year = 2011,
   location = "Star\'{a} Lesn\'{a}, SK",
   publisher = "V\v{S}B-Technical University of Ostrava",
   ISBN = "978-80-248-2369-0",
   language = "czech",
   url = "https://www.fit.vut.cz/research/publication/9473"
}
Nahoru