Result Details
Český stemmer v jazyce Snowball
Chmelař Petr, Ing., FIT (FIT), DIFS (FIT)
Produktem je stematizační algoritmus pro český jazyk založený na gramatických pravidlech jako doplněk k metodám používajícím slovník pro vyhledávání a dolování českého textu. Snowball implementace stematizačního algoritmu českého jazyka je vytvořena na základě kompletní sady všech předpon, přípon a koncovek, které se mohou v českém jazyce vyskytovat.
Dokumentace jazyka Snowball na adrese snowball.tartarus.org a text diplomové práce www.fit.vutbr.cz/study/DP/rpfile.php?id=7988 (v češtině). Publikace vztahující se k tomuto produktu je uvedena na www.fit.vutbr.cz/research/view_pub.php?id=9473.
The product is a stemming algorithm for Czech language based on grammatical rules, in addition to methods of using vocabulary for searching and mining the Czech text. Snowball stemmer implementations of the Czech language is created on the basis of a complete set of all prefixes, suffixes and endings, which may occur in the Czech language.
See the Snowball web at http://snowball.tartarus.org/ and the thesis text at http://www/study/DP/rpfile.php?id=7988 (in Czech). The publication describing the product in Czech at www.fit.vutbr.cz/research/view_pub.php.en?id=9473.
Lemmatizace, stematizace, Snowball, český jazyk, gramatika.
Lemmatization, stemming, Snowball, Czexh language, grammar.
Copyright (C) 2007-2008 Brno University of Technology
By downloading, copying, installing or using the software you agree to GNU General Public License (enclosed).
Security-Oriented Research in Information Technology, MŠMT, Institucionální prostředky SR ČR (např. VZ, VC), MSM0021630528, start: 2007-01-01, end: 2013-12-31, running