Result Details

Český stemmer v jazyce Snowball

Created: 2010
English title
Czech Snowball Stemmer
Type
software
Language
Czech
Authors
Hellebrand David, Ing.
Chmelař Petr, Ing., DIFS (FIT)
Description

Produktem je stematizační algoritmus pro český jazyk založený na gramatických pravidlech jako doplněk k metodám používajícím slovník pro vyhledávání a dolování českého textu. Snowball implementace stematizačního algoritmu českého jazyka je vytvořena na základě kompletní sady všech předpon, přípon a koncovek, které se mohou v českém jazyce vyskytovat.

Dokumentace jazyka Snowball na adrese snowball.tartarus.org a text diplomové práce www.fit.vutbr.cz/study/DP/rpfile.php?id=7988 (v češtině). Publikace vztahující se k tomuto produktu je uvedena na www.fit.vutbr.cz/research/view_pub.php?id=9473.

English description

The product is a stemming algorithm for Czech language based on grammatical rules, in addition to methods of using vocabulary for searching and mining the Czech text. Snowball stemmer implementations of the Czech language is created on the basis of a complete set of all prefixes, suffixes and endings, which may occur in the Czech language.

See the Snowball web at http://snowball.tartarus.org/ and the thesis text at http://www/study/DP/rpfile.php?id=7988 (in Czech). The publication describing the product in Czech at www.fit.vutbr.cz/research/view_pub.php.en?id=9473.

Keywords

Lemmatizace, stematizace, Snowball, český jazyk, gramatika.

English keywords

Lemmatization, stemming, Snowball, Czexh language, grammar.

URL
License
In order to use the result by another entity, it is always necessary to acquire a license
License Fee
The licensor does not require a license fee for the result
License Conditions

Copyright (C) 2007-2008 Brno University of Technology

By downloading, copying, installing or using the software you agree to GNU General Public License (enclosed).

Files
Projects
Recognition and presentation of multimedia data, BUT, Vnitřní projekty VUT, FIT-S-10-2, 2010, start: 2010-04-01, end: 2010-12-31, completed
Security-Oriented Research in Information Technology, MŠMT, Institucionální prostředky SR ČR (např. VZ, VC), MSM0021630528, start: 2007-01-01, end: 2013-12-31, running
Departments
Back to top