Result Details

Český stemmer v jazyce Snowball

Created: 2010
Type
software
Language
Czech
Authors
Hellebrand David, Ing.
Chmelař Petr, Ing., FIT (FIT), DIFS (FIT)
Description

Produktem je stematizační algoritmus pro český jazyk založený na gramatických pravidlech jako doplněk k metodám používajícím slovník pro vyhledávání a dolování českého textu. Snowball implementace stematizačního algoritmu českého jazyka je vytvořena na základě kompletní sady všech předpon, přípon a koncovek, které se mohou v českém jazyce vyskytovat.

Dokumentace jazyka Snowball na adrese snowball.tartarus.org a text diplomové práce www.fit.vutbr.cz/study/DP/rpfile.php?id=7988 (v češtině). Publikace vztahující se k tomuto produktu je uvedena na www.fit.vutbr.cz/research/view_pub.php?id=9473.

Keywords

Lemmatizace, stematizace, Snowball, český jazyk, gramatika.

English keywords

Lemmatization, stemming, Snowball, Czexh language, grammar.

URL
License
In order to use the result by another entity, it is always necessary to acquire a license
License Fee
The licensor does not require a license fee for the result
License Conditions

Copyright (C) 2007-2008 Brno University of Technology

By downloading, copying, installing or using the software you agree to GNU General Public License (enclosed).

Files
Projects
Recognition and presentation of multimedia data, BUT, Vnitřní projekty VUT, FIT-S-10-2, 2010, start: 2010-04-01, end: 2010-12-31, completed
Security-Oriented Research in Information Technology, MŠMT, Institucionální prostředky SR ČR (např. VZ, VC), MSM0021630528, start: 2007-01-01, end: 2013-12-31, running
Departments
Back to top