Detail produktu
Český stemmer v jazyce Snowball
Vznik: 2010
Chmelař Petr, Ing. (UIFS FIT VUT)
Lemmatizace, stematizace, Snowball, český jazyk, gramatika.
Produktem je stematizační algoritmus pro český jazyk založený na gramatických pravidlech jako doplněk k metodám používajícím slovník pro vyhledávání a dolování českého textu. Snowball implementace stematizačního algoritmu českého jazyka je vytvořena na základě kompletní sady všech předpon, přípon a koncovek, které se mohou v českém jazyce vyskytovat.
Dokumentace jazyka Snowball na adrese snowball.tartarus.org a text diplomové práce www.fit.vutbr.cz/study/DP/rpfile.php?id=7988 (v češtině). Publikace vztahující se k tomuto produktu je uvedena na www.fit.vutbr.cz/research/view_pub.php?id=9473.
Copyright (C) 2010 Vysoké učení technické v Brně
Stažením, kopírováním, instalováním, nebo používáním souhlasíte s GNU General Public License (přiložena).
Výzkum informačních technologií z hlediska bezpečnosti (MSM0021630528)