Fakulta informačních technologií VUT v Brně

Detail produktu

Český stemmer v jazyce Snowball

Vznik: 2010

Název anglicky
Czech Snowball Stemmer
Typ
software
Licence
vyžadována - zdarma
Autoři
Hellebrand David, Ing. (FIT VUT)
Chmelař Petr, Ing. (UIFS FIT VUT)
Klíčová slova
Lemmatizace, stematizace, Snowball, český jazyk, gramatika.
Popis
Produktem je stematizační algoritmus pro český jazyk založený na gramatických pravidlech jako doplněk k metodám používajícím slovník pro vyhledávání a dolování českého textu. Snowball implementace stematizačního algoritmu českého jazyka je vytvořena na základě kompletní sady všech předpon, přípon a koncovek, které se mohou v českém jazyce vyskytovat.

Dokumentace jazyka Snowball na adrese snowball.tartarus.org a text diplomové práce www.fit.vutbr.cz/study/DP/rpfile.php?id=7988 (v češtině). Publikace vztahující se k tomuto produktu je uvedena na www.fit.vutbr.cz/research/view_pub.php?id=9473.
Umístění
Licence
Copyright (C) 2010 Vysoké učení technické v Brně

Stažením, kopírováním, instalováním, nebo používáním souhlasíte s GNU General Public License (přiložena).
Soubory
Nahoru