Detail produktu

Český stemmer v jazyce Snowball

Vznik: 2010

Název anglicky
Czech Snowball Stemmer
Typ
software
Licence
vyžadována - zdarma
Autoři
Hellebrand David, Ing. (FIT VUT)
Chmelař Petr, Ing. (UIFS FIT VUT)
Klíčová slova

Lemmatizace, stematizace, Snowball, český jazyk, gramatika.

Popis

Produktem je stematizační algoritmus pro český jazyk založený na gramatických pravidlech jako doplněk k metodám používajícím slovník pro vyhledávání a dolování českého textu. Snowball implementace stematizačního algoritmu českého jazyka je vytvořena na základě kompletní sady všech předpon, přípon a koncovek, které se mohou v českém jazyce vyskytovat.

Dokumentace jazyka Snowball na adrese snowball.tartarus.org a text diplomové práce www.fit.vutbr.cz/study/DP/rpfile.php?id=7988 (v češtině). Publikace vztahující se k tomuto produktu je uvedena na www.fit.vutbr.cz/research/view_pub.php?id=9473.

Umístění
Licence

Copyright (C) 2010 Vysoké učení technické v Brně

Stažením, kopírováním, instalováním, nebo používáním souhlasíte s GNU General Public License (přiložena).

Soubory
Projekty
Výzkumné skupiny
Pracoviště
Nahoru