Fakulta informačních technologií VUT v Brně

Výzkumná skupina dolování dat z řeči BUT Speech@FIT

http://speech.fit.vutbr.cz/

Výzkumná skupina dolování dat z řeči BUT Speech@FIT

Výzkumná skupina BUT Speech@FIT byla založena v roce 1997 a od roku 2002 pracuje na Fakultě informačních technologií VUT v Brně. Poradcem skupiny je Prof. Hynek Heřmanský, hlavními výzkumníky jsou Doc. Jan Černocký a Doc. Lukáš Burget.

Hlavní specializací skupiny je identifikace řečníka a jazyka, rozpoznávání jazyka a detekce klíčových slov. K nejvýznamnějším úspěchům patří nejlepší fonémový rozpoznávač na světě a vynikající výsledky v NIST (americký Národní institut pro standardizaci a technologie) evaluacích v oblasti rozpoznávání jazyka a řečníka. Výzkumníci skupiny jsou pravidelně zváni na prestižní akce, jako např. Johns Hopkins University summer research workshops.

Skupina BUT Speech@FIT se zúčastnila řady významných projektů financovaných z prostředků Evropské komise, sahajících od sběru řečových databází (SpeechDat-E - FP4), přes rozpoznávání meetingů (M4 - FP5, AMI - FP6, AMIDA - FP6) až k mobilní biometrii (MOBIO - FP7) a detekci audiovizuálních událostí (DIRAC - FP6 a CareTaker - FP6). V současnosti pracuje na A-PiMod (FP7) a BISON (Horizon 2020 LEIT). Skupina je také financována na národní úrovni (MŠMT, MPO, MO a MV), průmyslovými partnery a vládou USA (agentury IARPA a DARPA).

BUT Speech@FIT intenzivně spolupracuje s průmyslem v ČR i v zahraničí. Stála u zrodu dvou spin-off firem: Phonexia (založena 2006) dodává software pro řečovou analytiku pro komerční a bezpečnostní oblast a ReplayWell (zal. 2011)  vyvíjí a komercializuje cloudové technologie pro indexování a zobrazování řečiových záznamů.

BUT Speech@FIT je aktivní ve vývoji open-source softwaru (toolkit KALDI) její fonémový rozpoznávač PHNREC získal mezinárodní renomé. Skupina disponuje zařízením pro masivní experimenty v oblasti dolování dat: >1000 CPU jednotkami na systému Linux, datovými servery s celkovou kapacitou >370 TB a řečovými a jazykovými databázemi. Pro akceleraci výpočtů disponuje >25 výkonnými GP-GPU kartami.

Témata výzkumu

  • identifikace řečníka
  • identifikace jazyka
  • rozpoznávání řeči
  • detekce klíčových slov
  • rozpoznávání fonémů
  • tvorba řečových dat

Aktuální zaměření výzkumu

viz webové stránky skupiny http://speech.fit.vutbr.cz/
Nahoru