Detail práce

Query-by-Example Spoken Term Detection

Disertační práce Student: Fapšo Michal Akademický rok: 2014/2015 Vedoucí: Černocký Jan, prof. Dr. Ing.
Název česky
Vyhledávání výrazů v řeči pomocí mluvených příkladů
Jazyk práce
anglický
Abstrakt

Tato práce se zabývá vyhledáváním výrazů v řeči pomocí mluvených příkladů (QbE STD). Výrazy jsou zadávány v mluvené podobě a jsou vyhledány v množině řečových nahrávek, výstupem vyhledávání je seznam detekcí s jejich skóre a časováním. V práci popisujeme, analyzujeme a srovnáváme tři různé přístupy ke QbE STD v jazykově závislých a jazykově nezávislých podmínkách, s jedním a pěti příklady na dotaz.

Pro naše experimenty jsme použili česká, maďarská, anglická a arabská (levantská) data, a pro každý z těchto jazyků jsme natrénovali 3-stavový fonémový rozpoznávač. To nám dalo 16 možných kombinací jazyka pro vyhodnocení a jazyka na kterém byl natrénovaný rozpoznávač. Čtyři kombinace byly tedy závislé na jazyce (language-dependent) a 12 bylo jazykově nezávislých (language-independent). Všechny QbE systémy byly vyhodnoceny na stejných datech a stejných fonémových posteriorních příznacích, pomocí metrik: nesdružené Figure-of-Merit (non pooled FOM) a námi navrhnuté nesdružené Figure-of-Merit se simulací normalizace přes promluvy (utterrance-normalized non-pooled Figure-of-Merit). Ty nám poskytly relevantní údaje pro porovnání těchto QbE přístupů a pro získání lepšího vhledu do jejich chování.

QbE přístupy použité v této práci jsou: sekvenční statistické modelování (GMM/HMM), srovnávání vzorů v příznacích (DTW) a srovnávání grafů hypotéz (WFST). Abychom porovnali výsledky QbE přístupů s běžnými STD systémy vyhledávajícími textové výrazy, vyhodnotili jsme jazykově závislé konfigurace také s akustickým detektorem klíčových slov (AKWS) a systémem pro vyhledávání fonémových řetězců v grafech hypotéz (WFSTlat). Jádrem této práce je vývoj, analýza a zlepšení systému WFST QbE STD, který po zlepšení dosahuje podobných výsledků jako DTW systém v jazykově závislých podmínkách.

Klíčová slova

vyhledávání podle vzorů, detekce mluvených výrazů, konečné stavové automaty, srovnání systémů, závislost na jazyku, jazyky s malým množstvím dostupných dat

Ústav
Studijní program
Informační technologie, obor Informační technologie
Soubory
Stav
obhájeno
Obhajoba
17. prosince 2014
Citace
FAPŠO, Michal. Query-by-Example Spoken Term Detection. Brno, 2014. Disertační práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2014-12-17. Vedoucí práce Černocký Jan. Dostupné z: https://www.fit.vut.cz/study/phd-thesis/282/
BibTeX
@phdthesis{FITPT282,
  author = "Michal Fap\v{s}o",
  type = "Diserta\v{c}n\'{i} pr\'{a}ce",
  title = "Query-by-Example Spoken Term Detection",
  school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
  year = 2014,
  location = "Brno, CZ",
  language = "english",
  url = "https://www.fit.vut.cz/study/phd-thesis/282/"
}
Nahoru