Detail práce

Detection of Pre-Recorded Messages in Speech

Bakalářská práce Student: Boboš Dominik Akademický rok: 2020/2021 Vedoucí: Černocký Jan, prof. Dr. Ing.
Název česky
Detekce přednahraných úseků v řeči
Jazyk práce
anglický
Abstrakt

Rozpoznání před-nahraných zpráv v řeči (tzv. plechové huby) je užitečné pro jakékoliv následující dolování informací v řečových datech. Tato práce shrnuje teorii hledání podobných promluv v řeči a efektivní přístupy k porovnání dvou sekvencí. Ke zkoumání identifikace opakujících se informací v audiu je nutné mít velké množství dat s přesně se opakujícími úseky. Takovou datovou sadu jsme vygenerovali smícháním předem nahraných zpráv s telefonními hovory se změnami rychlosti, hlasitosti a opakování. Náš systém řeší scénáře "známých zpráv a "neznámých zpráv pomocí shlukování nebo detekce v blocích. Porovnali jsme techniky dynamického borcení času (DTW), přibližné shody řetězců a rekurentní kvantifikační analýzy, a nakonec jsme všechny uvedené techniky zkombinovali a získali tak přesný a efektivně pracující systém.

Klíčová slova

detekce opakujících se sekvencí v nahrávkách, segmentální dynamické borcení času, analýza rekurentní kvantifikace, přibližná shoda řetězců, bottleneck příznaky, fonémové pravděpodobnosti, příznaky Mel-frekvenčních kepstrálních koeficientů

Ústav
Studijní program
Informační technologie
Soubory
Stav
obhájeno, hodnocení A
Obhajoba
16. června 2021
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.

Otázky u obhajoby
  1. There is diarization mentioned in the conclusion as the possible way of solving this issue. Can you name positive and negative aspects of this approach?
  2. You run the experiments on the simulated data. Can you guess the performance on the real data. Did you try to run it on few real recordings?
  3. Jak probíhá detekce u neznámých nahrávek?
Komise
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT), předseda
Češka Milan, doc. RNDr., Ph.D. (UITS FIT VUT), člen
Jaroš Jiří, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Orság Filip, Ing., Ph.D. (UITS FIT VUT), člen
Rychlý Marek, RNDr., Ph.D. (UIFS FIT VUT), člen
Citace
BOBOŠ, Dominik. Detection of Pre-Recorded Messages in Speech. Brno, 2021. Bakalářská práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2021-06-16. Vedoucí práce Černocký Jan. Dostupné z: https://www.fit.vut.cz/study/thesis/22504/
BibTeX
@bachelorsthesis{FITBT22504,
    author = "Dominik Bobo\v{s}",
    type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce",
    title = "Detection of Pre-Recorded Messages in Speech",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2021,
    location = "Brno, CZ",
    language = "english",
    url = "https://www.fit.vut.cz/study/thesis/22504/"
}
Nahoru