Detail publikace
Analysis of Speaker Diarization based on Bayesian HMM with Eigenvoice Priors
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Landini Federico Nicolás, Ph.D. (VZ SPEECH)
Černocký Jan, prof. Dr. Ing. (UPGM)
Hidden Markov Models, Bayes methods, Task analysis, Probabilistic logic, Training, Speech processing, Complexity theory
Článek analyzuje diarizaci řečníků založenou na bayesovských skrytých Markovových modelech s eigenvoice apriorními rozděleními pravděpodobnosti, nadefinovaný v našich předchozích pracech, který byl nedávno uznán jako nejmodernější model pro diarizaci řečníků. V tomto článku představujeme úplnější analýzu systému Diarization. Inference modelu je plně popsána a pro úplné pochopení algoritmu jsou poskytnuty derivace všech aktualizačních vzorců. Je poskytnuta rozsáhlá analýza vlivu, citlivosti a interakcí všech parametrů modelu, která může být použita jako vodítko pro jejich optimální nastavení. Nově zavedený koeficient regularizace mluvčích nám umožňuje řídit počet mluvčích odvozených v promluvě. Prezentována je také naivní strategie sloučení modelu řečníka, která umožňuje vyhnat variační inference z lokálních optim. Experimenty pro různé scénáře diarizace jsou uvedeny na souborech dat CALLHOME a DIHARD.
@article{BUT161472,
author="Mireia {Diez Sánchez} and Lukáš {Burget} and Federico Nicolás {Landini} and Jan {Černocký}",
title="Analysis of Speaker Diarization based on Bayesian HMM with Eigenvoice Priors",
journal="IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING",
year="2020",
volume="28",
number="1",
pages="355--368",
doi="10.1109/TASLP.2019.2955293",
issn="2329-9290",
url="https://ieeexplore.ieee.org/document/8910412"
}