Detail výsledku

Analysis of the BUT Diarization System for Voxconverse Challenge

LANDINI, F.; GLEMBEK, O.; MATĚJKA, P.; ROHDIN, J.; BURGET, L.; DIEZ SÁNCHEZ, M.; SILNOVA, A. Analysis of the BUT Diarization System for Voxconverse Challenge. In ICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). Toronto, Ontario: IEEE Signal Processing Society, 2021. p. 5819-5823. ISBN: 978-1-7281-7605-5.
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Landini Federico Nicolás, Ph.D., UPGM (FIT)
Glembek Ondřej, Ing., Ph.D., UPGM (FIT)
Matějka Pavel, Ing., Ph.D., UPGM (FIT)
Rohdin Johan Andréas, M.Sc., Ph.D., FIT (FIT), UPGM (FIT)
Burget Lukáš, doc. Ing., Ph.D., UPGM (FIT)
Diez Sánchez Mireia, M.Sc., Ph.D., UPGM (FIT)
Silnova Anna, M.Sc., Ph.D., UPGM (FIT)
Abstrakt

This paper describes the system developed by the BUT team for thefourth track of the VoxCeleb Speaker Recognition Challenge, focusingon diarization on the VoxConverse dataset. The system consistsof signal pre-processing, voice activity detection, speaker embeddingextraction, an initial agglomerative hierarchical clusteringfollowed by diarization using a Bayesian hidden Markov model, areclustering step based on per-speaker global embeddings and overlappedspeech detection and handling. We provide comparisons foreach of the steps and share the implementation of the most relevantmodules of our system. Our system scored second in the challengein terms of the primary metric (diarization error rate) and first accordingto the secondary metric (Jaccard error rate).

Klíčová slova

Speaker Diarization, Variational Bayes, HMM,VoxConverse, VoxSRC Challenge

URL
Rok
2021
Strany
5819–5823
Sborník
ICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)
Konference
2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)
ISBN
978-1-7281-7605-5
Vydavatel
IEEE Signal Processing Society
Místo
Toronto, Ontario
DOI
UT WoS
000704288406018
EID Scopus
BibTeX
@inproceedings{BUT175790,
  author="Federico Nicolás {Landini} and Ondřej {Glembek} and Pavel {Matějka} and Johan Andréas {Rohdin} and Lukáš {Burget} and Mireia {Diez Sánchez} and Anna {Silnova}",
  title="Analysis of the BUT Diarization System for Voxconverse Challenge",
  booktitle="ICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)",
  year="2021",
  pages="5819--5823",
  publisher="IEEE Signal Processing Society",
  address="Toronto, Ontario",
  doi="10.1109/ICASSP39728.2021.9414315",
  isbn="978-1-7281-7605-5",
  url="https://ieeexplore.ieee.org/document/9414315"
}
Soubory
Financováno

Podpořeno z projektu Ministerstva vnitra České republiky Robustní zpracování nahrávek pro operativu a bezpečnost (ROZKAZ), č. VJ01010108 [img]

Projekty
Multi-lingualita v řečových technologiích, MŠMT, INTER-EXCELLENCE - Podprogram INTER-ACTION, LTAIN19087, zahájení: 2020-01-01, ukončení: 2023-08-31, ukončen
Neuronové reprezentace v multimodálním a mnohojazyčném modelování, GAČR, Grantové projekty exelence v základním výzkumu EXPRO - 2019, GX19-26934X, zahájení: 2019-01-01, ukončení: 2023-12-31, ukončen
Robustní zpracování nahrávek pro operativu a bezpečnost, MV, PROGRAM STRATEGICKÁ PODPORA ROZVOJE BEZPEČNOSTNÍHO VÝZKUMU ČR 2019-2025 (IMPAKT 1) PODPROGRAMU 1 SPOLEČNÉ VÝZKUMNÉ PROJEKTY (BV IMP1/1VS), VJ01010108, zahájení: 2020-10-01, ukončení: 2025-09-30, ukončen
Síťová, textová analýza a analýza řeči v reálném čase pro boj s organizovaným zločinem, EU, Horizon 2020, zahájení: 2019-09-01, ukončení: 2022-12-31, ukončen
Zapojení umělé inteligence do příjmu tísňového volání, MV, Program bezpečnostního výzkumu ČR v letech 2015-2022 (BV III/1-VS), VI20192022169, zahájení: 2019-07-04, ukončení: 2022-05-31, ukončen
Výzkumné skupiny
Pracoviště
Nahoru