Detail publikace

Toroidal Probabilistic Spherical Discriminant Analysis

SILNOVA Anna, BRUMMER Johan Nikolaas Langenhoven, SWART Albert du Preez a BURGET Lukáš. Toroidal Probabilistic Spherical Discriminant Analysis. In: Proceedings of ICASSP 2023. Rhodes Island: IEEE Signal Processing Society, 2023, s. 1-5. ISBN 978-1-7281-6327-7. Dostupné z: https://ieeexplore.ieee.org/document/10095580
Název česky
Toroidální pravděpodobnostní sférická diskriminační analýza
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Silnova Anna, MSc., Ph.D. (UPGM FIT VUT)
Brummer Johan Nikolaas Langenhoven, Dr. (AmazonCom)
Swart Albert du Preez (Speechly)
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT)
URL
Abstrakt

V rozpoznávání mluvčího, kde jsou namapovány segmenty řeči vložení na jednotkovou hypersféru, dva bodovací back-endy běžně používané, jmenovitě cosinus scoring a PLDA. My máme nedávno navržené PSDA, analog k PLDA, který používá Von Mises-Fisher distribuce místo Gaussianů. V tomto papíru představujeme toroidní PSDA (T-PSDA). Rozšiřuje PSDA o schopnost modelovat variabilitu uvnitř a mezi mluvčími v toroidních subvarietách hypersféry. Jako PLDA a PSDA, model umožňuje skórování v uzavřené formě a uzavřené formě EM aktualizace pro trénink. Na VoxCeleb najdeme T-PSDA accu- energický na stejné úrovni jako kosinové bodování, zatímco přesnost PLDA je nedostatečná rior. Na NIST SRE'21 jsme zjistili, že T-PSDA poskytuje velké přírůstky rasy ve srovnání s kosinovým hodnocením a PLDA.

Rok
2023
Strany
1-5
Sborník
Proceedings of ICASSP 2023
Konference
2023 IEEE International Conference on Acoustics, Speech and Signal Processing IEEE, Rhodes Island, Greece, GR
ISBN
978-1-7281-6327-7
Vydavatel
IEEE Signal Processing Society
Místo
Rhodes Island, GR
DOI
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB13052,
   author = "Anna Silnova and Langenhoven Nikolaas Johan Brummer and Preez du Albert Swart and Luk\'{a}\v{s} Burget",
   title = "Toroidal Probabilistic Spherical Discriminant Analysis",
   pages = "1--5",
   booktitle = "Proceedings of ICASSP 2023",
   year = 2023,
   location = "Rhodes Island, GR",
   publisher = "IEEE Signal Processing Society",
   ISBN = "978-1-7281-6327-7",
   doi = "10.1109/ICASSP49357.2023.10095580",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/13052"
}
Nahoru