Detail publikace

Speaker recognition on mono-channel telephony recordings

SOLEWICZ Yosef, COHEN Noa, ROHDIN Johan A., MADIKERI Srikanth a ČERNOCKÝ Jan. Speaker recognition on mono-channel telephony recordings. In: Proceedings of Odyssey 2022. Beijing: International Speech Communication Association, 2022, s. 193-199. Dostupné z: https://www.isca-speech.org/archive/pdfs/odyssey_2022/solewicz22_odyssey.pdf
Název česky
Rozpoznávání mluvčího v jednokanálových telefonních nahrávkách
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Solewicz Yosef (MoPS)
Cohen Noa (MoPS)
Rohdin Johan A., Dr. (UPGM FIT VUT)
Madikeri Srikanth (IDIAP)
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT)
URL
Klíčová slova

rozpoznávání řečníka, telefonní záznamy

Abstrakt

Konverzace uložené jako mono data jsou běžným problémem mnoho aplikací pro rozpoznávání řečníků v reálném světě. V tomto článku se zaměřujeme na vyšetřovací scénáře, kde je řada pro řečníka, kterého zajímají, jsou k dispozici mono telefonní rozhovory. Například lidský operátor to mohl ověřit řečník je v těchto rozhovorech přítomen. Nabízíme několik přístupy pro automatické vytváření registračních modelů pro mluvčího zájmu z takových údajů. Poté využíváme registraci modely pro vyhledávání vzhledů mluvčího, který vás zajímá v jiných hovorech. Analyzujeme výkon různých metoda na dvou datových sadách, které odpovídají našemu scénáři, jedna je z a simulovaný případ a jeden je ze skutečného případu.

Rok
2022
Strany
193-199
Sborník
Proceedings of Odyssey 2022
Konference
Odyssey 2022: The Speaker and Language Recognition Workshop, Beijing, CN
Vydavatel
International Speech Communication Association
Místo
Beijing, CN
DOI
BibTeX
@INPROCEEDINGS{FITPUB12844,
   author = "Yosef Solewicz and Noa Cohen and A. Johan Rohdin and Srikanth Madikeri and Jan \v{C}ernock\'{y}",
   title = "Speaker recognition on mono-channel telephony recordings",
   pages = "193--199",
   booktitle = "Proceedings of Odyssey 2022",
   year = 2022,
   location = "Beijing, CN",
   publisher = "International Speech Communication Association",
   doi = "10.21437/Odyssey.2022-27",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/12844"
}
Nahoru