Detail publikace

Enhancing multilingual recognition of emotion in speech by language identification

SAGHA Hesam, MATĚJKA Pavel, GAVRYUOKOVA Maryna, POVOLNÝ Filip, MARCHI Erik a SCHULLER Björn W. Enhancing multilingual recognition of emotion in speech by language identification. In: 17TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION - Proceedings (INTERSPEECH 2016). San Francisco: International Speech Communication Association, 2016, s. 2949-2953. ISSN 1990-9772. Dostupné z: https://www.isca-speech.org/archive/Interspeech_2016/pdfs/0333.PDF
Název česky
Rozšíření multilingválního rozpoznávání emocí v řeči pomocí rozpoznávání jazyka
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Sagha Hesam (UNIPAS)
Matějka Pavel, Ing., Ph.D. (UPGM FIT VUT)
Gavryuokova Maryna (UNIPAS)
Povolný Filip, Ing. (Phonexia)
Marchi Erik (UNIPAS)
Schuller Björn W. (UNIPAS)
URL
Klíčová slova

multilingvální rozpoznávání emocí, rozpoznávání jazyka, rodiny jazyků

Abstrakt

Článek pojednává o rozšíření multilingválního rozpoznávání emocí v řeči pomocí rozpoznávání jazyka.

Poprvé zkoumáme, zda použití výběru modelu na základě automatické identifikace jazyka (LID) může zlepšit mnohojazyčné rozpoznávání emocí v řeči. Vyhodnocuje se šest emocionálních řečových korpusů ze tří jazykových rodin (germánské, románské, čínsko-tibetské). Emoce jsou reprezentovány kvadranty v rovině vzrušení / valence, tzn. např. pozitivní / negativní vzrušení / valence. Porovnány jsou čtyři výběrové přístupy pro výběr optimální sady školení v závislosti na aktuálním jazyce: v rámci stejné jazykové rodiny, napříč jazykovou rodinou, použití všech dostupných korpusů a výběr založený na automatickém LID. Zjistili jsme, že navrhovaný přístup LID pro výběr tréninkových korpusů je v průměru lepší než použití všech dostupných korpusů, když mluvený jazyk není znám.

Rok
2016
Strany
2949-2953
Časopis
Proceedings of Interspeech - on-line, č. 9, ISSN 1990-9772
Sborník
17TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION - Proceedings (INTERSPEECH 2016)
Konference
Interspeech Conference, San Francisco, US
Vydavatel
International Speech Communication Association
Místo
San Francisco, US
DOI
UT WoS
000409394401295
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB12240,
  author = "Hesam Sagha and Pavel Mat\v{e}jka and Maryna Gavryuokova and Filip Povoln\'{y} and Erik Marchi and W. Bj{\"{o}}rn Schuller",
  title = "Enhancing multilingual recognition of emotion in speech by language identification",
  pages = "2949--2953",
  booktitle = "17TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION - Proceedings (INTERSPEECH 2016)",
  journal = "Proceedings of Interspeech - on-line",
  number = 9,
  year = 2016,
  location = "San Francisco, US",
  publisher = "International Speech Communication Association",
  ISSN = "1990-9772",
  doi = "10.21437/Interspeech.2016-333",
  language = "english",
  url = "https://www.fit.vut.cz/research/publication/12240"
}
Nahoru