Detail výsledku

Automatic Language Identification using Phoneme and Automatically Derived Unit Strings

MATĚJKA, P., SZŐKE, I., SCHWARZ, P., ČERNOCKÝ, J. Automatic Language Identification using Phoneme and Automatically Derived Unit Strings. Lecture Notes in Computer Science, 2004, vol. 2004, no. 3206, 8 p. ISSN: 0302-9743.
Typ
článek v časopise
Jazyk
anglicky
Autoři
Matějka Pavel, Ing., Ph.D., UPGM (FIT)
Szőke Igor, Ing., Ph.D., UPGM (FIT)
Schwarz Petr, Ing., Ph.D., UPGM (FIT)
Černocký Jan, prof. Dr. Ing., UPGM (FIT)
Abstrakt

Language identification (LID) based on phono-tactic modeling is presented in this paper. Approaches using phoneme strings and strings of units automatically derived by an Ergodic HMM (EHMM) are compared. The phoneme recognizers were trained on 6 languages from OGI multi-language-corpus and Czech SpeechDat-E. The LID results are obtained on 4 languages. The results show superiority of Czech phoneme recognizer while used in LID and promising trends using the EHMM-derived units.

Klíčová slova

language identificaton, phoneme recognizer, speech processing, ergodic hidden Markov model

URL
Rok
2004
Strany
8
Časopis
Lecture Notes in Computer Science, roč. 2004, č. 3206, ISSN 0302-9743
Vydání
1
Vydavatel
Springer
BibTeX
@article{BUT45377,
  author="Pavel {Matějka} and Igor {Szőke} and Petr {Schwarz} and Jan {Černocký}",
  title="Automatic Language Identification using Phoneme and Automatically Derived Unit Strings",
  journal="Lecture Notes in Computer Science",
  year="2004",
  volume="2004",
  number="3206",
  pages="8",
  issn="0302-9743",
  url="http://www.springerlink.com/index/CUFLYEGQA8W1LNBE"
}
Projekty
Daty řízené a antropické kódování a rozpoznávání řeči, GAČR, Postdoktorandské granty, GP102/02/D108, zahájení: 2002-09-01, ukončení: 2005-08-30, ukončen
Hlasové technologie v podpoře informační společnosti, GAČR, Standardní projekty, GA102/02/0124, zahájení: 2002-01-01, ukončení: 2004-12-31, ukončen
Pracoviště
Nahoru