Detail výsledku

Automatic Language Identification System

ČERNOCKÝ, J.; MATĚJKA, P.; BURGET, L.; SCHWARZ, P. Automatic Language Identification System. Sborník příspěvků z odborného semináře "Nové technologie v radiokomunikacích". Brno: University of Defence in Brno, 2006. p. 1-6.

Typ

článek ve sborníku konference

Jazyk

anglicky

Autoři

Černocký Jan, prof. Dr. Ing., UPGM (FIT)
Matějka Pavel, Ing., Ph.D., UPGM (FIT)
Burget Lukáš, doc. Ing., Ph.D., UPGM (FIT)
Schwarz Petr, Ing., Ph.D., UPGM (FIT)

Abstrakt

This paper presents the language identification (LID) systemdeveloped in Speech@FIT. The system consists of twoparts: Acoustic LID determines the language directly on thebasis of features derived from the speech signal. We haveimproved existing approaches by adding discriminative trainingof acoustic models. In phonotactic LID, speech is firsttranscribed by phoneme recognizer into strings or graphs (lattices)of phonemes. On these, language models are trainedto capture statistics of sequences of phonemes. We have pioneeredthe use of so called îanti-modelsî for this task. All experimentalresults are reported on standard NIST 2003 data;comparison with other published results is favorable to oursystem.

Klíčová slova

speech processing, automatic language identification

URL

https://www.fit.vut.cz/person/cernocky/public/publi/2006/acr2006.pdf

Rok

2006

Strany

1–6

Sborník

Sborník příspěvků z odborného semináře "Nové technologie v radiokomunikacích"

Konference

Odborný seminář "Nové technologie v radiokomunikacích"

Vydavatel

University of Defence in Brno

Místo

Brno

BibTeX

@inproceedings{BUT22285,
  author="Jan {Černocký} and Pavel {Matějka} and Lukáš {Burget} and Petr {Schwarz}",
  title="Automatic Language Identification System",
  booktitle="Sborník příspěvků z odborného semináře {"}Nové technologie v radiokomunikacích{"}",
  year="2006",
  pages="1--6",
  publisher="University of Defence in Brno",
  address="Brno",
  url="http://www.fit.vutbr.cz/~cernocky/publi/2006/acr2006.pdf"
}

Projekty

Nové směry ve výzkumu a využití hlasových technologií, GAČR, Standardní projekty, GA102/05/0278, zahájení: 2005-01-01, ukončení: 2007-12-31, ukončen
Posílená skupinová interakce, EU, Sixth Framework programme, 506811-AMI, zahájení: 2004-01-01, ukončení: 2006-12-31, ukončen

Výzkumné skupiny

Výzkumná skupina dolování dat z řeči BUT Speech@FIT (VZ SPEECH)

Pracoviště

Ústav počítačové grafiky a multimédií (UPGM)
Ústav radioelektroniky (UREL)