Detail publikace

Speech Technology for Unwritten Languages

SCHARENBORG Odette, BESACIER Laurent, BLACK Alan, HASEGAWA-JOHNSON Mark, METZE Florian, NEUBIG Graham, STÜKER Sebastian, GODARD Pierre, MÜLLER Markus, ONDEL Yang Lucas Antoine Francois, PALASKAR Shruti, ARTHUR Philip, CIANNELLA Francesco, DU Mingxing, LARSEN Elin, MERKX Danny, RIAD Rachid, WANG Liming a DUPOUX Emmanuel. Speech Technology for Unwritten Languages. IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING, roč. 2020, č. 28, s. 964-975. ISSN 2329-9290. Dostupné z: https://ieeexplore.ieee.org/document/8998182
Název česky
Řečové technologie pro jazyky bez psané formy
Typ
článek v časopise
Jazyk
angličtina
Autoři
Scharenborg Odette (RUN)
Besacier Laurent (UGA)
Black Alan (CMU)
Hasegawa-Johnson Mark (UILLINOIS)
Metze Florian (CMU)
Neubig Graham (CMU)
Stüker Sebastian (KIT)
Godard Pierre (LIMSI)
Müller Markus (KIT)
Ondel Yang Lucas Antoine Francois, Mgr., Ph.D. (UPGM FIT VUT)
Palaskar Shruti (CMU)
Arthur Philip (CMU)
Ciannella Francesco (CMU)
Du Mingxing (INRIA)
Larsen Elin (INRIA)
Merkx Danny (RUN)
Riad Rachid (INRIA)
Wang Liming (UILLINOIS)
Dupoux Emmanuel (ENS)
URL
Abstrakt

Technologie abstraktní řeči hraje důležitou roli v našem každodenním životě. Řeč se mimo jiné používá pro interakci člověka s počítačem, například pro vyhledávání informací a online nakupování. V případě nepsaného jazyka je však bohužel obtížné vytvořit řečovou technologii, protože ji nelze vytvořit standardní kombinací předem trénovaných subsystémů řeč-text a text-řeč. Výzkum představený v tomto článku podniká první kroky směrem k technologii řeči pro nepsané jazyky. Cílem této práce bylo konkrétně 1) naučit se reprezentace řeči ve smyslu bez použití textu jako prostřední reprezentace a 2) otestovat dostatečnost naučených reprezentací k regeneraci řeči nebo přeloženého textu nebo k získání obrázků, které zobrazují význam promluvy v nepsaném jazyce. Výsledky naznačují, že je možné vytvářet systémy, které přecházejí přímo z řeči na význam a ze smyslu na řeč, čímž obejdou potřebu textu.

Rok
2020
Strany
964-975
Časopis
IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING, roč. 2020, č. 28, ISSN 2329-9290
Vydavatel
IEEE Signal Processing Society
DOI
UT WoS
000522357500002
EID Scopus
BibTeX
@ARTICLE{FITPUB12469,
  author = "Odette Scharenborg and Laurent Besacier and Alan Black and Mark Hasegawa-Johnson and Florian Metze and Graham Neubig and Sebastian St{\"{u}}ker and Pierre Godard and Markus M{\"{u}}ller and Francois Antoine Lucas Yang Ondel and Shruti Palaskar and Philip Arthur and Francesco Ciannella and Mingxing Du and Elin Larsen and Danny Merkx and Rachid Riad and Liming Wang and Emmanuel Dupoux",
  title = "Speech Technology for Unwritten Languages",
  pages = "964--975",
  journal = "IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING",
  volume = 2020,
  number = 28,
  year = 2020,
  ISSN = "2329-9290",
  doi = "10.1109/TASLP.2020.2973896",
  language = "english",
  url = "https://www.fit.vut.cz/research/publication/12469"
}
Nahoru