Detail publikace
Speech Technology for Unwritten Languages
Besacier Laurent (UGA)
Black Alan (CMU)
Hasegawa-Johnson Mark (UILLINOIS)
Metze Florian (CMU)
Neubig Graham (CMU)
Stüker Sebastian (KIT)
Godard Pierre (LIMSI)
Müller Markus (KIT)
Ondel Yang Lucas Antoine Francois, Mgr., Ph.D. (UPGM FIT VUT)
Palaskar Shruti (CMU)
Arthur Philip (CMU)
Ciannella Francesco (CMU)
Du Mingxing (INRIA)
Larsen Elin (INRIA)
Merkx Danny (RUN)
Riad Rachid (INRIA)
Wang Liming (UILLINOIS)
Dupoux Emmanuel (ENS)
Technologie abstraktní řeči hraje důležitou roli v našem každodenním životě. Řeč se mimo jiné používá pro interakci člověka s počítačem, například pro vyhledávání informací a online nakupování. V případě nepsaného jazyka je však bohužel obtížné vytvořit řečovou technologii, protože ji nelze vytvořit standardní kombinací předem trénovaných subsystémů řeč-text a text-řeč. Výzkum představený v tomto článku podniká první kroky směrem k technologii řeči pro nepsané jazyky. Cílem této práce bylo konkrétně 1) naučit se reprezentace řeči ve smyslu bez použití textu jako prostřední reprezentace a 2) otestovat dostatečnost naučených reprezentací k regeneraci řeči nebo přeloženého textu nebo k získání obrázků, které zobrazují význam promluvy v nepsaném jazyce. Výsledky naznačují, že je možné vytvářet systémy, které přecházejí přímo z řeči na význam a ze smyslu na řeč, čímž obejdou potřebu textu.
@ARTICLE{FITPUB12469, author = "Odette Scharenborg and Laurent Besacier and Alan Black and Mark Hasegawa-Johnson and Florian Metze and Graham Neubig and Sebastian St{\"{u}}ker and Pierre Godard and Markus M{\"{u}}ller and Francois Antoine Lucas Yang Ondel and Shruti Palaskar and Philip Arthur and Francesco Ciannella and Mingxing Du and Elin Larsen and Danny Merkx and Rachid Riad and Liming Wang and Emmanuel Dupoux", title = "Speech Technology for Unwritten Languages", pages = "964--975", journal = "IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING", volume = 2020, number = 28, year = 2020, ISSN = "2329-9290", doi = "10.1109/TASLP.2020.2973896", language = "english", url = "https://www.fit.vut.cz/research/publication/12469" }