Detail publikace
End-to-End Open Vocabulary Keyword Search With Multilingual Neural Representations
Konvenční systémy pro vyhledávání klíčových slov pracují na výstupech automatického rozpoznávání řeči (ASR), což způsobuje, že mají složité indexování a vyhledávání. To vedlo k zájmu o přístupy bez ASR za účelem zjednodušení postupu vyhledávání. Nedávno jsme navrhli neurální model vyhledávání klíčových slov bez ASR, který dosahuje konkurenceschopného výkonu při zachování efektivního a zjednodušeného potrubí, kde jsou dotazy a dokumenty kódovány dvojicí opakujících se kodérů neuronové sítě a kódování jsou kombinována s tečkovým produktem. V tomto článku tuto práci rozšiřujeme o vícejazyčné předtrénování a podrobnou analýzu modelu. Naše experimenty ukazují, že navrhované vícejazyčné školení výrazně zlepšuje výkon modelu a že navzdory tomu, že neodpovídá silnému konvenčnímu systému vyhledávání klíčových slov na bázi ASR pro krátké dotazy a dotazy obsahující slova ve slovní zásobě, navrhovaný model překonává systém založený na ASR pro dlouhé dotazy. a dotazy, které se neobjevují v trénovacích datech.
@ARTICLE{FITPUB13057, author = "Bolaji Yusuf and Jan \v{C}ernock\'{y} and Murat Sara\c{c}lar", title = "End-to-End Open Vocabulary Keyword Search With Multilingual Neural Representations", pages = "3070--3080", journal = "IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING", volume = 31, number = 08, year = 2023, ISSN = "2329-9290", doi = "10.1109/TASLP.2023.3301239", language = "english", url = "https://www.fit.vut.cz/research/publication/13057" }