Detail publikace

End-to-End Open Vocabulary Keyword Search With Multilingual Neural Representations

YUSUF Bolaji, ČERNOCKÝ Jan a SARAÇLAR Murat. End-to-End Open Vocabulary Keyword Search With Multilingual Neural Representations. IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING, roč. 31, č. 08, 2023, s. 3070-3080. ISSN 2329-9290. Dostupné z: https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=10201906
Název česky
Celostní vyhledávání klíčových slov s otevřeným slovníkem a vícejazyčnými neurálními reprezentacemi
Typ
článek v časopise
Jazyk
angličtina
Autoři
Yusuf Bolaji (UPGM FIT VUT)
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT)
Saraçlar Murat (UBOGAZ)
URL
Abstrakt

Konvenční systémy pro vyhledávání klíčových slov pracují na výstupech automatického rozpoznávání řeči (ASR), což způsobuje, že mají složité indexování a vyhledávání. To vedlo k zájmu o přístupy bez ASR za účelem zjednodušení postupu vyhledávání. Nedávno jsme navrhli neurální model vyhledávání klíčových slov bez ASR, který dosahuje konkurenceschopného výkonu při zachování efektivního a zjednodušeného potrubí, kde jsou dotazy a dokumenty kódovány dvojicí opakujících se kodérů neuronové sítě a kódování jsou kombinována s tečkovým produktem. V tomto článku tuto práci rozšiřujeme o vícejazyčné předtrénování a podrobnou analýzu modelu. Naše experimenty ukazují, že navrhované vícejazyčné školení výrazně zlepšuje výkon modelu a že navzdory tomu, že neodpovídá silnému konvenčnímu systému vyhledávání klíčových slov na bázi ASR pro krátké dotazy a dotazy obsahující slova ve slovní zásobě, navrhovaný model překonává systém založený na ASR pro dlouhé dotazy. a dotazy, které se neobjevují v trénovacích datech.

Rok
2023
Strany
3070-3080
Časopis
IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING, roč. 31, č. 8, ISSN 2329-9290
Vydavatel
IEEE Signal Processing Society
DOI
UT WoS
001047323400008
EID Scopus
BibTeX
@ARTICLE{FITPUB13057,
   author = "Bolaji Yusuf and Jan \v{C}ernock\'{y} and Murat Sara\c{c}lar",
   title = "End-to-End Open Vocabulary Keyword Search With Multilingual Neural Representations",
   pages = "3070--3080",
   journal = "IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING",
   volume = 31,
   number = 08,
   year = 2023,
   ISSN = "2329-9290",
   doi = "10.1109/TASLP.2023.3301239",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/13057"
}
Nahoru