Result Details

SW3 ASR pro akusticky náročná prostředí

Created: 2023
English title
SW3 ASR for demanding acoustic conditions
Type
software
Language
Czech
Authors
Šmíd Luboš, Ing., Ph.D.
Karafiát Martin, Ing., Ph.D., DCGM (FIT)
Švec Jan, Ing., Ph.D.
Lehečka Jan
Mošner Ladislav, Ing., DCGM (FIT)
Brukner Jan, Ing., DCGM (FIT)
Description

Systém pro rozpoznávání řeči (ASR) asijského jazyka založený na moderních přístupech pro trénování. WAV2VEC model byl natrénován na obecných nahrávkách a dotrénován na vietnamských nahrávkách, které byly dále rozšířeny o množení (augmentace) dat pro náročné akustické podmínky. Tímto bylo dosaženo žádané robustnosti. Součástí výsledku je model na odstranění šumu z nahrávky. Výsledkem je aplikace využívající "Docker" kontejner a spustitelná z příkazové řádky (command line) na standardní distribuci Linuxu nebo Windows.

English description

An Asian language speech recognition (ASR) system based on modern training approaches. The WAV2VEC model was trained on general recordings and retrained on Vietnamese recordings, further extended by data augmentation for demanding acoustic conditions. This achieved the desired robustness. Part of the result is a model for removing noise from the recording (deNoiser). The result is an application that uses a "Docker" container and can be run from the command line on a standard Linux or Windows distribution.

Keywords

ASR; rozpoznávání řeči; docker

English keywords

ASR; speech recognition; docker

Location
License
The result is being used by the owner
License Fee
The licensor does not require a license fee for the result
Projects
Robust processing of recordings for operations and security, MV, PROGRAM STRATEGICKÁ PODPORA ROZVOJE BEZPEČNOSTNÍHO VÝZKUMU ČR 2019-2025 (IMPAKT 1) PODPROGRAMU 1 SPOLEČNÉ VÝZKUMNÉ PROJEKTY (BV IMP1/1VS), VJ01010108, start: 2020-10-01, end: 2025-09-30, completed
Research groups
Departments
Back to top