Result Details

Rozpoznávač řeči adaptovaný pro generování dialektologické transkripce z audionahrávek

Created: 2025
English title
Speech recognizer adapted for generating dialectological transcription from audio recordings
Type
software
Language
Czech
Authors
Karafiát Martin, Ing., Ph.D., DCGM (FIT)
Žižka Josef, Ing., DCGM (FIT)
Šimečková Marta
Stupňánek Bronislav
Description

Systém na základě vstupní zvukové nahrávky automaticky generuje přepis mluveného
projevu do textu včetně zachování nářečních specifik, a to i jevů diferenčních, jimiž
nedisponuje spisovný jazyk. Výstup je formátován podle pravidel dialektologické transkripce,
která byla definována v Metodice pro převod strukturovaných znalostí z oboru dialektologie do strojového učení (Šimečková a kol., 2025, s. 56–62; dostupné online). Systém je optimalizován pro záznamy tradičních dialektů češtiny z území České republiky, přičemž dokáže zachytit regionální varianty češtiny, které standardní rozpoznávače řeči ignorují.

English description

Based on the input audio recording, the system automatically generates a transcription of the spoken speech into text, including the preservation of dialect specifics, including differential phenomena that are not available in the standard language. The output is formatted according to the rules of dialectological transcription, which was defined in the Methodology for the Transfer of Structured Knowledge from the Field of Dialectology into Machine Learning (Šimečková et al., 2025, pp. 56–62; available online). The system is optimized for recordings of traditional Czech dialects from the Czech Republic, and can capture regional variants of Czech that standard speech recognizers ignore.

Keywords

akustický přepis mluvené řeči, dialektologie, dialektologická transkripce,

English keywords

acoustic transcription of spoken language, dialectology, dialectological transcription,

URL
License
In order to use the result by another entity, it is always necessary to acquire a license
License Fee
The licensor does not require a license fee for the result
Projects
Language memory of the regions of the Czech Republic. Machine learning methods for preservation, documentation and presentation of the dialects of the Czech language, MK, NAKI III – program na podporu aplikovaného výzkumu v oblasti národní a kulturní identity na léta 2023 až 2030, DH23P03OVV010, start: 2023-03-01, end: 2027-12-31, running
Departments
Back to top