Rozpoznávač řeči adaptovaný pro generování dialektologické transkripce z audionahrávek

Název anglicky

Speech recognizer adapted for generating dialectological transcription from audio recordings

Typ

software

Jazyk

česky

Autoři

Karafiát Martin, Ing., Ph.D., UPGM (FIT)
Žižka Josef, Ing., UPGM (FIT)
Šimečková Marta
Stupňánek Bronislav

Popis

Systém na základě vstupní zvukové nahrávky automaticky generuje přepis mluveného
projevu do textu včetně zachování nářečních specifik, a to i jevů diferenčních, jimiž
nedisponuje spisovný jazyk. Výstup je formátován podle pravidel dialektologické transkripce,
která byla definována v Metodice pro převod strukturovaných znalostí z oboru dialektologie do strojového učení (Šimečková a kol., 2025, s. 56–62; dostupné online). Systém je optimalizován pro záznamy tradičních dialektů češtiny z území České republiky, přičemž dokáže zachytit regionální varianty češtiny, které standardní rozpoznávače řeči ignorují.

Popis anglicky

Based on the input audio recording, the system automatically generates a transcription of the spoken speech into text, including the preservation of dialect specifics, including differential phenomena that are not available in the standard language. The output is formatted according to the rules of dialectological transcription, which was defined in the Methodology for the Transfer of Structured Knowledge from the Field of Dialectology into Machine Learning (Šimečková et al., 2025, pp. 56–62; available online). The system is optimized for recordings of traditional Czech dialects from the Czech Republic, and can capture regional variants of Czech that standard speech recognizers ignore.

Klíčová slova

akustický přepis mluvené řeči, dialektologie, dialektologická transkripce,

Klíčová slova anglicky

acoustic transcription of spoken language, dialectology, dialectological transcription,

URL

https://prepis.jamap.cz/

Licence

K využití výsledku jiným subjektem je vždy nutné nabytí licence

Licenční poplatek

Poskytovatel licence na výsledek nepožaduje licenční poplatek

Projekty

Jazyková paměť regionů České republiky. Metody strojového učení pro uchování, dokumentaci a prezentaci nářečí českého jazyka, MK, NAKI III – program na podporu aplikovaného výzkumu v oblasti národní a kulturní identity na léta 2023 až 2030, DH23P03OVV010, zahájení: 2023-03-01, ukončení: 2027-12-31, řešení

Pracoviště

Ústav počítačové grafiky a multimédií (UPGM)