Monitoring

Dne: 26. března 2020

Pohovor vede počítač

Computerworld | 26. 3. 2020 | Rubrika: Téma/technologie | Strana 6 | Autor: MICHAL ČERNÝ

Jsme svědky na první pohled neškodně působícího rozhovoru. Počítač specializovaný na rozbor hlasu od společnosti Precire z německých Cách má zjistit, jaké vlastnosti má člověk sedící před ním v experimentální místnosti.
Pokládá otázky typu "jak jste strávili poslední dovolenou?" nebo "jak probíhá váš typický víkend?". Testovaná osoba se namáhá, aby každou otázku důkladně zodpověděla, protože ví, že systém potřebuje 15 minut hlasového materiálu, aby budoucího šéfa informoval, jaký je dotyčný charakterový typ.
Předtím, než zaměstnavatel přijme nové kolegy, potřebuje co možná nejpřesněji vědět, jací vlastně jsou. Je zájemce o práci spíše tvrdohlavý, nebo přístupný změnám? Pracuje efektivně? Snese kritiku? Je týmový hráč, nebo individualista? Pro zjištění těchto charakterových vlastností je klasický přijímací pohovor příliš krátký a povrchní, a často se zvrhne v pouhou exhibici uchazeče.
Precire se chce podívat hlouběji pod povrch a odhalit lidské vlastnosti přímo na základě analýzy hlasu.
Poté, co systém pomocí strojového učení srovná data se záznamy od pěti tisíc pokusných osob, vyplivne závěr: dotyčný má vysokou potřebu samostatnosti, je extrémně zvědavý, klade méně důrazu na status a dominanci a rád vyhledává riziko.
Nadchází doba, kdy počítač při přijímacím pohovoru z našeho hlasu odhalí charakterové vlastnosti a podle toho nemilosrdně rozhodne, jestli se na danou pozici hodíme, nebo ne? Měli bychom se mít na pozoru, zaslechneme -li v hlasu prodejce po telefonu známou větu: "Pro zkvalitnění našich služeb je tento rozhovor nahráván," protože prodejci z hlasu lépe poznají naše slabiny a podle toho s námi budou snadněji manipulovat? Dokážou počítače z řečových dat odhalit i nemoci, jako jsou deprese či Parkinsonova choroba? Čeští odborníci na analýzu hlasu to zatím nevidí tak jednoznačně a opatrně mluví o problematice oboru a překážkách, které před autory takových nástrojů stojí.

Lhářky lžou jinak než lháři
Software od společnosti Precire bere při přijímacím pohovoru v úvahu tón hlasu, způsob tvoření hlásek či zda dotyčný mluví nahlas, nebo potichu. Umělá inteligence pak rozhodne, který z tisíců faktorů ukazuje na jaké povahové vlastnosti.
Několik minut rozhovoru stačí k tomu, aby byly testované osoby rozděleny do tzv. big -five kategorií - tedy pěti hlavních dimenzí osobnosti. O nástroj s umělou inteligencí umožňující výběr zaměstnanců již projevily zájem některé velké firmy, například německý koncern RWE.
Počátky úspěšných pokusů o rozpoznání emocí z řeči sahají do doby před téměř dvaceti lety. Po útoku na Světové obchodní centrum 11.
září 2001 se americké ministerstvo pro vnitřní bezpečnost obrátilo na informatičku Julii Hirschbergovou, která se zabývala analýzou hlasu již od roku 1985. Pracovníci ministerstva po ní chtěli systém, který by z řeči rozpoznal, kdy dotyčný lže a kdy mluví pravdu. Všechny dosavadní systémy pro rozbor hlasu zatím jako detektory lži nefungovaly, nebyly úspěšnější než pouhá náhoda. Nedosahovaly lepších výsledků než samotní lidé, ani ti většinou lež z hlasu nedokážou spolehlivě odhalit.
Julia Hirschbergová měla k dispozici 120 hodin řeči v angličtině od 340 pokusných osob. Výzkumníci požádali polovinu z nich, aby lhali, zatímco druhá polovina měla říkat pravdu. Systém již tehdy rozpoznal lháře lépe než lidští protivníci podle znaků, jako je výška tónu nebo melodie. Podle Hirschbergové jsou samotní lidé neúspěšní v rozpoznání lži z toho důvodu, že při lhaní neexistují jednoznačné znaky. Některé osoby při lhaní hlas zvyšují, jiní v tónu klesají. Pokud lžou muži, častěji mluví hlasitěji, zatímco ženy nikoli bezpodmínečně.
Jednou z tendencí je vyšší tón hlasu při lhaní, zatímco hlas žen při lhaní méně kolísá. A právě umělá inteligence dokáže v tomto obrovském množství kombinací najít vzorec.
Podle experta na analýzu hlasových dat Jana Černockého z brněnského VUT však celá věc není tak jednoznačná.
"Samotní výzkumníci říkají, že jim tyto systémy v laboratoři sice fungují, ale v současnosti nedosahují takové přesnosti," tvrdí Černocký. Největší obtíže se projevují při pořizování a označování dat. Výzkumníci poprosí jednu skupinu osob, aby lhala, kdežto druhá polovina má mluvit pravdu. To není přirozená situace, protože v reálném životě většinou nikdo nelže na příkaz.
Data se mohou pořizovat tím způsobem, že příslušné emoce zahrají profesionální herci. Ti jsou sice schopní je zahrát perfektně, ale zahrané emoce jsou v tomto případě daleko silnější než v běžném životě, zatímco při rozhovorech v call centrech s běžnými lidmi jsou méně výrazné a hůře identifikovatelné.
"U těchto systémů je také podstatná takzvaná závislost na doméně," dodává Jan Černocký.
"Znamená to, že nástroj funguje jenom na určitých datech a za určitých podmínek, ale pokud ho přeneseme jinam, přestane správně pracovat. Strojové učení bylo trénováno třeba na skupině středoškoláků mluvících spisovnou angličtinou, ale chceme -li systém přenést do jiného prostředí, třeba do němčiny, nebo ho zkoušet na jiné skupině osob, projeví se jeho slabiny. Právě neschopnost fungovat správně za obecných podmínek je hlavním nedostatkem současné umělé inteligence."
Z toho důvodu odborníci nepředpokládají, že by nástroje vybavené umělou inteligencí měly při rozhodování o přijetí či nepřijetí kandidátů hlavní slovo.
"Kdybych byl třeba pilot dopravního letadla a systém by mě z psychologického hlediska vyhodnotil jako nevhodného kandidáta do zaměstnání u aerolinek, určitě bych ho napadl a bránil se, že je špatně navržený a že nerozhodl správně," říká další odborník na analýzu řeči, Luděk Müller z plzeňské ZČU.
"Tyto systémy tak nejspíš budou hrát pouze roli asistence," dodává k tomu doktorand Petr Salajka ze stejného pracoviště. "Nejspíš budou psychologovi sloužit jako pomocný nástroj, ale poslední slovo bude mít vždy člověk."

Detekce Parkinsona
Na základě rozboru hlasu by mohla také být diagnostikována Parkinsonova choroba. S těmito pokusy začal výzkumník Max Little z Univerzity v Birminghamu. V jednom datovém korpusu sestávajícím z hlasových záznamů tisíce zdravých či nemocných osob rozpoznají jeho systémy s více než 90procentní přesností, kdo trpí Parkinsonem.
Lékaři vědí, že tato nemoc mění hlasový projev - řeč je velmi rychlá a při Parkinsonu už nemocní nedokážou správně řídit svaly hlasového ústrojí. Podle Jana Černockého však i při detekci nemocí platí to samé - potíže jsou především s tím, jak vyvinout dostatečně obecný systém a jak data označovat.
V ohnisku zájmu českých i světových výzkumných skupin se dnes nachází především analýza hovorů z call center, v níž se skrývá značný komerční potenciál. Odborníci se snaží zjistit, zda byl zákazník s hovorem spokojený, nebo ne, a mnohé lze odvodit už jenom z toho, jak dlouho mluvil zákazník a jak dlouho prodejce. Z hovorů odvozené znaky osobnosti nebo emoce mohou sloužit pro komerční účely. Zazní -li tedy z call centra známá věta "váš hovor bude z důvodu zlepšování kvality služeb nahráván ", experti doporučují opatrnou nedůvěru.
Pokud by nově se vynořující technologie byla použita k účelům, jako jsou odhalení podvodníků s půjčkami či detekce nemocí, znamenala by přínos. Na druhou stranu je možné její zneužití pro cílenou reklamu a vytěžování informací o našich charakterových vlastnostech či emocích. Dříve než technika pokročí dále a bude blíže k praktickému nasazení, společnost by měla nejprve zhodnotit její rizika a zamyslet se nad tím, co všechno je s její pomocí možné odkrývat - a kde už vede hranice našeho soukromí, kterou by neměla překročit.

Vložila: Kozubová Hana, Mgr.

Poslední změna: 2020-04-15T12:42:42

Zpět na zprávy z FIT

Nahoru