Respekt: Počítač v roli personalisty

Respekt | 09.09.2019 | Rubrika: Civilizace | Strana 59| Autor: Michal Černý

Dají se povahové vlastnosti člověka vyčíst z jeho hlasu? Umělá inteligence to dokáže - ne však neomylně.

Jsme svědky na první pohled nezávazného rozhovoru. Počítač specializovaný na rozbor hlasu od společnosti Precire z německých Cách zpovídá žadatele o práci sedícího před ním. V experimentální místnosti pokládá uchazeči otázky typu "Jak jste strávil vaši poslední dovolenou?" nebo "Jak u vás probíhá typický víkend?". Potřebuje totiž 15 minut hlasového materiálu, aby zjistil, jaký je dotyčný charakterový typ. Je spíše tvrdohlavý, či přístupný změnám? Snese kritiku? Je týmový hráč, nebo individualista? Klasický přijímací pohovor je příliš krátký a povrchní, a často se zvrhává v pouhou exhibici uchazeče, z níž jeho potenciální budoucí šéfové vyčtou jen málo.
Precire se chce podívat hlouběji pod povrch a odhalit lidské vlastnosti přímo na základě analýzy hlasu. Poté co s využitím strojového učení srovná získaná data se záznamy od pěti tisíc pokusných osob, vyplivne závěr: Dotyčný má vysokou potřebu samostatnosti, je extrémně zvědavý, klade méně důrazu na status a dominanci a rád vyhledává riziko.
Blíží se tedy doba, kdy personalistu při přijímacím pohovoru nahradí počítač? A k čemu ještě lze strojovou analýzu hlasu využít?

Ženy lžou jinak než muži

Základem technologie, kterou Precire využívá, je databáze 5500 lidí a jejich povahových vlastností. U každého obsahuje celkem 43 psychologických znaků. Zároveň její autoři pořídili patnáctiminutový vzorek hlasu daného člověka, v němž analyzovali například "výplňová" slova, hlasitost nebo melodii řeči. Na těchto vzorcích se pak umělá inteligence učí souvislostem mezi vlastnostmi člověka a jeho mluveným projevem.
Systém tak dokáže zjistit, jestli je dotyčný zvědavý a otevřený změnám, anebo spíš konzervativní a opatrný, zda je extrovertní, či introvertní, přátelský, či soupeřivý. Dá se odvodit, jestli pracuje efektivně a má "tah na bránu", nebo jestli ho lze považovat spíš za typ "mouchy, snězte si mě". Precire dnes využívá v Německu více než 100 společností - mezi jinými náborová agentura Randstad, pojišťovací společnost Talanx, dopravní gigant Fraport, periodikum Handelsblatt nebo dodavatel energie RWE.
Počítač v roli personalisty, byť zatím jen pomocného, ale vyvolává kritiku - Precire si například letos vysloužil anticenu Big Brother. Podle těch, kdo ji udělují, neexistují důkazy, že parametry řeči souvisejí s výkonem v práci. Jazykový rozbor od Precire podle webu Big Brother nenachází přímou kauzalitu, ale jenom korelaci, která může být náhodná. Systém je černou skříňkou, do níž nevidíme - nerozumíme přesně tomu, jak se rozhoduje.
Podíváme-li se hlouběji do historie, počátky pokusů o rozpoznání emocí z řeči sahají do doby před téměř 20 lety. Po útoku na Světové obchodní centrum 11. září 2001 se americké ministerstvo pro vnitřní bezpečnost obrátilo na informatičku Julii Hirschberg, jež se zabývala analýzou hlasu už od roku 1985. Pracovníci ministerstva po ní chtěli systém, který by z řeči rozpoznal, kdy dotyčný lže a kdy mluví pravdu.
Není to snadný úkol, protože lhaní neprozrazují žádné jednoznačné znaky. Někteří lháři hlas zvyšují, jiní v tónu klesají. Pokud lžou muži, častěji mluví hlasitěji, zatímco hlas žen při lhaní méně kolísá. A právě umělá inteligence dokáže v obrovském množství kombinací najít vzorec. Výzkum pod vedením zmíněné vědkyně tak přinesl částečný úspěch a systém se teď používá i v policejní práci - dokáže prý lháře odhalit v 72 procentech případů, zatímco lidé jsou úspěšní jenom ze 46 procent.
Ještě před Julií Hirschberg zaujal "hlasový detektor lži" izraelského studenta Amira Libermana. Koncem devadesátých let se stal svědkem sebevražedného atentátu, při němž zemřely tři mladé matky s malými dětmi. Začal proto přemýšlet, čím by on sám mohl pomoci, aby se podobným tragédiím dalo zabránit. Vytvořil nástroj pro tzv. vrstevnou hlasovou analýzu (LVA, Layered Voice Analysis). Na základě matematického modelu dokáže systém rozpoznat několik desítek veličin ukazujících na pocity a duševní stavy - emoce jako nadšení, nezájem - nebo lze z analýzy získat indicie, že dotyčný něco tají. V hlasu se odráží pocit viny, trapnosti, vnitřní konflikt, ale třeba i sexuální napětí - například to, jestli nás druhý člověk přitahuje, nebo ne, což se projevilo například v analýze hlasu Billa Clintona, když mluvil o tom, že neměl sex s Monikou Lewinsky.
Technologie by tak mohla posloužit třeba při vyšetřování pedofilních zločinů nebo ve finančním světě k odhalování pojistných podvodů.
Objevují se však i pochybnosti - švédští lingvisté Anders Eriksson a Francisco Lacerda před několika lety označili LVA za nevědeckou technologii a jejího zakladatele Libermana za šarlatána.
Naopak v Indii tuto technologii zařadili mezi policejní vyšetřovací metody a indická média před několika lety informovala o tom, že se v Mumbaí díky analýze hlasu podezřelých podařilo usvědčit pětičlenný gang ze sexuálního násilí na dvaadvacetileté fotoreportérce.
Přes částečné úspěchy ovšem stále platí, že nejvyšší úspěšnosti - kolem 80 procent - dosahuje klasický detektor lži, který pracuje s mnoha dalšími ukazateli, jako je tep, tlak a dech. Proč má detekce lži čistě podle hlasu svá omezení, upřesňuje expert na analýzu hlasových dat Jan Černocký z brněnského VUT: Výzkumníci při vývoji systému například poprosí jednu skupinu osob, aby lhala, druhá polovina má mluvit pravdu. To ale není přirozená situace, protože v reálném životě většinou nikdo nelže na příkaz. Lháře i pravdomluvné sice mohou zahrát profesionální herci, jenže pak jsou doprovodné emoce daleko silnější než v běžném životě, což počítač mate.
"Systém využívající strojové učení funguje dobře za podmínek, ve kterých byl natrénován, ale pokud ho přeneseme jinam, má obvykle problémy," vysvětluje Černocký a uvádí příklad chytrého programu, jehož úkolem je poznat, zda člověk na druhém konci telefonní linky volá poprvé, nebo telefonoval již dříve. Během dlouhých hovorů v americké angličtině se systém téměř neplete - chybovost je nižší než jedno procento, tedy lepší než lidská. Dramaticky se však zhoršuje, pokud nevolá rodilý mluvčí, ale například někdo s asijským přízvukem. "Právě neschopnost fungovat správně za obecných podmínek je hlavním nedostatkem současné umělé inteligence."
A to se týká i personalistiky. Odborníci proto nepředpokládají, že by nástroje vybavené umělou inteligencí v ní mohly mít v dohledné budoucnosti hlavní slovo. Vzniká tu mimo jiné podobný problém jako u autonomních aut: kdo ponese právní odpovědnost za případnou nehodu samostatně jedoucího vozidla - člověk sedící na místě řidiče, umělá inteligence, anebo výrobce automobilu? "Kdybych byl třeba pilot dopravního letadla a systém by mě z psychologického hlediska vyhodnotil jako nevhodného kandidáta do zaměstnání u aerolinek, určitě bych ho napadl a bránil se, že je špatně navržený a že nerozhodl správně," říká další odborník na analýzu řeči Luděk Müller z plzeňské Západočeské univerzity. "Tyto systémy tak nejspíš budou psychologovi sloužit jako pomocný nástroj, ale poslední slovo bude mít vždy člověk," doplňuje Petr Salajka ze stejného pracoviště. O přijetí či nepřijetí uchazeče tak bude i nadále rozhodovat personalista.
Podle Petra Salajky se ovšem v poslední době rozvíjí obor "neural network reasoning", který se snaží umělou inteligenci přimět, aby dokázala zdůvodnit, proč se rozhodla tak, jak se rozhodla. Věděli bychom pak mnohem lépe, proč například došlo k nehodě autonomního auta nebo proč byl příznivě hodnocen konkrétní uchazeč o zaměstnání. Pokud by se to stroje naučily, měly by jejich verdikty daleko větší váhu. Odhalení podvodníků s půjčkami

Výzkumníci experimentují také s tím, jak pomocí technologie rozpoznat z hlasu některá onemocnění. V roce 1974 psycholog Klaus Scherer napsal program, který prohledal hlasová data podle faktorů, jako je výška tónu nebo intenzita. Zjistil, jak se v průběhu terapie mění hlas pacienta trpícího depresí. Bylo tak možné rozpoznat, u kterých nemocných léčení probíhá úspěšně, a u kterých nikoli. Podobně by mohla být na základě rozboru hlasu diagnostikována Parkinsonova choroba (viz Respekt 49/2018).
V ohnisku zájmu českých i světových výzkumných skupin však nakonec není ani personalistika, ani lékařství, ale především analýza hovorů z call center, v níž se skrývá značný komerční potenciál. Manažeři těchto center potřebují vědět, zda byl zákazník s hovorem spokojený, nebo ne, ale i kolik je volajícímu let a zda mluví vážně, jestli si z operátora nestřílí. Umělá inteligence také dokáže odhadnout, jak se lidem daný produkt líbí a zda vůbec má cenu ho nabízet. Na základě hlasu by software mohl dokonce odhadovat konfekční velikost volajícího a nabízet mu třeba košile na míru. Taxislužbám by systém mohl pomoci odhalit, jestli zákazník svůj požadavek na přivolání taxi myslí vážně.
Nástroj je možné použít i pro hodnocení zaměstnanců call center. Zaměstnavatel může zjišťovat, jestli pracovník call centra není "vyhořelý", zda svým hovorem klienty neunavuje nebo nepopouzí, jestli chce skutečně zákazníkovi pomoci, nebo se volajícího co nejdříve zbavit.
Zajímavou aplikací je také již zmíněná identifikace mluvčího, tedy zjišťování, jestli do kontaktního centra několikrát nevolá ten samý člověk. Některé společnosti totiž na základě telefonátů poskytují malé půjčky kolem deseti tisíc korun. "Najdou se ale podvodníci, kteří v nákupním středisku ukradnou osm občanských průkazů a osm mobilů, a pak si během půl hodiny pořídí po telefonu osm půjček na různé identity. Jediná možnost, jak tyhle lišáky poznat, je pomocí strojové detekce hlasu, kdy prodejci začne svítit poplašné světélko - pozor, tenhle člověk volal pod jiným jménem před dvěma minutami a ještě předtím před deseti minutami," vysvětluje Jan Černocký.

Pod dohledem stroje

Jsou to jistě užitečné aplikace, ale vezmeme-li v úvahu všechny možnosti, jež současná technika nabízí, existuje důvod ke zneklidnění. Díky chytré asistentce Alexe dnes firma Amazon bez velké námahy sbírá hlasová data od zákazníků, kteří mají Alexu nainstalovanou doma - systém naslouchá hovorům v jejich soukromí. Amazon zároveň nedávno oznámil patent na vlastní analyzátor hlasu, který dokáže rozpoznat emoce a zdravotní stav. Podle toho pak Alexa nabídne obyvatelům domácnosti vhodné léky, jež se samozřejmě dají objednat právě přes Amazon.
Podobný "laskavý dohled" chytrého stroje může u mnohých vzbuzovat odpor. Pokud by se časem probojoval do chytrých telefonů, třeba v podobě nenápadných, zdánlivě k jinému účelu sloužících aplikací zdarma, bude výsledkem další oceán dat pro cílenou reklamu, kterou zdaleka ne každý vítá. Nemluvě o tom, že údaje o našem věku, pravděpodobném vzrůstu, povahových vlastnostech, momentálním duševním rozpoložení, nemocech a dalších ryze osobních věcech lze velmi snadno zneužít.
Strojová analýza hlasu je poměrně mladá technologie a zatím trpí dětskými nemocemi. Je tedy ještě čas stanovit, kudy vede hranice našeho soukromí, kterou by neměla překročit.

Vložila: Kozubová Hana, Mgr.

Poslední změna: 2020-01-09 13:05:23

Zpět na zprávy z FIT