Ewa Wojciechowska

Head of Research & Content

Kamil Konikiewicz

Head of AI at PKO Bank Polski

Asystenci Głosowi przyszłością bankowości?

TechnologiaCustomer ExperienceBranża Finansowa

Technologie konwersacyjne są coraz częściej wykorzystywane w kontaktach z klientami. Na wdrożenie własnego Asystenta Głosowego zdecydował się PKO BP. To pierwszy w polskiej bankowości interfejs głosowy z tak szerokim zakresem realizowanych intencji użytkownika.

O wyzwaniach wynikających z realizacji tak wieloaspektowego projektu i przyszłości bankowości konwersacyjnej opowiedział nam Kamil Konikiewicz, Dyrektor Biura Rozwoju Sztucznej Inteligencji w PKO BP.

Ewa Wojciechowska, (EW): Niedawno zakończyliście z sukcesem wdrożenie Asystenta Głosowego w aplikacji IKO. Może Pan powiedzieć dlaczego zdecydowaliście się na realizację tak dużego i skomplikowanego projektu?

Kamil Konikiewicz (KK): Przede wszystkim warto tutaj wspomnieć, że rozwiązania konwersacyjne w PKO Banku Polskim to nie tylko Asystent Głosowy w aplikacji IKO. Boty działają dla nas również w innych kanałach komunikacyjnych, zajmując się obsługą różnych procesów biznesowych np. pomagając w szybszej obsłudze, weryfikując zainteresowanie klientów nowymi produktami, czy ustalając z nimi terminy spłaty zobowiązań. Motywacji, które przyświecały wdrożeniu każdego z tych rozwiązań było wiele. Natomiast jeśli chodzi o samego Asystenta IKO, myślę, że taką główną motywacją jest po prostu uważna obserwacja trendów pojawiających się na rynku, napędzanych w dużym stopniu przez Big Tech’y jak Facebook, Google, Amazon, czy Apple.

W ostatnich kilkudziesięciu latach mogliśmy zaobserwować trzy przełomowe zmiany technologiczne, które miały istotny wpływ na sposób komunikacji z klientami. Pierwszą z nich było pojawienie się szeroko dostępnego internetu, co otworzyło zupełnie nowe kanały komunikacyjne takie jak strona internetowa, e-mail, czy komunikatory. Drugi przełom to rozkwit bankowości mobilnej, która dziś stała się już praktycznie mainstreamowa. Trzecią zmianą, która zmieni paradygmat komunikacji z klientami, jest właśnie popularyzacja zautomatyzowanych technologii konwersacyjnych. Od dłuższego czasu obserwujemy wzrost popularności czatbotów i voicebotów. Konsekwencją tego jest coraz większa automatyzacja rozwiązań ułatwiających komunikację na linii klient - firma. Asystent IKO jest naszą odpowiedzią na ten trend.

Ważną motywacją są również rosnące oczekiwania klientów aplikacji bankowych, a co za tym idzie większa konkurencyjność na tym polu. Naturalnym tego skutkiem jest ciągły rozwój IKO, a co za tym idzie stale rosnący stopień kompresji funkcji na stosunkowo małym wyświetlaczu telefonu. Powoli dochodzimy do sytuacji, w której bardzo trudno będzie udostępnić klientowi wszystkie funkcje, których się spodziewa, w taki sposób, aby mógł z nich łatwo korzystać. Ogranicza nas wielkość ekranu, dlatego musimy być otwarci na innowacyjne rozwiązania, jakimi są m.in. interfejsy głosowe.

Są też praktyczne kwestie związane z obsługą klienta. Obecnie trudno sobie wyobrazić przeprowadzanie wszystkich interakcji z klientami w sposób manualny. Interfejsy głosowe pozwalają nam częściowo zautomatyzować ten proces i odciążyć pracowników banku od żmudnych i powtarzalnych zadań, które w przypadku tak dużej organizacji jak nasza, oznaczają setki tysięcy powtórzeń miesięcznie. Dzięki temu konsultanci mają więcej czasu na przygotowanie i przeprowadzenie rozmów z klientami na tematy bardziej złożone, które wymagają większych umiejętności analitycznych i interpersonalnych. Jednocześnie z punktu widzenia użytkowników dostępność procesów obsługowych jest dzięki temu większa i szybsza. Już teraz część naszych klientów dzwoniąc na infolinię nie musi wybierać kolejnych żmudnie odczytywanych pozycji z drzewka IVR. Wystarczy, że krótko powiedzą, w jakiej sprawie dzwonią i od razu zostaną przekierowani w odpowiednie miejsce.

(EW): W takim razie, jakie procesy realizuje i wspiera Asystent Głosowy PKO Banku Polskiego? Jakie sprawy użytkownicy mogą zrealizować z jego pomocą?

(KK): Na początek wybraliśmy najczęściej używane funkcje transakcyjne tj. przelew do odbiorcy zdefiniowanego na konto lub numer telefonu, doładowanie telefonu, sprawdzenie salda, historii transakcji, czy BLIK. Ponadto wyposażyliśmy Asystenta w dużą liczbę różnego rodzaju funkcji wspierających intencje, w ramach których np. podpowiadamy klientom, gdzie można znaleźć jakąś informację lub odpowiadamy na ich pytania dotyczące produktów i usług bankowych. Asystent potrafi np. przekierować klienta w odpowiednie miejsce w aplikacji IKO i pokazać mu ekran, na którym będzie mógł odnaleźć funkcję, której szuka.

Naszym głównym celem przy budowie tego rozwiązania było unikanie sformułowań typu “nie zrozumiałem”, “nie wiem”, “nie umiem”. Chcieliśmy doprowadzić do sytuacji - i to nam się udało - w której nawet jeśli Asystent nie jest w stanie wykonać dyspozycji klienta w oknie czatu, to przynajmniej będzie potrafił przekierować go w odpowiednie miejsce w aplikacji lub doradzić gdzie może próbować rozwiązać swój problem samodzielnie. Żeby to osiągnąć Asystent powinien rozumieć znacznie więcej rzeczy niż jest w stanie wykonać. W związku z tym już na starcie musieliśmy zmierzyć się z realizacją prawie 80 różnych intencji. Obecnie mamy ich około 130 i ta liczba cały czas rośnie.

Jakie funkcje Asystenta planujecie wdrożyć w przyszłości?

(KK): Nie ukrywam, że myślimy o tej technologii jako o rozwiązaniu, które będzie robić coś więcej niż odtwarzanie głosowe funkcji dostępnych w aplikacji mobilnej. Chcielibyśmy wykorzystać ją, aby wprowadzić zupełnie nowe funkcje, które są wręcz stworzone dla interfejsów głosowych. Pracujemy między innymi nad inteligentną analizą wydatków, czy zaawansowanym doradztwem finansowym. Myślę, że takie doradczo-analityczne funkcje Asystenta IKO zaczną się stopniowo pojawiać w przyszłym roku. Z pewnością jest to kierunek, w którym zamierzamy się rozwijać.

(EW): Patrząc “od podszewki” Asystent Głosowy to potężne rozwiązanie technologiczno-wizerunkowe i ogromne przedsięwzięcie, które wymagało skoordynowania pracy specjalistów z wielu dziedzin.

(KK): Zgadzam się, jest to ogromny i bardzo złożony projekt. To, co widzą użytkownicy, nie odzwierciedla w żaden sposób stopnia skomplikowania procesów, które dzieją się w tle. Użytkownik widzi, że np. otwiera się okno chatu, w którym może rozpocząć dialog z Asystentem Głosowym. Jednak żeby do tej rozmowy doszło trzeba skoordynować pracę ekspertów z wielu różnych dziedzin - od architektów IT i programistów, przez specjalistów data science, UX, lingwistów, aż do ekspertów z obszarów prawnych czy bezpieczeństwa.

Jeśli chodzi o współpracę z podmiotami zewnętrznymi, korzystaliśmy m.in. z pomocy dostawcy technologicznego, który zapewnił nam platformę, na której potem został przygotowany silnik konwersacyjny. Owocem tej współpracy było wdrożenie technologii i zintegrowanie jej z systemami banku oraz pierwsza wspólnie wypracowana wizja, jak Asystent Głosowy docelowo powinien wyglądać. Ten pomysł potem bardzo ewoluował i został przez nas mocno rozbudowany. Teraz w pełni samodzielnie wyznaczamy kierunki, w jakich chcemy się rozwijać.

Druga firmą, z którą podjęliśmy współpracę był e-point. W tym przypadku obszar prac był związany przede wszystkim z budowaniem tożsamości Asystenta i rozwojem języka, którym miał się posługiwać. Przyświecały nam dwa cele: z jednej strony chcieliśmy, aby z interfejsu głosowego po prostu przyjemnie się korzystało; z drugiej, zależało nam na tym, aby użytkownicy szybko zrozumieli, jakie funkcje mogą zrealizować z jego pomocą. Ponadto uważaliśmy, że Asystent powinien w przystępny sposób komunikować, że cały czas się rozwija i pewnych rzeczy jeszcze się uczy. Wymagało to ogromu pracy związanej z researchem rynku oraz analizą różnych scenariuszy i person, które były rozważane przy konstrukcji interfejsu.

Ostatecznie zdecydowaliśmy się na zbudowanie dość zrównoważonej tożsamości, która naszym zdaniem jest optymalnym balansem pomiędzy wirtualnym pracownikiem banku, a sympatycznym botem, który czasem pozwala sobie na niewinny żart. Kiedy np. klient zapyta Asystenta o pogodę, ten odpowie, że u niego zawsze świeci słońce. Z kolei zapytany o żart, przyzna, że te nie są jeszcze jego mocną stroną, ale obiecuje się w przyszłości poprawić.

Oczywiście klienci testują różne rzeczy nie tylko te związane z bankowością, więc takich przykładów jest znacznie więcej. Niemniej myślę, że w zakresie wypełnienia różnych aspektów tożsamości i nadania Asystentowi IKO określonego tone of voice wykonaliśmy naprawdę sporo pracy i mamy nadzieję, że ciągle będzie ona znajdować uznanie w oczach kolejnych klientów.

(EW): Wspomniał Pan, że ten pomysł bardzo ewoluował względem pierwszych założeń.

(KK): Tak, pewnym zaskoczeniem była skala tematów i spraw, które trzeba było uzgodnić podczas wdrażania tego typu rozwiązania. Coś, co z początku może się wydawać po prostu dodatkowym modułem aplikacji mobilnej, w praktyce dotykało bardzo wielu aspektów i wymagało komunikacji z wieloma jednostkami projektowymi i to na większą skalę niż na początku zakładaliśmy.

Kolejną ciekawą rzeczą, jaką zaobserwowaliśmy był sposób, w jaki użytkownicy korzystają z interfejsu głosowego. Wprawdzie zainwestowaliśmy wcześniej dużo czasu w dość szczegółowe i wnikliwe testy family & friends wewnątrz zespołu projektowego i pracowników banku, dzięki którym wiedzieliśmy, czego możemy się spodziewać. Jednak po kilku pierwszych tygodniach od uruchomienia Asystenta Głosowego zauważyliśmy, że klienci zaczynają zmieniać wzorzec zachowania.

Na początku badali to rozwiązanie, pytając o bardzo podstawowe funkcje, jednak to spektrum tematów szybko zaczęło się poszerzać. Zaczęły się pojawiać tematy sezonowe, związane z obecną sytuacją w kraju, których na etapie projektowania tego rozwiązania nie mogliśmy przewidzieć. Mamy tu na myśli np. pytania o funkcjonowanie banku w trakcie pandemii koronawirusa, czy też pytania dotyczące różnego rodzaju wsparcia i programów rządowych. To są rzeczy, które pojawiają się bardzo często i musimy na nie szybko reagować.

(EW): Proszę opowiedzieć jeszcze o kwestiach językowych. Jak poradziliście sobie z odczytywaniem intencji z tak złożonych wypowiedzi klientów?

(KK): To jest bardzo złożony temat i tak naprawdę kwestie językowe należałoby rozbić na dwie części. Po pierwsze mamy moduł związany z rozpoznawaniem mowy, który jest odpowiedzialny za transkrypcję, czyli przekształcenie dźwięku w tekst. Mimo że jako regulowana instytucja finansowa nie mogliśmy jeszcze skorzystać z rozwiązań chmurowych w tym zakresie, to nie napotkaliśmy tutaj jakichś większych problemów i jesteśmy zadowoleni z efektu.

Drugim zagadnieniem językowym jest kwestia dotycząca zrozumienia i przełożenia tekstu na konkretne działanie. Jest to nieco bardziej skomplikowane zadanie, ponieważ wymaga wyłuskania z wypowiedzi klienta różnych intencji i wyodrębnienia z nich konkretnych parametrów. Można powiedzieć, że cały czas pracujemy nad tym zagadnieniem. Doskonalenie rozumienia intencji klienta jest procesem ciągłym, który nie kończy się wraz z uruchomieniem interfejsu głosowego. Niemniej im więcej mamy danych, tym ten interfejs staje się lepszy.

Obecnie Asystent IKO jest w stanie zrozumieć i wykonać bardzo złożone dyspozycje jak np. “Przelej 50 złotych z konta oszczędnościowego na konto Janka tytułem piątkowe spotkanie”. Większość tego typu rozwiązań stosowanych przez konkurencję polega na powolnym odpytywaniu klienta i wymusza podawanie maksymalnie jednego parametru w wypowiedzi. Asystent IKO samodzielnie dekomponuje złożoną wypowiedź użytkownika i identyfikuje wszystkie elementy, których potrzebuje, aby zlecić dyspozycję. Czyli de facto jedno zdanie wystarczy, żeby zamknąć całe zlecenie, które normalnie wymagałyby przeklikania się przez szereg pól w formularzu.

(EW): Wróćmy jeszcze na chwilę do tematu tożsamości Asystenta IKO. Wspomniał Pan wcześniej, że jest wyważona, ale jest w niej też miejsce na odrobinę poczucia humoru. Czy mógłby Pan opowiedzieć coś więcej o osobowości Asystenta? Co się na nią składa? Czym kierowaliście się projektując ją?

(KK): Podejmując decyzję o charakterze Asystenta, stanęliśmy przed dość poważnym dylematem. Z usług PKO Banku Polskiego korzysta wielu rozmaitych klientów. Z jednej strony są to młode osoby wkraczające w dorosłość i rozpoczynające swoją przygodę z bankowością internetową, z drugiej zaś osoby starsze, które nie są obeznane z technologią. Mieliśmy wprawdzie pewne przeczucie, co do tego jaki profil klienta będzie najchętniej korzystał z interfejsu głosowego, ale zależało nam na tym, żeby stworzyć narzędzie jak najbardziej uniwersalne. Chcieliśmy, żeby Asystent IKO służył nie tylko jako zabawka, czy fajne narzędzie dla geeków technologicznych, ale też pomagał wprowadzić seniorów w świat aplikacji mobilnych i interfejsów graficznych. Inna sprawa to budowa rozwiązania przydatnego dla osób niepełnosprawnych – na przykład niewidomych lub z dysfunkcją dłoni. Pomoc takiej grupie klientów to dla nas szczególnie istotne zadanie.

Zanim zdecydowaliśmy się iść w stronę wyważonej tożsamości, przeprowadziliśmy wewnętrznie ankietę dotyczącą profilowania behawioralnego. Wnioski były takie, że większość cech powinna być właśnie wyśrodkowana. Asystent powinien być dowcipny, ale nie na tyle, żeby narzucać się klientom. Musi być nowoczesny, ale jednocześnie mówić językiem zrozumiałym dla osób starszych itd. Postawiliśmy więc na zwięzłą, precyzyjną komunikację zostawiając sobie mały wentyl bezpieczeństwa w postaci scenariuszy small talków, w których Asystent pokazuje swoje poczucie humoru. Natomiast jeśli chodzi o kwestie bankowe, to bardziej zależy nam jednak na budowaniu zaufania i pewności, że żadna transakcja nie zostanie zlecona bez potwierdzenia ze strony klienta. W tym obszarze nie ma miejsca na żarty.

(EW): Jak w takim razie zareagowali użytkownicy na Asystenta? Z jakich funkcji korzystają najczęściej? Czy feedback od klientów był zgodny z tym, czego się spodziewaliście?

(KK): Klienci zareagowali bardzo pozytywnie, co potwierdzają przeprowadzone przez nas badania satysfakcji. Zresztą wydaje mi się, że liczba rozmów, które przeprowadzili z Asystentem, mówi sama za siebie. Obecnie powstało już pewne grono stałych użytkowników, których liczba przewyższa nasze pierwotne oczekiwania.

Natomiast jeśli chodzi o to, w jaki sposób klienci korzystają z Asystenta, to nie ma tutaj jednoznacznej odpowiedzi. Część, poza funkcjami transakcyjnymi wykorzystuje go jako pewnego rodzaju pomoc w nawigacji po IKO lub iPKO - łatwiej im zapytać Asystenta gdzie mogą np. zastrzec kartę niż szukać tego samodzielnie.

Mamy też klientów, którzy próbują rozmawiać z Asystentem jak ze zwykłym pracownikiem banku i zgłaszają sprawy, które obecnie są jeszcze obsługiwane przez infolinię. Istnieje też grupa osób, które łączą się z Asystentem, żeby go przetestować i sprawdzić, co potrafi. Tak, że nie ma jednego uniwersalnego powodu, dla którego nasi klienci wybierają interfejs głosowy. Ich motywacje są bardzo różne.

(EW): Pana zdaniem, jaka zmiana będzie kolejnym, ważnym krokiem milowym w rozwoju technologii Voice User Interface? Co może odmienić nasze podejście do tego typu rozwiązań?

(KK): Myślę, że w Polsce do kolejnego skoku jakościowego rozwiązań konwersacyjnych brakuje przede wszystkim ich dalszej popularyzacji. Asystent IKO pokazuje, że większość użytkowników reaguje pozytywnie na takie innowacje. Dla dużej części osób jest to jednak pierwsze zetknięcie z tego typu technologią, przez co podchodzą do niej lekkim dystansem. Dlatego powinniśmy pracować nad przybliżeniem i oswojeniem takich technologii.

Duży wpływ na ten proces mają rozwiązania od Google czy Apple. Odkąd pojawiły się w Polsce użytkownicy zaczynają coraz bardziej adaptować je do różnych czynności jak np. dyktowanie smsów, czy ustawianie budzika lub nawigacji. Wierzę, że to tylko kwestia czasu, zanim interfejsy głosowe zaczną być powszechnie wykorzystywane w bankowości, ubezpieczeniach, czy branży retail.

Aktualnie największym problemem, który ogranicza nas w projektowaniu coraz bardziej inteligentnych botów, jest zbyt mała baza danych i modeli językowych oraz stosunkowo wąski katalog doświadczeń odnoszących się do języka polskiego. Dlatego im więcej branż zacznie korzystać z technologii konwersacyjnych, tym więcej doświadczeń będziemy mogli wypracować zarówno w biznesie jak i w działalności naukowej. Dzięki temu polskie interfejsy głosowe będą mogły rozwijać się, jak ma to miejsce na zagranicznych rynkach.

(EW): Korzystając z własnego doświadczenia, co mógłby Pan poradzić firmom, które zastanawiają się nad wdrożeniem VUI?

(KK): Powodzenie tego typu przedsięwzięcia jest uzależnione od tego, w jaki sposób jest ono traktowane przez organizację. Jeśli zależy nam na tym, żeby technologie konwersacyjne miały realny wpływ na oblicze firmy to ich wdrożenie musi być projektem transformacyjnym, nie pobocznym, a takie wymagają wsparcia „z samej góry”.

Bardzo ważne jest też precyzyjne określenie zakresu wdrożenia i celów biznesowych, do których zmierzamy. Może się okazać, że interfejs głosowy wcale nie jest najlepszym rozwiązaniem, żeby je osiągnąć. Warto też odpowiednio wcześnie przeanalizować wszystkie aspekty, których będzie dotykać taki projekt. Mam tu na myśli nie tylko kwestie technologiczne, ale też problemy związane z integracją systemów, bezpieczeństwem, czy regulacjami prawnymi.

(EW): Bardzo dziękuję za rozmowę. Mam nadzieję, że w przyszłości rozwój interfejsów głosowych pozwoli Asystentowi IKO oferować coraz więcej funkcjonalności, które będą sukcesywnie zwiększać poziom doświadczeń Państwa klientów.

(KK): Ja również mam taką nadzieję, dziękuję.