Voicebots

Wir haben alle mal bei einem Call Center angerufen – wir kennen teilweise die Warteschleifen, da alle Leitungen belegt sind. Können aber Voicebots dort Hilfe leisten? Ist es möglich, dass ein Voicebot uns versteht und helfen kann?

Hans-Joachim Belz (www.anstrengungslos.de), der früher als technischer Berater und Usability Experte tätig war und nun als Produkt Owner eines Voice AI Teams sowie Conversational Designer aktiv ist klärt auf.

Er gibt einen Einblick in die Herausforderungen die eine „Conversation“ mit sich bringt und beschreibt den aktuellen Status von Voicebots.


Zum Transkript dieser Folge


Ashley: Willkommen zur nächsten Ausgabe des Taktsoft Campus Podcast. Schön, dass ihr wieder dabei seid. Leider können wir Urlaubs bedingt in den letzten Tagen keinen Podcast aufnehmen. Umso mehr freue ich mich heute mit Hans-Joachim-Belz zu reden. Wir haben alle mal in einem Cousin angerufen. Wir kennen teilweise die Warteschleifen, der aller Leitung belegt sind. Können aber Voice Bots dort Hilfe leisten? Ist es möglich, dass ein Voice bei uns versteht und helfen kann? Hans-Joachim-Belz, der als technischer Berater und Usability Experte unterwegs war und nun als Produkt einer eines Voice A Teams sowie Konversation und Designer Aktivist klärt auf. Er gibt einen Einblick in die Herausforderungen, die ein Konversation mit sich bringt und beschreibt die aktuellen Starts zum Voice Bots. Ich freue mich auf das Gespräch und wie immer, wenn ihr Themen habt, die ihr gerne in einem Podcast beleuchtet haben möchtet, schick uns eine Email an Podcast als Talkshow und oder. Hallo, Achim.


Hans-Joachim: Hallo. Hi, Ashley.


Ashley: Und wie geht es dir heute? Alles gut?


Hans-Joachim: Ja, alles gut.


Ashley: Ja, schön. Schön, dass du Zeit für uns gefunden hast. Auch in deinem Urlaub. Das wissen wir sehr hoch zu schätzen. Wir wollen heute das Thema Voice im Kundenservice uns mal anschauen. Ich glaube, jeder Ire kennt den Callcenter. Ich ruf da mal an und ich drucke auf. Eins auf die auf die Telefon taste zu. Wenn ich eine Frage zu meiner meine Versicherung habe oder Nummer zwei zu meinem Kontostand zum Beispiel. Und dann endlich lande ich mit jemandem und ich kann mich dann mit mit derjenige oder diejenige an mich mich mal unterhalten. Die Frage ist dann dieses ganze Thema oder wir kennen auch Sere. Wir kennen auch Alexa. Aber ist diese Art von Chatbots Voice Board? Sind die dann auch einsetzbar in so einem Kurs? Und ich sag mal so wirklich so in einem Kunden Kanal sind die dann wirklich da momentan einsetzbar.


Hans-Joachim: Also Google, die haben ja vor kurzem erst eine reine Call Center Lösung herausgebracht. Die erzählen die Geschichte immer so Ihr Google Dialog Flow, das ist die Sprache Plattform, auf der der Google Assistant beruht und natürlich die ganzen Google Home Devices und so, dass Sie festgestellt haben, dass Ihre Kunden Dialog Flow ohne Ihr Wissen einfach mal mit Telefonie Platform verdrahtet haben und halt das benutzt haben, um so einen Sprachassistenten in einem Callcenter Kontext zu verwenden. Deswegen haben die sich dann auch entschlossen, seit 2018 dann halt ein eigenes Produkt dafür zu entwickeln. Das ist jetzt das neue Dialog Closed Access Anfang dieses Jahres. Herausgekommen ist ähnlich Amazon. Die haben eine interne Callcenter Lösung gehabt und Amazon ist ja ganz gut. Interne Lösungen teuer oder nicht so teuer unbedingt, aber jedenfalls dann gut zu vermarkten an an ihre Kunden. Und die haben 2017 Amazon Connect rausgebracht und damit dann auch irgendwann Amazon Lex. Das ist die Plattform, die hinter Alexa steckt verdrahtet. Also da gibt es von den Großen ganz viele Bewegungen, diese Richtung und gerade bei vielen, insbesondere großen Kunden natürlich auch sehr viel. Ja, es klingt zumindest erst mal sehr verheißungsvoll. Ich weiß nicht, ob der eine oder andere vielleicht schon mit solchen Sprachassistenten im Callcenter Erfahrungen gemacht hat. Theoretisch kann das besser funktionieren, weil damit eben einfach freiere Gespräche möglich sind. Ich muss nicht mal eine Taste drücken oder ein fest gegebenes Wort sagen, fest vorgegebenes Wort sagen. Aber wenn das Unternehmen wenig Ahnung von konventionell Design hat, dann dann kann das für den Nutzer auch sehr unangenehm werden. Ich habe da ich versuche das inzwischen zu sammeln und mich jetzt noch auf einen entsprechenden Service bei Check24 aufmerksam gemacht. Da hat man dann als Professional Designer direkt, also das ist so ähnlich, wie wenn man sich eine Website anguckt. Als Experte hat man direkt im Gespräch Poppen im Kopf 25 Sachen auf, die da anders gemacht werden sollten, um den Gesprächsverlauf zu verbessern.


Ashley: Dann lassen Sie lasst uns genau dieses Thema ist immer so die besondere Herausforderung, auch das Thema Konversation und Design. Lasst uns mal mal gleich zurück zu diesem Punkt kommen. Du sagst es dann okay, es gibt diese Plattform von Google bzw von Amazon, die können dann eingesetzt. Wenn ich dann ein ich ich sage mal so, ich bin ein British Airways oder Lufthansa oder irgendein Großkonzern. Ähm, was verspreche ich mir erst mal aus Sicht des Unternehmens, wenn ich dann diese diese Voice Bots Chatbots einsetzen und was verspreche ich meinen Kunden gegenüber zu geben im Sinne von verbesserte Service, wo wir sind. Die zwei ist immer so die zwei Blicke von intern. Warum setze ich das ein? Was, was, was erwarte ich? Und genau umgekehrt Was? Was kann ich meinem Kunden dann damit anbieten? Gegenüber, gegenüber? Ich sag mal so den klassischen Betrieb, den klassischen Callcenter, die, die wir auch kennen.


Hans-Joachim: Ja, ganz klassisch ist das Callcenter ja so ein so ein Center. Also kein Profitcenter, sondern etwas, das nicht einfach Geld kostet. Ein Kanal, den ich bedienen muss, gerade wenn ich aus aus Sicht des Unternehmens, das nach das Sein Profit optimieren will, muss sich zwar Kundenservice leisten, aber der kostet mich halt Geld, ohne dass da immer direkte Umsätze dahinter sind. Bzw die Umsätze die ich da mache, vielleicht durch Bestellungen, die die sind eben immer mit Investitionen meinerseits vorhanden, in größerem Ausmaß als es bei digital rein digitalen Kanälen der Fall ist. Das heißt natürlich auf Seiten des Unternehmens ganz klar Cost Cutting Kontakt Reflektion dieses Jahr auch so schön. Also das ist ganz furchtbar. Ich möchte den Kontakt zu meinem Kunden vermeiden. Positiv ausgedrückt Ich biete dem Kunden einen alternativen Kontakt, der im Idealfall auch der im Idealfall auch sehr gut bedient. Wo sich der Kunde durch Angebote wie Alexa und Google Assistant vielleicht ein Stück weit auch schon daran gewöhnt hat, wie er mit denen umgehen umzugehen hat und wo er eben den Vorteil hat, das auch bei einem überlasteten Callcenter, wenn er vielleicht mal zehn, 15 Minuten warten muss in der Warteschlange, das eben dann nicht muss, sondern direkt wirklich sein, sein Service Anliegen gelöst bekommt.


Ashley: Und und vielleicht eine schwere Frage für dich zu beantworten oder aber wie hoch ist die Prozentual gesehen, die die Anfragen, die kommen, die beantwortet werden über ein Voice? Wie hoch ist der Erfolg da? Ich sag mal so klar, wenn ich dann mit jemandem rede, normalerweise. Ich sage bewusst, normalerweise habe ich dann zum Schluss. Eine Lösung für mein Problem? Gibt es irgendwelche Statistiken oder oder Zahlen dazu? Liegen wir bei 70 %? 90 % oder ist das schwer einzuschätzen?


Hans-Joachim: Das hängt sehr stark einmal natürlich von der Komplexität des Services Anliegens ab und dann aber natürlich auch vom Geschick der Kommunikationsdesigner und der eingesetzten technischen Plattformen. Also ähnlich wie bei anderen Benutzerschnittstelle. Auch hängt es von von vielen Faktoren ab, ob der Erfolg möglich ist, wenn das Produkt zu kompliziert ist. Das kennen wir auch aus dem Web. Dann kann ich es digital nicht verkaufen. Und genauso, wenn das Service Anliegen zu kompliziert ist, wird mein digitaler Assistent das nicht vernünftig, nicht sinnvoll bedienen können. Was auf jeden Fall sich unternehmen, die überlegen, das zu tun. Was sie auf jeden Fall tun sollten, ist, wenn Sie feststellen oder wenn der Kunde selber den Wunsch äußert Ich muss aber jetzt mit dem Berater sprechen. Ich habe einfach eine Frage, die möchte ich mit einem Menschen besprechen, oder? Der Wolf Spot hat jetzt schon zweimal nachgefragt, hat schon eine Reparatur Versuch gemacht und versteht aber einfach nicht, worauf der Kunde hinaus will. Dann bitte möglichst schnell an einen Agenten weiterleiten, da immer den Menschen im Hintergrund behalten. Bei meinem aktuellen Arbeitgeber im Projekt ist es auch so, dass wir auch niemanden in den Spot rein zwingen, sondern dass wir das als Angebot darstellen. Hey, wir haben eine lange Warteschlange. Kann gern in der Warteschlange. Tut uns leid, kann es da gern warten? Aber du kannst auch direkt mit unserer Assistentin sprechen und versuchen, damit das Anliegen zu lösen.


Ashley: Ja, das verstehe ich. Und im Gespräch haben wir häufig zwei Wörter oder zwei Sachen gehört Konversation und Design und technologische Plattform. Gehen wir erstmal zum Thema Konversation und Design. Wir unterhalten uns jetzt. Ich bin Engländer. Ich spreche Deutsch, aber mit einer vielleicht nicht so gut deutsch Aussprache. Du hast einen bestimmten Akzent. Du hast eine bestimmte Art und Weise zu sprechen, das heißt, das fließt. Wir reden miteinander. Da sind ungeschriebene Gesetze und wir verstehen, was wir meinen. Das ist ein sehr, sehr, ich sag mal so, dieses Thema Konversation ist ein sehr, sehr komplexes Prozess und unser Gehirn verarbeitet viele Sachen, nicht nur die Wörter international. Und so weiter. Wie schaffe ich das dann überhaupt, dass 11111 Boot tan sich in so einer Lage versetzen kann, um wirklich zu verstehen, was ich meine und was ich will? Ich kann Sachen in verschiedene Art und Weisen ausdrücken wie wie, wie funktionell bzw wie weit ist die Technologie, um das zu schaffen?


Hans-Joachim: Ja, also ehrlich gesagt aus. Aus Sicht eines Menschen, der ein natürliches Gespräch erwartet, sind das immer noch Zaubertricks, die wir heute machen. Also wir. Wir versuchen das zu simulieren, sind aber noch sehr weit davon entfernt. Du hast es gerade ja schon angedeutet Conversation menschliche Konversation ist sehr komplex, folgt subtilen Mustern, die wir alle beherrschen, aber die meisten nicht bewusst wahrnehmen. Wir antworten innerhalb von 200 Millisekunden auf die. Auf die. Auf das, was unser Gegenüber gesagt hat. Ich weiß. Ich weiß, wann du aufhörst zu sprechen, weil du das schon anzeigt, in der Art, wie du sprichst. Es sei denn, ich will dir ins Wort fallen. Das war eine andere Situation. Aber. Und 200 Millisekunden später kommt meine Antwort, weil ich schon angefangen habe, meine Antwort vor zu formulieren, während du noch sprichst. Also da laufen interessante Phänomene ab. Wenn du, wenn ich länger als eine Sekunde nicht antworte, dann oder nicht mit meiner Antwort begonnen habe. Weißt du, da ist irgendwas schief gelaufen, da stimmt was nicht. Ich. Ich werde jetzt entweder lügen oder ich hadere mit deiner Frage oder ich habe Schwierigkeiten, darauf zu antworten, dass das. Es gibt da herrliche, herrliche Videos zu Ted Vorträge von Elizabeth Schoko, die sich da zum Beispiel mit Paaren beschäftigt hat, wie in einer Beziehung zwei Leute sich ineinander unterhalten und man schon an der Einleitung des Gesprächs feststellen kann, dass es gleich Probleme gibt. Es super spannend. Da sind wir mit den technischen Plattformen sehr, sehr weit von entfernt, da wirklich echte soziale Interaktionen durchführen zu können. Was wir heute gut können, ist Sprache erkennen und das zum Teil zumindest auch schon mit gewissen dialektalen Färbungen. Da kann ich ehrlich gesagt, weil ich mich da selber nicht intensiv mit beschäftigt habe, nicht genau sagen, wie sehr man ins Bayerische verfallen muss oder ins Hamburgische oder so, dass der Wortteil nicht mehr versteht. Ich komme dummerweise aus Westfalen, wo die.


Ashley: Ja.


Hans-Joachim: Mal genau, aber da wird heute auch schon, da wird schon sehr viel verstanden. Aber an der Inklusivität kann man definitiv noch arbeiten. Das ist auch ein großes Thema in der Branche.


Ashley: Aber so eine Sache ist das, was wir gesagt haben. Aber die die Konversation. Wie setzt sich das zusammen? Aber eine einfache Frage. Zum Beispiel Ich habe Ihnen einen Brief geschickt. Okay, die Frage Wann haben Sie das geschickt? Letzten Montag. Montag für eine Woche. Montag, den 28. Juli 8 und 20. Juli. Vor ein paar Tagen. Ich kann. Ich kann die Frage für dich. Alles verständlich. Ich kann die Frage in so vier verschiedene Arten Weisen beantworten wie Wie gehen die Bots mit so. Ich sag eine einfache Frage, wo es um ein Datum geht, aber die die die. Es gibt verschiedene oder mehrere Wege, wie ich diese Frau oder die Antwort auf diese Frage formulieren.


Hans-Joachim: Genau da fangen die Schwierigkeiten an, also das ist noch, dass wenn man jetzt wirklich diesen hohen Anspruch ansetzt, eine natürliches Gespräch zu führen, ist noch eines der kleineren Probleme, aber eben das Sprachverständnis, darüber hinaus das Weltverständnis und dann letztendlich die soziale Interaktion. Das sind so Ebenen, die man ansetzen könnte und da sind wir schon beim haben wir schon bei beim Sprachverständnis. Wir erkennen schon sehr häufig korrekt, was derjenige gesagt hat, aber es dann richtig zu verarbeiten. Und da es ein schönes Beispiel angesprochen Datumsangaben kann ich auf sehr viele verschiedene Weisen machen. Ich kann auch gestern sagen oder es war Ostersonntag oder so und der Volkssport sollte all diese Dinge verstehen. Ich glaube und ja, rein technisch gesehen heißt es heute noch, ich muss dem Boot all diese Dinge beibringen. Ich muss ihnen nicht im Detail jedes letzte Beispiel beibringen, sondern man arbeitet mit Language Samples, also mit Sprachmuster Beispielen. Ich fütter dann in die in die Maschine Language Software da einfach ganz viele Beispiele rein und erkläre auch, welcher Teil aus dem Sprachmaterial extrahiert werden muss, um das Datum zu haben. Und dann kann der Bot auch ähnliche Beispiele verarbeiten. Aber ich muss Ihnen da wirklich anlernen. Ich glaube, dass das in Zukunft für Unternehmen deswegen einfacher werden wird, weil die Unternehmen jetzt schon angefangen haben, fertige Module anzubieten, also zum Beispiel ein Modul für eine Terminvereinbarung oder so, wo ich dann Datumsangaben machen kann. Das hat natürlich wieder das übliche Problem, was man auch von UI Komponenten kennt. Passt fast, aber nicht ganz. Und da fängt dann das Gefummel an Also ich bin mal sehr gespannt, wie gut es Module funktionieren werden, aber es hat so ein bisschen die Hoffnung, dass man nicht mehr den kompletten Trainings Aufwand jedes Mal wieder von Hand leisten muss als Unternehmen.


Ashley: Ja, das sind genau diese Parallelen. Ich sage mal so zwischen X und Y, wo ich damals mit Daniel Freund von von dem drüber gesprochen habe. Zum Thema Design. Wir haben auch über das Thema Barrierefreiheit gesprochen. Ist genau das gleiche wie beim Konversation und Design. Ich finde es auch einen wirklichen schönen Begriff. Wir haben mehrmals Systeme Technologie, da hat es ein paar Schlagworte, das sage ich mal so Technologie, mal angesprochenen. Gehen wir davon aus, dass ich sage als Unternehmen, okay, ich ich möchte, ich möchte einen Versuch starten. Gibt es Plattformen, die ich, die ich benutzen kann? Sind die kostenlos, kostenfrei? Gibt es Open Source Komponenten, quasi wie sie dann ist, um so den technologischen Umfeld.


Hans-Joachim: Also einfacher Versuche kann kann heute jeder problemlos machen. Auch die großen Cloud Anbieter wie Amazon oder Google oder auch Nuance. Jemand der aus dem. Also wenn auch jemand das alte Drang Diktat kennt, das stammt von denen. Also wirklich kenne ich nicht. Okay, Sprachexperten wirklich der ersten Stunde, die da wirklich schon in den frühen 2008 mit dabei waren und nicht erst später eingestiegen sind. Die bieten auch eine erst mal prinzipiell frei nutzbare Plattform, also alles niedrigschwellige Angebote. Es geht darum, die Leute an zu füttern. Für einfache Experimente, die man machen möchte, muss man quasi kein Geld ausgeben. Also bis dahin, dass man sich ziemlich gerade kürzlich bei Amazon gemacht. Da kann man sich über Amazon Connect eine eigene Telefonleitung freischalten, da kann man sich quasi für für das Geld, was man, was man da. Also man kriegt ja immer so ein frei Konto bei bei den Cloud Anbietern. Üblicherweise kann man sich quasi ein Callcenter aus dem Nichts aufbauen mit einem kleinen Wahlspot dahinter und hat quasi sein seine eigene, sein eigenes kleines automatisiertes Servicecenter aufgebaut. Solange da jetzt nicht 1 Million Anrufer anrufen, das wird dann teuer, sondern man nur kleine Tests macht, geht das sehr einfach. Und dann gibt es halt populäre OpenSource Plattformen, die mir jetzt so in den Kopf kämen. Das wäre einmal Jo wo das ermöglicht zum Beispiel auch dann Cross Plattform Entwicklung. Also ich kann damit einen VoIP Spot oder einen Chatbot bauen, der sowohl auf Amazon als auch auf Google läuft oder auch auf Rasa und Rasa als als freies System, wo ich Chat und seit einiger Zeit auch Bots mit bauen kann, also wo auch ein eigener Spracherkennung mit einer mit einem eigenen Sprach Modell dahinter steckt, was ich so frei nutzen kann und bis hin zur Mozilla. Mozilla hat vor einiger Zeit noch ein Sprachen Initiative gehabt, wo die auch eine eigene Spracherkennung Engine aufbauen, eine ASR aufbauen wollten und das ist jetzt von wem anders übernommen. Wenn es heißt glaube ich jetzt Cookie oder so ko q ui. Wenn ich mich richtig erinnere, findet man aber garantiert, wenn man Mozilla Open Source Language Conditions sucht, auch auch eine interessante Plattform.


Ashley: Und ich finde, auch wenn, wenn man so zurück oder erst mal dieses Komplexität der Sprache und wenn man jetzt sagt okay, vielleicht mit I immer noch Herausforderungen, aber dass diese Spracherkennung funktioniert und nicht nur in englischer Sprache, sondern deutsch oder oder an andere Sprachen, das ist schon ein ein Wahnsinn weit Entwicklung, dass es da darf man, wie gesagt, wir nehmen das selbstverständlich gerät miteinander und wir verstehen uns alle oder wenn nicht anhand von Fragen, dann, dann, dann klären wir die Sachen. Das ist und das ist für uns, wie wir vorhin gesagt haben, das läuft alles so ein bisschen im Hinterkopf, vor dem Hintergrund, im Kopf. Und dass man wirklich dann eine Technologie, ein Plattform oder Plattformen baut, um, um, um das abzubilden, das ist schon, das ist schon ein Wahnsinn. Ich glaube, wie, wie du sagtest, es ist immer diese Balance zwischen okay, wie lange bleibe ich beim Boot und wann ist der Punkt, wo ich weiß, okay, ich muss der Kunde jetzt weiter weitergeben.


Hans-Joachim: Wirklich so, so, also wenn ich. Wenn ich einen guten Designer habe, der sich sehr intensiv mit den Sprecher Varianten der Kunden, mit den Anliegen, also damit, die Anliegen korrekt zu erkennen, wie äußere ich meine Anliegen? Da gibt es auch immer sehr viele Varianten. Wie ich das tun kann, der sich intensiv damit beschäftigt hat und damit nicht zu komplizierte Service Dialoge abbildet, dann kann sich das ein bisschen wie Magie anfühlen. Also dann kann man schon noch kein richtig. Es ist natürlich. Also man muss schon dazu sagen, wenn man Conversations Analysten fragt, das ist kein natürliches Gespräch, was man da führt. Aber wir Menschen, das ist genau wie bei den User Interfaces, bei den grafischen, wir passen uns an, wenn der Bankautomat uns nicht versteht, dann probieren wir so lange, bis er uns versteht. Und so können wir auch unsere unsere Dialog Führung an so eine Maschine ein stückweit anpassen, ohne dass das notwendigerweise direkt bedeutet, dass wir uns dabei ganz furchtbar verdreht fühlen und uns unter der Situation leiden, was aber sehr leicht passieren kann. Also ich habe noch nie solche. Emotions Ausbrüche erlebt, wie wenn man gesprächs analysen bei hotspots macht, da da kocht es sehr schnell im Nutzer.


Ashley: Oh nein, das war ein sehr, sehr schönes Gespräch. Vielen Dank für deine Zeit. Und wie ist der Weg? Dieser Einsatzbereich, wo man Voice Spots benutzen kann. Wo wir momentan stehen. Die Herausforderungen, auch die die technologische Plattform. Das war. Das war wirklich ein sehr, sehr schönes Bild und ich hoffe, dass ein paar von uns so zuhöre, jetzt anfange mal kurz hinter aufzubauen. Lass uns mal schauen, wir also.


Hans-Joachim: Viele Sachen damit machen. Ja, ja, hat mich. Das hat mich sehr gefreut. Das war ein sehr angenehmes Gespräch.


Ashley: Ja, vielen herzlichen Dank. Und ich würde sagen, bis zum nächsten Mal!


Ashley: Taktsoft Campus Podcast! Der Podcast für Software und IT Professionals. Im Taktsoft Campus Podcast beschäftigen wir uns mit einem breiten Themenspektrum, um euch zu helfen. Praxis Fragen zu Technologie, aber genauso Fragen zur Umsetzung, Prozessen oder Projektorganisation. Danke, dass ihr dabei wart. Euer Taktsoft Campus Podcast Team.

Höre alle Podcast Folgen auf deiner lieblings Streamingplattform!

Mehr, mehr, mehr davon!

Hier gehts zu allen Podcast Folgen des Taktsoft Campus.

Der Taktsoft Campus

Informiere dich was der Taktsoft Campus sonst noch für dich zu bieten hat.

Räumlichkeiten Mieten

Hier kannst du für Seminare, Workshops oder Tagungen unsere Räume mieten.