NLP im unternehmerischen Kontext I – Business-Teil

An der Schnittstelle von Linguistik, Informatik, Maschinellem Lernen (ML) und Statistik gelegen, hat Natural Language Processing (NLP), also die Verarbeitung menschlicher Sprache durch Computer, in den vergangenen Jahren enorme Fortschritte gemacht. Aktuell treten weitreichende Fortschritte fast schon im Wochentakt auf, und zwischen den grössten Technologie-Institutionen ist ein Kräftemessen entbrannt. Dabei steigt die Generalisierbarkeit und explodiert die Grösse der Modelle. Die wirtschaftlichen Anwendungsfälle kristallisieren sich dabei erst heraus. Angesichts des immensen Potentials ist im unternehmerischen Kontext Ruhe vor dem Sturm. Denn schon jetzt übersetzen die besten Modelle so gut wie professionelle Übersetzer, erkennen Entitäten und Stimmungen verlässlich und können zielgerichtet Informationen aus Texten extrahieren.

Machine Learning

Grundlage dieser Entwicklung ist vor allem die Anwendung von Algorithmen aus dem Bereich ML auf grosse Datenmengen. Ende 2018 glückte einem Forscherteam von Google mit dem Modell BERT ein Meilenstein. Seither gilt die Modell-Familie der Transformer als Basis für vielseitige NLP-Anwendungen. Ein Grund dieses Erfolgs besteht im sogenannten Transfer Learning, welches die Transformer-Modelle ermöglichen. Hierbei wird ein Modell zunächst mittels eines enorm grossen Datensatzes trainiert (etwa einem Text-Abzug des Internets). Dieses Training dauert Tage und kostet siebenstellige Summen. Allerdings ist dieses Training nur einmalig nötig: danach können veröffentlichte Modelle geladen und für spezifische NLP-Aufgaben feintrainiert werden. Die grossen Forschungs-Gruppen bei google, Facebook, Microsoft oder openAi haben ihre Modelle bisher stets veröffentlicht oder als APIs verfügbar gemacht.

Warum NLP

Was bedeutet all dies für Unternehmen? Der Grossteil der Information jedes Unternehmens (und der menschlichen Zivilisation im Allgemeinen) ist in Texten gespeichert. Diese sind jedoch meist nicht klassifiziert, gruppiert oder untereinander sinnvoll vernetzt. NLP bildet die Grundlage, Texte automatisiert zu verarbeiten. Einmal in „Maschinensprache“ übersetzt, können mathematische Operationen Informationen und Kontext ermitteln. Es wird zum Standard für Unternehmen werden, alle schriftlich fixierten Informationen hinsichtlich bestimmter Themen, von denen sie handeln, zu sortieren – und gleich noch die Personen zu identifizieren, die am Besten Auskunft zu Sachverhalten geben können. Named Entity Recognition ermöglicht semantische Suche, über die beispielsweise die Recherche nach “google” auch Informationen zu Alphabet (der Holding) retouriert, aber nicht zum Alphabet (dem Sprachelement). Mittels Klassifizierungsverfahren wie Sentiment Analysis können E-Mails vorsortiert und Antwortvorschläge gemacht werden. Im Kontrast zu Bildverarbeitungsverfahren wird NLP unzählige Anwendungsmöglichkeiten bieten, da jedes grössere Unternehmen Textdaten besitzt, die automatisiert verarbeitet werden können.

Zaghafte Unternehmen – Beispiel Banken

Die meisten Unternehmen sind jedoch noch zaghaft in der Anwendung solcher Use Cases. Banken beispielsweise befinden sich – gerade in Europa – vielfach erst im Aufbau von Kompetenzen. Für zentrale Prozesse wie Risiko-Modellierung, Know-Your-Customer-, Anti-Money-Laundering- oder Cyber-Security nutzen sie vielfach schon ML-Anwendungen bzw. kaufen diese ein – auch, weil sich in diesen Bereichen aufgrund der ersetzbaren Arbeitskraft leichter ein Business Case errechnen lässt. Im Finanzierungsgeschäft oder im Support hingegen gibt es schon vielversprechende Ansätze, doch diese werden von Start-ups entwickelt und meist von Challenger-Banken verwendet.

Ein Grund für dieses Zögern besteht darin, dass es Banken oft schlicht am technologischen Knowhow fehlt. KI-Experten sind gefragt und finden eher selten den Weg in die als verstaubt geltende Finanzbranche. Banken sind ausserdem einer besonderen Regulierung ausgesetzt, was den Einsatz von ML-Modellen oder von Cloud-Services – zentral für Data-Science-Anwendungen – einschränkt. Darüber hinaus sind sie aufgrund der Kritikalität ihrer Geschäfte darauf angewiesen, extrem sichere und bedenkenlose Dienstleistungen anzubieten. Risikofreudiges Experimentieren, wie es in Technologie-Unternehmen gelebt wird, ist damit oftmals nicht zu vereinen. Wie in wohl allen traditionsreichen Branchen ist es mit der Qualität (Zentralität, Homogenität, Verfügbarkeit, …) der Daten auch bei Banken nicht weit her. Insgesamt sind die Geldhäuser seit Jahrzehnten keine Technologie-Leader – obwohl sie aufgrund ihres datengetriebenen und digitalen Geschäftsmodells eigentlich dazu prädestiniert wären.

Unklare Geschäftsmodelle

Zudem ist noch nicht klar, welche Anwendungsfälle, Geschäftsmodelle und Technologien sich durchsetzen werden. Die Erfolgsmetriken, die zur Validierung der Transformer-Modelle genutzt werden, sind nicht einfach auf unternehmerische Anwendungen übertragbar. So ist es heute in wenigen Zeilen Code möglich, hochkomplexe Modelle mit Abermillionen von Parametern zu nutzen, um etwa zu erkennen, welches Thema ein Zeitungsartikel behandelt oder welche Stimmung in einer Produkt-Bewertung zum Ausdruck kommt. Wenn alle Daten strukturiert vorliegen und Standard-Pipelines genügen, ist es dank der Transformer, dank der Einfachheit von Python als primärere Programmiersprache und dank der Paket-Vielfalt innerhalb von Python geradezu simpel, einen „Wow“-Effekt zu erzielen. Ganz anders sieht es aus, wenn die Daten nicht strukturiert vorliegen, wenn sie überdies divers und nicht gesäubert sind. Allein die Verwendung von Texten, die in exotischen Sprachen oder in Mundart verfasst sind, vervielfacht den Aufwand in der anglozentrischen NLP-Welt. Dies erschwert die Identifikation der Potentiale von NLP für Unternehmen.

Hindernisse in den Unternehmen

Unternehmen, die ein komplexes internes Wissensmanagement haben, die über eine direkte Kundenschnittstelle im B2C-Geschäft verfügen oder mit Datenauswertungen Wissensvorteile erzielen möchten, sollten bereits heute über das interne Knowhow verfügen, um NLP-Anwendungen einzusetzen. Gerade Banken fehlen oftmals Brückenbauer zwischen Research und Labor auf der einen und dem fachlichen Management mit Budget-Hoheit auf der anderen Seite. Dies gilt auch und besonders dann, wenn Lösungen eingekauft werden. Um externe Lösungen evaluieren zu können, sollten Produkt-Management, Business Engineering und Entwicklung in zunehmender Detail-Tiefe mit ihrem Gegenüber bei externen Dienstleistern kommunizieren können – gegenwärtig ist dies illusorisch.

Was ist möglich – ein Praxisbeispiel

Zur Veranschaulichung, wie NLP für einfache Dokument-Analyse genutzt werden kann, soll ein kleines selbst entwickeltes Python-Skript dienen. Das Skript erlaubt es, diverse, unstrukturierte, vielsprachige und vorher gänzlich unbekannte Dokumente zu laden, zu säubern und zu analysieren. Dabei hebt es sich ab von anderen Beiträgen, die eher auf den „Wow“-Effekt abzielen statt auf Robustheit und Praxisnähe. Eine detaillierte Beschreibung findet sich im technischen Teil dieser Blog-Serie.

Potentiale für Banken

Auf Basis einer strukturierten Datenbank, die gesäuberte Text-Corpora abbildet, ist es für spezialisierte Programmierer relativ einfach, erste Lösungen zu entwickeln, die das Potential erahnen lassen. Viele Anwendungen sind bereits technisch möglich und gehören hoffentlich bald zum Standard-Repertoire guter Unternehmen. Warum sollte eine Bank beispielsweise ihren Kundenberatenden nicht eine regelmässige Zusammenfassung der news zu den von ihnen betreuten Unternehmen zustellen – auf Basis von Zeitungsartikeln aus der Lokalpresse und News aus dem Netz? Und könnten die so gewonnenen Daten nicht auch für den Bereich Risiko und Finanzierungen relevant sein? Wie wäre es, wenn Banken automatische interne Wikis aufbauen, die zu mehr Transparenz, Aktualität, Zentralität und Einfachheit im Wissensmanagement beitragen? So könnten neue Mitarbeitende schnell relevantes Wissen aufbauen, statt mit x-fach editierten Word-Dateien und Wikis überladen zu werden, wobei selbst die Stammbelegschaft nicht mehr weiss, welche Informationen noch aktuell sind.

Und schliesslich ist da der ganze Support. Hier wird es unausweichlich, sich mit der Königsdisziplin in NLP auseinanderzusetzen: Chatbots. Haben bisher vor allem Fintechs solche Bots im Einsatz, werden immer mehr etablierte Institute darauf angewiesen sein, den First-Level-Support zu unterstützen oder teilweise zu ersetzen – man denke an Instant Payments mit der Anforderung, 24×7 Zahlungen abzuwickeln und damit auch Support anzubieten. Mit der exponentiellen Dynamik in der Grundlagenforschung sollten auch die eingesetzten und angeboteten Bots bald viel nützlicher werden.

Dabei sollten Banken jedoch bedenken, dass eine Eigenentwicklung End-to-End kaum zu leisten und der aufkommende Markt ohne technisches Verständnis der zugrundeliegenden NLP-Verfahren nicht zu überblicken ist. Es ist ein himmelweiter Unterschied zwischen einem Bot, der die Kundschaft mit Standard-Floskeln abspeist und damit in wirklich wichtigen Fällen gar mehr Schaden anrichtet als Nutzen stiftet, und einem wohlintegrierten digitalen Helfer, der Anfragen kanalisiert, auf Stimmung und Kontext der Anfrage eingeht und dabei noch Mundart versteht. Die Optimierung (“Feintuning”) eines von Drittanbietern eingebunden Bots durch Einspeisung interner technischer Dokumente kann hierbei den Zusatz-Nutzen heben, der in der Kundenerfahrung den Unterschied macht.

Um dies zu ermöglichen, muss Wissen in Entwicklung und Anforderungsmanagement aufgebaut werden. Denn selbst für trivial anmutende Aufgaben wie die Extraktion von Text aus pdf-Dateien gibt es gegenwärtig viele Pakete und Möglichkeiten, wobei die Wahl je nach Anwendungsfall die Desiderate Performanz und Verlässlichkeit abwägen muss. Auch als Grundlage für solcherlei technische Details soll im zweiten Teil dieser Blog-Serie die Funktionsweise des Python-Skripts erklärt und begründet werden.

Extended Mind and Smartphone Banking

In June 2014, the US supreme court decided that police needs a judicial authorization to infiltrate a smartphone. In its explanatory statement, the judges noted that „modern cell phones […] are now such a pervasive and insistent part of daily life that the proverbial visitor from Mars might conclude they were an important feature of human anatomy.“ (https://www.law.cornell.edu/supremecourt/text/13-132) Therefore, hacking the smartphone would be such a deep violation of one’s human privacy that it requires authorization. This metaphor, namely of the smartphone as a part of human anatomy, has ramifications on smartphone banking, which shall be explained in the following.

The smartphone always at hand in our pockets – that’s how we walk around: from school kid to senior employee. The entire world in a handy gadget. Knowing-where-to-find-it is the new knowledge. A steady data stream connects the digital with the analogous and vice versa (our user-data). A steady stream where before hard borders between self and environment have been in place.

What effects does this recent development have not only on our health, but on our entire personality? As studies suggest, smartphones weaken focus and make us mentally lazy – after all, we need to use our brains less thanks to Siri’s talent to organize our calendar and get around in a new town (Cherry, 2018).

And yet, this is just the beginning. In evolution, touching and fondling are deeply routed means to amplify intimacy. Thus, haptic elements increase trust and willingness to take risk (Melumad und Pham, 2017). Already before language assistants were integrated into smartphones, we have been externalizing cognitive tasks to the gadget in our pockets (Chemero and Käufer, 2018).

Recently, philosophers apply the so-called extended-mind-hypothesis (after Clark and Chalmers, 1998) to describe the impact of high-tech on us (see for instance Record and Miller, tbd.). Even before (more precisely 91 years ago) german philosopher Martin Heidegger wrote on the readiness-to-hand (Zuhandenheit) of tools we use everyday. A sledge is „proximally and for the most part“ not opposed to its user. We have a much closer intimacy to it than to a „thing“. Only when the sledge doesn’t work the way we expect it to is it that we start getting interested in it as a thing and slice it into its characteristics (measure, weight, …) The more complex the „equipment“, the less we understand its mechanisms and characteristics. Still, we are no less satisfied so long as it fulfils its purpose. The sledge as an equipment is ready-to-hand, in that it is handy, the (malfunctioning) sledge as a thing is present-at-hand (vorhanden), viz. is opposed to us, and we contemplate and analyze it (Lynch, 2016).

This brings us back to the smartphone. The smartphone is handy, intuitively usable and usually functions without objection. Since the iPhone, the gadget is more ready-to-hand and less present-at-hand. Due to the haptic handling, we treat it much more naturally and intuitively than the computer. Thus, it took the role as the central interface between analogous and digital world. The easier and more flawless to use, the less we consciously notice the interface. This lets us enjoy the endless application it connects us with.

The smartphone is hence not just one technological gadget. Its influence on our personality and subjectivity also shapes the expectations we have on smartphone banking. First of all, banks should develop their apps not as a channel similar to E-Banking, but as a more intimate contact point with the customer. NeoBanks understand this and offer solely the app.

These new players are also the first to intensively utilize the vast amount of data that accrue in mobile banking. Further, they understand PSD2 and similar initiatives as opportunities, thus enabling the above-mentioned steady stream of data in both directions. This fluidity may also alter our relationship to money itself: Revolut, for instance, shows not only the balance, but also the flows – mounting with salary payments, ebbing away during the month. The exact amount becomes secondary. Self-defined budgetary rules defined in the app replace conscious control.

Smart banks will make use of the fact that haptic handling increases trust as well as willingness to take risk. The app should require little typing and more wiping, prodding and fondling. Biometric authentication should replace log-ins. All this helps establish a subtle proximity to a user group the customer consultant rarely gets to see.

The app has to function as easily and flawlessly as possible. And of course everything must be ready-to-hand immediately – thus the drive towards instant payments. High technological demands no doubt, but banks will have to satisfy them if they want to reach the smartphone-man. With a high usability, the bank can establish its app as a central interface to all financial activities of its customers. And there are so many possibilities to distinguish oneself from the competition: think of integrating language assistants, of chat-bots adapting the profile of the customer, of interfaces to depot and asset management and of gamification.

Mark Weiser, luminary of early Silicon Valley, wrote in his famous The Computer for the 21st century: „The most profound technologies are those that disappear. They weave themselves into the fabric of everyday life until they are indistinguishable from it.“ (Weiser, 1991) If we take this seriously, language assistants and virtual reality glasses are just logical next steps. Further down the road, we may have chips implanted under our fingers instead of smartphones. Successful banks will not be ignorant towards these developments, but view them as opportunities – for instance to increase intimacy with the customer while simultaneously reducing personal labor costs. Lastly, they must not forget what the supreme courts stipulation: the sensitive data on our smartphone must be as well protected as our very body parts.

 

Sources:
Chemero, Anthony and Käufer, Stephan (2018): Pragmatism, Phenomenology, and Extended Cognition, in: Pragmatism and Embodies Cognitive Science, pp. 57-72, online at: https://books.google.ch/books?hl=en&lr=&id=sQpEDQAAQBAJ&oi=fnd&pg=PA57&dq=smartphone+extended+mind+hypothesis&ots=gkvcSfqHSm&sig=8Jp7eJMtkRskQvuBcmrs7vtCXUc&redir_esc=y#v=onepage&q&f=false
Cherry, Kendra (2018): The Effects of Smartphones on the Brain, online at: https://www.verywellmind.com/how-do-smartphones-affect-the-brain-2794892
Clark, Andy and Chalmers, David J. (1998): The Extended Mind, Analysis 58 (1), pp. 7-19, online at: https://philpapers.org/rec/CLATEM
Lynch, Michael Patrick (2016): Leave my iPhone alone: why our smartphones are extensions of ourselves, The Guardian 19.02.2016, online at: https://www.theguardian.com/technology/2016/feb/19/iphone-apple-privacy-smartphones-extension-of-ourselves
Melumad, Shiri and Pham, Michel (2017): Understanding the Psychology of Smartphone Usage: the Adult Pacifier Hypothesis, in NA – Advances in Consumer Research Volume 45, pp. 25-30, online at: http://www.acrwebsite.org/volumes/v45/acr_vol45_1024470.pdf
Record, Isaac and Miller, Boaz (tbd.) Taking iPhone Seriously: Epistemic Technologies and the Extended Mind, in: Extended Epistemology, online at: https://philpapers.org/rec/RECTIS
Weiser, Mark (1991): The Computer for the 21st century, Scientific American Ubicomp Paper, online at: https://www.ics.uci.edu/~corps/phaseii/Weiser-Computer21stCentury-SciAm.pdf

 

This blog war originally posted in German at: http://digital-finance-experts.blogspot.com/2019/02/extended-mind-und-smartphone-banking.html