An der Schnittstelle von Linguistik, Informatik, Maschinellem Lernen (ML) und Statistik gelegen, hat Natural Language Processing (NLP), also die Verarbeitung menschlicher Sprache durch Computer, in den vergangenen Jahren enorme Fortschritte gemacht. Aktuell treten weitreichende Fortschritte fast schon im Wochentakt auf, und zwischen den grössten Technologie-Institutionen ist ein Kräftemessen entbrannt. Dabei steigt die Generalisierbarkeit und explodiert die Grösse der Modelle. Die wirtschaftlichen Anwendungsfälle kristallisieren sich dabei erst heraus. Angesichts des immensen Potentials ist im unternehmerischen Kontext Ruhe vor dem Sturm. Denn schon jetzt übersetzen die besten Modelle so gut wie professionelle Übersetzer, erkennen Entitäten und Stimmungen verlässlich und können zielgerichtet Informationen aus Texten extrahieren.
Machine Learning
Grundlage dieser Entwicklung ist vor allem die Anwendung von Algorithmen aus dem Bereich ML auf grosse Datenmengen. Ende 2018 glückte einem Forscherteam von Google mit dem Modell BERT ein Meilenstein. Seither gilt die Modell-Familie der Transformer als Basis für vielseitige NLP-Anwendungen. Ein Grund dieses Erfolgs besteht im sogenannten Transfer Learning, welches die Transformer-Modelle ermöglichen. Hierbei wird ein Modell zunächst mittels eines enorm grossen Datensatzes trainiert (etwa einem Text-Abzug des Internets). Dieses Training dauert Tage und kostet siebenstellige Summen. Allerdings ist dieses Training nur einmalig nötig: danach können veröffentlichte Modelle geladen und für spezifische NLP-Aufgaben feintrainiert werden. Die grossen Forschungs-Gruppen bei google, Facebook, Microsoft oder openAi haben ihre Modelle bisher stets veröffentlicht oder als APIs verfügbar gemacht.
Warum NLP
Was bedeutet all dies für Unternehmen? Der Grossteil der Information jedes Unternehmens (und der menschlichen Zivilisation im Allgemeinen) ist in Texten gespeichert. Diese sind jedoch meist nicht klassifiziert, gruppiert oder untereinander sinnvoll vernetzt. NLP bildet die Grundlage, Texte automatisiert zu verarbeiten. Einmal in „Maschinensprache“ übersetzt, können mathematische Operationen Informationen und Kontext ermitteln. Es wird zum Standard für Unternehmen werden, alle schriftlich fixierten Informationen hinsichtlich bestimmter Themen, von denen sie handeln, zu sortieren – und gleich noch die Personen zu identifizieren, die am Besten Auskunft zu Sachverhalten geben können. Named Entity Recognition ermöglicht semantische Suche, über die beispielsweise die Recherche nach “google” auch Informationen zu Alphabet (der Holding) retouriert, aber nicht zum Alphabet (dem Sprachelement). Mittels Klassifizierungsverfahren wie Sentiment Analysis können E-Mails vorsortiert und Antwortvorschläge gemacht werden. Im Kontrast zu Bildverarbeitungsverfahren wird NLP unzählige Anwendungsmöglichkeiten bieten, da jedes grössere Unternehmen Textdaten besitzt, die automatisiert verarbeitet werden können.
Zaghafte Unternehmen – Beispiel Banken
Die meisten Unternehmen sind jedoch noch zaghaft in der Anwendung solcher Use Cases. Banken beispielsweise befinden sich – gerade in Europa – vielfach erst im Aufbau von Kompetenzen. Für zentrale Prozesse wie Risiko-Modellierung, Know-Your-Customer-, Anti-Money-Laundering- oder Cyber-Security nutzen sie vielfach schon ML-Anwendungen bzw. kaufen diese ein – auch, weil sich in diesen Bereichen aufgrund der ersetzbaren Arbeitskraft leichter ein Business Case errechnen lässt. Im Finanzierungsgeschäft oder im Support hingegen gibt es schon vielversprechende Ansätze, doch diese werden von Start-ups entwickelt und meist von Challenger-Banken verwendet.
Ein Grund für dieses Zögern besteht darin, dass es Banken oft schlicht am technologischen Knowhow fehlt. KI-Experten sind gefragt und finden eher selten den Weg in die als verstaubt geltende Finanzbranche. Banken sind ausserdem einer besonderen Regulierung ausgesetzt, was den Einsatz von ML-Modellen oder von Cloud-Services – zentral für Data-Science-Anwendungen – einschränkt. Darüber hinaus sind sie aufgrund der Kritikalität ihrer Geschäfte darauf angewiesen, extrem sichere und bedenkenlose Dienstleistungen anzubieten. Risikofreudiges Experimentieren, wie es in Technologie-Unternehmen gelebt wird, ist damit oftmals nicht zu vereinen. Wie in wohl allen traditionsreichen Branchen ist es mit der Qualität (Zentralität, Homogenität, Verfügbarkeit, …) der Daten auch bei Banken nicht weit her. Insgesamt sind die Geldhäuser seit Jahrzehnten keine Technologie-Leader – obwohl sie aufgrund ihres datengetriebenen und digitalen Geschäftsmodells eigentlich dazu prädestiniert wären.
Unklare Geschäftsmodelle
Zudem ist noch nicht klar, welche Anwendungsfälle, Geschäftsmodelle und Technologien sich durchsetzen werden. Die Erfolgsmetriken, die zur Validierung der Transformer-Modelle genutzt werden, sind nicht einfach auf unternehmerische Anwendungen übertragbar. So ist es heute in wenigen Zeilen Code möglich, hochkomplexe Modelle mit Abermillionen von Parametern zu nutzen, um etwa zu erkennen, welches Thema ein Zeitungsartikel behandelt oder welche Stimmung in einer Produkt-Bewertung zum Ausdruck kommt. Wenn alle Daten strukturiert vorliegen und Standard-Pipelines genügen, ist es dank der Transformer, dank der Einfachheit von Python als primärere Programmiersprache und dank der Paket-Vielfalt innerhalb von Python geradezu simpel, einen „Wow“-Effekt zu erzielen. Ganz anders sieht es aus, wenn die Daten nicht strukturiert vorliegen, wenn sie überdies divers und nicht gesäubert sind. Allein die Verwendung von Texten, die in exotischen Sprachen oder in Mundart verfasst sind, vervielfacht den Aufwand in der anglozentrischen NLP-Welt. Dies erschwert die Identifikation der Potentiale von NLP für Unternehmen.
Hindernisse in den Unternehmen
Unternehmen, die ein komplexes internes Wissensmanagement haben, die über eine direkte Kundenschnittstelle im B2C-Geschäft verfügen oder mit Datenauswertungen Wissensvorteile erzielen möchten, sollten bereits heute über das interne Knowhow verfügen, um NLP-Anwendungen einzusetzen. Gerade Banken fehlen oftmals Brückenbauer zwischen Research und Labor auf der einen und dem fachlichen Management mit Budget-Hoheit auf der anderen Seite. Dies gilt auch und besonders dann, wenn Lösungen eingekauft werden. Um externe Lösungen evaluieren zu können, sollten Produkt-Management, Business Engineering und Entwicklung in zunehmender Detail-Tiefe mit ihrem Gegenüber bei externen Dienstleistern kommunizieren können – gegenwärtig ist dies illusorisch.
Was ist möglich – ein Praxisbeispiel
Zur Veranschaulichung, wie NLP für einfache Dokument-Analyse genutzt werden kann, soll ein kleines selbst entwickeltes Python-Skript dienen. Das Skript erlaubt es, diverse, unstrukturierte, vielsprachige und vorher gänzlich unbekannte Dokumente zu laden, zu säubern und zu analysieren. Dabei hebt es sich ab von anderen Beiträgen, die eher auf den „Wow“-Effekt abzielen statt auf Robustheit und Praxisnähe. Eine detaillierte Beschreibung findet sich im technischen Teil dieser Blog-Serie.
Potentiale für Banken
Auf Basis einer strukturierten Datenbank, die gesäuberte Text-Corpora abbildet, ist es für spezialisierte Programmierer relativ einfach, erste Lösungen zu entwickeln, die das Potential erahnen lassen. Viele Anwendungen sind bereits technisch möglich und gehören hoffentlich bald zum Standard-Repertoire guter Unternehmen. Warum sollte eine Bank beispielsweise ihren Kundenberatenden nicht eine regelmässige Zusammenfassung der news zu den von ihnen betreuten Unternehmen zustellen – auf Basis von Zeitungsartikeln aus der Lokalpresse und News aus dem Netz? Und könnten die so gewonnenen Daten nicht auch für den Bereich Risiko und Finanzierungen relevant sein? Wie wäre es, wenn Banken automatische interne Wikis aufbauen, die zu mehr Transparenz, Aktualität, Zentralität und Einfachheit im Wissensmanagement beitragen? So könnten neue Mitarbeitende schnell relevantes Wissen aufbauen, statt mit x-fach editierten Word-Dateien und Wikis überladen zu werden, wobei selbst die Stammbelegschaft nicht mehr weiss, welche Informationen noch aktuell sind.
Und schliesslich ist da der ganze Support. Hier wird es unausweichlich, sich mit der Königsdisziplin in NLP auseinanderzusetzen: Chatbots. Haben bisher vor allem Fintechs solche Bots im Einsatz, werden immer mehr etablierte Institute darauf angewiesen sein, den First-Level-Support zu unterstützen oder teilweise zu ersetzen – man denke an Instant Payments mit der Anforderung, 24×7 Zahlungen abzuwickeln und damit auch Support anzubieten. Mit der exponentiellen Dynamik in der Grundlagenforschung sollten auch die eingesetzten und angeboteten Bots bald viel nützlicher werden.
Dabei sollten Banken jedoch bedenken, dass eine Eigenentwicklung End-to-End kaum zu leisten und der aufkommende Markt ohne technisches Verständnis der zugrundeliegenden NLP-Verfahren nicht zu überblicken ist. Es ist ein himmelweiter Unterschied zwischen einem Bot, der die Kundschaft mit Standard-Floskeln abspeist und damit in wirklich wichtigen Fällen gar mehr Schaden anrichtet als Nutzen stiftet, und einem wohlintegrierten digitalen Helfer, der Anfragen kanalisiert, auf Stimmung und Kontext der Anfrage eingeht und dabei noch Mundart versteht. Die Optimierung (“Feintuning”) eines von Drittanbietern eingebunden Bots durch Einspeisung interner technischer Dokumente kann hierbei den Zusatz-Nutzen heben, der in der Kundenerfahrung den Unterschied macht.
Um dies zu ermöglichen, muss Wissen in Entwicklung und Anforderungsmanagement aufgebaut werden. Denn selbst für trivial anmutende Aufgaben wie die Extraktion von Text aus pdf-Dateien gibt es gegenwärtig viele Pakete und Möglichkeiten, wobei die Wahl je nach Anwendungsfall die Desiderate Performanz und Verlässlichkeit abwägen muss. Auch als Grundlage für solcherlei technische Details soll im zweiten Teil dieser Blog-Serie die Funktionsweise des Python-Skripts erklärt und begründet werden.
2 thoughts on “NLP im unternehmerischen Kontext I – Business-Teil”