axxessio INSIGHTS: Natural Language Processing

Mehdi Defaa

Mehdi Defaa

Sprachassistenten wie Alexa, Siri und Co. helfen vielen NutzerInnen bereits bei alltäglichen Aufgaben und werden dabei immer besser. Die Anwendung von virtuellen Assistenten in Form von Chatbots oder Voicebots werden jedoch auch immer häufiger von Unternehmen eingesetzt, denn die Möglichkeiten für diese Technologie sind vielversprechend.

Automatisierte Ansagen zur Ermittlung des Anliegens beim Anruf einer Servicehotline kennen wir bereits seit geraumer Zeit. Zu Beginn beschränkte sich die Funktionalität auf ein simples Kategorisieren der verschiedenen Anliegen und leitete im Zweifel an das Servicepersonal weiter. Während das Weiterleiten an den richtigen Gesprächspartner in der Praxis bereits sehr hilfreich sein konnte, war es aus Perspektive des Anrufenden häufig kein gutes Gespräch. In den seltensten Fällen konnte der Sprachassistent das Anliegen lösen nochhandelte es sich um ein natürliches Gespräch.

Seitdem hat sich jedoch einiges verändert. Dafür verantwortlich ist die maschinelle Verarbeitung natürlicher Sprache, dem Fachgebiet des Natural Language Processing (NLP). Als Zweig dieser Disziplin ist ebenfalls häufig vom Natural Language Understanding (NLU) die Rede. NLP- und NLU-Lösungen unterstützen in den verschiedensten Lebensbereichen. Egal, ob der Chatbot eines Onlineshops zu Produkteigenschaften oder das Smartphone zur Wettervorhersage befragt wird, hierfür werden sprachverarbeitende Techniken aus dem Bereich NLP und NLU verwendet.

 

Malte-helmhold-wkywsmi6m7y-unsplash

Zur Verarbeitung natürlicher Sprache liegt das sprachliche Material typischerweise in Textform vor. Diese kann verschiedenste Domänen und Datenmengen umfassen, z.B. kurze Produktbewertungen, Tweet-Nachrichten oder weitere Dialoge, bis zu Gigabyte-großen Nachrichtentextsammlungen oder ganzen literarischen Werken. Hierbei liegt der Fokus primär auf der automatischen Strukturierung, Analyse, Extraktion und Klassifikation der in natürlich-sprachlichen Texten enthaltenen Informationen und Inhalte.

Die Verarbeitung der natürlich-sprachlichen Inhalte erfolgt auf unterschiedlichen Ebenen: So können Texte in ihre Einheiten zerlegt und untersucht werden. Hierfür werden Paragraphen in Sätze, Sätze in ihre Phrasen und Wörter, und Wörter in ihre morphologischen Bestandteile unterteilt. Auf jeder Ebene können Inhalte strukturiert und zur weiteren Verarbeitung vorbereitet werden: Beispielsweise kann auf der Satzebene die grammatische Struktur der Sätze („Parsing“) und auf der Wortebene die normierte Form („Lemmatization“) sowie Wortarten („Part-of-Speech“) ermittelt werden. Auch die Extraktion bestimmter Inhalte („Information Extraction“) zählt zu den Aufgaben des NLP. Zudem können ähnliche Formulierungen erkannt werden („Textual Similarity“, „Paraphrasing“), Texte auch in eine andere Sprache übersetzt werden („Machine Translation“) oder in eine kürzere Form überführt werden („Text Summarization“).

Bei den oben genannten Aufgaben kommen verschiedene Algorithmen und Methoden, typischerweise unter Verwendung maschineller Lernverfahren („Machine Learning“, „Deep Learning“, „Transformers“), zum Einsatz. Im Teilbereich NLU werden die verarbeiteten Texte anschließend auf ihre qualitativen Eigenschaften geprüft. Hier liegt der Fokus auf der Bedeutungsermittlung. So können zum Beispiel Sätze anhand ihres emotionalen Gehalts klassifiziert werden („Sentiment Analysis“), Absicht und wichtige Informationen extrahiert werden („Intent Classification“, „Named Entity Recognition“) oder Frage-Antwort-Systemen ermöglicht werden („Question-answering“, „Dialogue Agents“).

NLP- und NLU-Lösungen können in verschiedensten Bereichen und Projekten zum Einsatz kommen, um Anwendungen basierend auf natürlicher Sprache zu ermöglichen. Auch für Ihr nächstes Projekt können unsere MitarbeiterInnen die notwendige Expertise auf höchstem Niveau bieten.

Weitere Artikel