Informationsextraktion für die Versicherungsbranche (Motorfahrzeugversicherungen)

Unstrukturierte Daten, zum Beispiel Text und Informationen in komplexen Versicherungspolicen, können nicht automatisiert verarbeitet werden. Bis anhin werden sie manuell oder mit regelbasierten Methoden in eine strukturierte Form überbracht. Wie kann maschinelles Lernen diesen Prozess unterstützen?

Grolimund, Joël, 2020

Art der Arbeit Bachelor Thesis
Auftraggebende FIVE Informatik AG
Betreuende Dozierende Pustulka, Elzbieta
Keywords Informationsextraktion (IE), Maschinelles Lernen (ML), Text Mining, Schema-Abgleich, Feature-Engineering, FLIE, Versicherungsbranche, Motorfahrzeugversicherungen
Views: 23 - Downloads: 6
Policen Dokumente enthalten wichtige, leider aber unstrukturierte Daten. Zudem gibt es keinerlei Vorschriften bezüglich der Gestaltung, Form oder verwendeten Fachausdrücke in einer Police. Bisherige statische Lösungen geraten bei der Betrachtung, dass für jede Kombination aus Versicherungsgesellschaft, Versicherungsart und Sprache eine neue Vorlage entwickelt werden muss, an ihre Grenzen. Diese Bachelor Thesis ist Teil eines Innosuisse Projektes, welches das Ziel verfolgt, Informationen aus Policen mittels maschinellen Lernens zu extrahieren und in strukturierter Form zur Verfügung zu stellen.
In einem ersten Schritt wurde der IST-Stand des Projektes näher untersucht sowie dessen Thematik recherchiert. Damit mit den praktischen Arbeiten begonnen werden konnte, wurden zuerst die notwendigen Daten erhoben. Das Datenmodell und das Vokabular dienten als Basis und konnten parallel mit der Analyse der beschafften Motorfahrzeugpolicen erstellt werden. Als nächstes wurde anhand von extrahierten und annotierten Policen das Trainingsset für das maschinelle Lernen erstellt. Nachdem die bestehende Lösung für Motorfahrzeugversicherungen erweitert wurde, konnte sie getestet und verbessert werden.
Das Endergebnis beinhaltet ein überarbeitetes und verifiziertes Datenmodell für Motorfahrzeugversicherungen, dazu ein Vokabular mit den jeweiligen Fachausdrücken der Versicherungsgesellschaften pro Attribut. Ausserdem wurden dem Vokabular Kommentare beigefügt, welche Werte beispielsweise bei Booleschen Attributen zu erwarten sind. Des Weiteren wurde die bisherige Lösung für Motorfahrzeugversicherungen erweitert sowie die Testergebnisse präsentiert. Zum Schluss der Arbeit wurde dann noch ein Experiment durchgeführt, wie die verwendeten Klassifikatoren des maschinellen Lernens kombiniert werden können oder sollten, oder eben nicht. Unteranderem interessierte die Auftraggeberschaft auch das Fazit, dass die Endlösung - nach aktuellen Ergebnissen - einen hybriden Ansatz mit einerseits einer dynamischen maschinell Lernenden und gleichwohl statischen regelbasierten Informationsextraktionsmethode erfordert.
Studiengang: Wirtschaftsinformatik (Bachelor)
Vertraulichkeit: öffentlich
Art der Arbeit
Bachelor Thesis
Auftraggebende
FIVE Informatik AG, Urtenen-Schönbühl
Autorinnen und Autoren
Grolimund, Joël
Betreuende Dozierende
Pustulka, Elzbieta
Publikationsjahr
2020
Sprache der Arbeit
Deutsch
Vertraulichkeit
öffentlich
Studiengang
Wirtschaftsinformatik (Bachelor)
Standort Studiengang
Olten
Keywords
Informationsextraktion (IE), Maschinelles Lernen (ML), Text Mining, Schema-Abgleich, Feature-Engineering, FLIE, Versicherungsbranche, Motorfahrzeugversicherungen