Merged Facts - Harmonisierung und Vereinigung von Fakten in einem Sternschema
Daten eines Sternschemas sind einfach zu analysieren, da sich die auswertbaren Dimensionen um eine zentrale Faktentabelle gruppieren. Wenn aber Fakten zusammen betrachtet werden sollen, die in verschiedenen Tabellen verteilt sind, wird es schnell kompliziert. Kann dem nicht vorgebeugt werden?
Ambrosini, Marco, 2018
Art der Arbeit Bachelor Thesis
Auftraggebende Credit Suisse Services AG
Betreuende Dozierende Reber, Andreas
Keywords Sternschema, Dimensional Modeling, Datenmodellierung, Harmonisierung, Integrierung, Faktentabellen, Fakten, ETL, ELT
Views: 36 - Downloads: 4
Das aktuelle Datenmodel mit mehreren Faktentabellen ist zu mühselig. Dieselbe Kennzahl wird in separate Tabellen geladen, wenn diese aus unterschiedlichen Quellen kommt. Da aber stets konsolidierte Zahlen gemeldet werden, müssen diese für jeden Report anhand der Dimensionen aus mehreren Abfragen zusammengeführt werden. Das Reporting Team der Credit Suisse AG fordert eine Vereinfachung des Datamart, sodass die konsolidierte Berichterstattung erleichtert wird ohne dabei an Granularität der Detaildaten einzubüssen. Das Ziel dieser Arbeit ist somit die Vereinigung der existierenden Faktentabellen.
Zunächst wird recherchiert, ob und wann es möglich ist, Faktentabellen zu vereinen. Diverse Sze-narien werden durchgespielt, um den verschiedenen Arten von Fakten und Faktentabellen Rech-nung zu tragen. Dabei wird auch die Granularität und eine mögliche Überlappung der Daten be-rücksichtigt, sowie die Implikationen fürs Reporting. Weiter werden die konkreten Faktentabellen und die Problemstellung ausgiebig analysiert. Darauf basierend werden Konzepte für das neue Datenmodel ausgearbeitet und analysiert wie dieses implementiert werden kann. Die Funktions-tüchtigkeit wird durch Prototypen bewiesen.
Aus den Untersuchungen geht hervor, in welchen Szenarien eine Vereinigung der Faktentabellen möglich ist, und wo dass dies wenig oder keinen Sinn macht. Grundsätzlich müssen sie entweder dieselbe Granularität aufweisen, oder zumindest disjunkte Mengen darstellen. Bei der Analyse werden diverse Schwachstellen im derzeitigen Datenmodel und ETL-Prozess aufgezeigt, welche gegen die Grundsätze eines Sternschemas verstossen und sich bestenfalls erschwerend auf die Vereinigung der Faktentabellen auswirken. Es werden Lösungsansätze aufgezeigt, um diese Probleme vorgängig zu beheben, oder sie werden in den resultierenden Konzepten mitberücksichtigt. Letztere beschreiben das Ziel-Datenmodell und den Weg dorthin. Dies beinhaltet ein detailliertes Mapping der Attribute der verschiedenen Faktentabellen, ein umfassendes und optimiertes ETL-Konzept
und schliesslich das Vorgehen zum nahtlosen Implementieren der Merged Facts. Um die Konzepte bei der Implementierung leichter nachzuvollziehen, können die entwickelten Prototypen als Muster herangezogen werden.
Studiengang: Wirtschaftsinformatik (Bachelor)
Vertraulichkeit: öffentlich