Data Vault

Die Datenintegrationsarchitektur des Data Vault Ansatzes verfügt über robuste Standards und Definitionsmethoden, die Informationen zusammenführen, um sie sinnvoll zu nutzen.

Der Data Vault Modellierungsansatz

Im Data Warehouse Umfeld gibt es zwei bekannte Modellierungsansätze nach Kimball und Inmon, die seit unzähligen Jahren verwendet werden, wenn es um die Speicherung von Daten geht. Seit der Entstehung dieser Methoden haben sich die Anforderungen an Technologien, Konzepten und Best Practices im Arbeitsumfeld stetig weiterentwickelt. Oftmals stellen größere Datenmengen und die geforderte Flexibilität an die heutigen Systeme große Probleme für diese Ansätze dar. Es ist daher fraglich, ob diese Ansätze bei allen modernen Fragestellungen und Anforderungen der heutigen Zeit noch angemessen sind. 

Aus dieser Überlegung heraus entstand der Data Vault Modellierungsansatz. Dieser hybride Ansatz vereint alle Vorteile der dritten Normalform mit dem Sternschema. Gerade in der heutigen Zeit müssen Unternehmen in immer kürzeren Zyklen ihre Geschäfte transformieren und diese Transformationen im Data Warehouse abbilden. Data Vault unterstützt genau diese Anforderungen, ohne die Komplexität des Data Warehouses im Laufe der Zeit wesentlich zu erhöhen. Anders als bei Kimball und Inmon entfallen dadurch die immer stärker wachsenden IT Kosten für die umfangreichen Implementierungs- und Testzyklen sowie eine lange Liste von möglichen Abhängigkeiten.

Die Datenintegrationsarchitektur des Data Vault Ansatzes verfügt über robuste Standards und Definitionsmethoden, die Informationen zusammenführen, um sie sinnvoll zu nutzen. Das Modell besteht aus drei grundlegenden Tabellentypen:

Datenintegrationsarchitektur des Data Vault Ansatzes
  • Hub (blau): Enthält eine Liste eindeutiger Geschäftsschlüssel, wie z. B. Kundennummern
  • Link (orange): Stellt Beziehungen zwischen den Geschäftsschlüsseln her. Links werden häufig verwendet, um Änderungen in der Datengranularität zu behandeln und die Auswirkungen des Hinzufügens eines neuen Geschäftsschlüssels zu einem verknüpften Hub zu reduzieren
  • Satellit (türkis): Enthält beschreibende Attribute, die sich im Laufe der Zeit ändern können. Wo Hubs und Links die Struktur des Datenmodells bilden, enthalten die Satelliten zeitliche und beschreibende Attribute einschließlich Metadaten, die sie mit ihrem übergeordneten Hub oder den Link-Tabellen verknüpfen. 

Auf Grund der Struktur und den definierten Standards ergeben sich viele Vorteile für den Data Vault Ansatz:

  • Massive Reduzierung von Entwicklungszeit bei der Implementierung von Business Anforderungen
  • Früherer Return of Investment (ROI)
  • Skalierbares Data Warehouse
  • Nachvollziehbarkeit aller Daten bis zum Quellsystem
  • Near-Real-Time Beladung (neben klassischem Batch Lauf)
  • Big Data Processing (>Terabytes)
  • Iterative, agile Entwicklungszyklen mit inkrementellem Ausbau des DWHs
  • Wenige, automatisierbare ETL Patterns

Dieser technologische Fortschritt erweist sich bereits jetzt schon bei vielen unserer Kunden als sehr effektiv und effizient. Gerne bauen wir mit Ihnen zusammen das agile Datewarehouse der Zukunft. 

Für jedes Projekt den richtigen Hersteller

Sie suchen technische Unterstützung in den Themen rund um Analytics: Datenintegration, Big Data/Datawarehouse, Business Intelligence, Data Science oder Corporate Performance Management? Wir arbeiten mit OpenSource Technologien und kommerziellen Lösungen folgender Hersteller:

IBM Platinum Business Partner
Microsoft Logo

Unsere Referenzen: