Mit Data Governance werden Nachvollziehbarkeit, Qualität und Schutz von Daten sichergestellt.

Data Lake & Data Warehousing zur Speicherung von Big Data

Bei der Sammlung und Speicherung von Big Data entscheiden wir auf Basis Ihrer Anforderungen, ob Data Warehouse oder Data Lake die richtige Plattform für Sie ist.Jetzt Kontakt aufnehmen

Was ist Big Data?

Mit Big Data werden besonders große Mengen an Daten bezeichnet, die aus unterschiedlichsten Quellen gesammelt, gespeichert, verarbeitet und ausgewertet werden.

Sie zeichnen sich durch ihre Größe, Komplexität, Schnelllebigkeit und schwache Strukturierung aus. Besonders im Rahmen von Business Intelligence (BI) spielt Big Data eine große Rolle. Bei der Analyse gesammelter Daten greift BI neben systematischen Ansätzen insbesondere auf neue Softwarelösungen zur Bewertung großer Datenmengen und zur verbesserten Geschwindigkeit bei der Datenverarbeitung zurück. 


Date Warehouse vs. Data Lake – Plattformen zur Speicherung von Big Data

Wenn es um die Speicherung von Big Data geht, haben sich die Begriffe Data Warehouse und Data Lake etabliert und sind je nach Anforderungen unterschiedlich geeignet. 

 

Grafik zur Unterscheidung von Data Warehouse und Data Lake bei Big Data.

Data Warehouse

Data Warehouse erfasst strukturierte Daten in meist tabellarischer Form, die für einen bestimmten Zweck verarbeitet wurden. 
Das Datenmodell ist also vorab festgelegt, woraus sich zwar eine geringere Flexibilität neuer Datenquellen ergibt, gleichzeitig sind Daten in einem Data Warehouse sehr robust und einfach zu pflegen. Ein Ansatz zur Modellierung von Data Warehouse stellt das Data Vault dar.

Data Lake

Data Lake hingegen erfasst sowohl strukturierte als auch unstrukturierte Daten, deren Zweck noch nicht definiert ist.
Da erst während des Auslesens das Datenmodell festgelegt wird, stellt dies eine mögliche Fehlerquelle dar. Hingegen sind Data Lakes sehr flexibel und skalierbar.

Eine Auswahl unserer Kundenprojekte

In zahlreichen Kundenprojekten haben wir Data Warehouse oder Data Lake zur Speicherung von Big Data erfolgreich eingesetzt. Lesen Sie hier die Referenz-Storys:

Data Warehouse oder Data Lake?

Welche Plattform ist besser für Sie geeignet?

Ob Big Data, Data Lake, oder Data Warehouse – immer steht die Sammlung und Speicherung von unternehmensweiten, teilweise unternehmenskritischen Daten im Fokus. Dabei sollte anfangs nicht die Technologie im Vordergrund stehen. Stattdessen werden aufgrund der fachlichen Anforderungen und Restriktionen die richtige Architektur und (Kombination von) Technologien ausgewählt.

Auf Basis dieser individueller Anforderungen entscheiden wir, was besser für Ihr Projekt geeignet ist: 

Datenstruktur

Strukturierte Daten lassen sich hervorragend in relationalen Datenbanken speichern und analysieren, dagegen können andere Technologien ihren Vorteil bei unstrukturierten Daten ausspielen.

Leistung

Giga-, Tera- oder Petabyte? Antwortzeiten in Sekunden oder Minuten für dutzend oder tausend Benutzer?

Stabilität

Spätestens, wenn die analytische Lösung der Unterstützung der unternehmensweiten Entscheidung dient, muss Ausfall minimiert, Backup gesichert und Skalierbarkeit gesichert sein.

Kosten

Make or Buy, Cloud oder on-premises, skalierbar oder „Small Footprint“ – jede Entscheidung muss auch hinsichtlich der Kosten bewertet werden.

Vorgehen bei der Umsetzung von Big Data, Date Warehouse und Date Lake

  • Bedarf anhand bisheriger und zukünftiger Anforderungen festlegen.

    Entweder stellen wir mit Ihnen in den Data Warehouse / Big Data-Workshops gemeinsam die Anforderungen fest und konzipieren eine Architektur, oder Sie haben bereits eine vorliegen? Ggfls. führen wir auch eine Modernisierung Ihrer Plattform durch.

  • Entwicklung und Implementierung einer funktionsfähigen Plattform.

    Je nach Architektur on-premises / SaaS / IaaS konzipieren wir die Plattform und implementieren diese.

  • Modellierung, Aufbau und Datenintegration

    Nach der technischen Bereitstellung geht es in die fachliche Umsetzung: Modellierung des Datenmodells, Erstellung der Datenintegrationsprozesse usw.

  • Laufende Begleitung des Projekts

    Ob in Workshops gemeinsam erarbeitet, oder vorgegeben; ob Realisierung durch Sie, uns oder Dritte.

Unsere Services zu Big Data, Data Warehouse und Data Lake

Wir haben uns der Aufgabe verschrieben für unsere Kunden die beste Technologie für den Anwendungsfall zu finden und umzusetzen. Dafür nutzen wir ein Konzept von aufeinander aufbauenden Workshops.

Expertise

Ein Team aus erfahrenen Projektleitern, DWH-Architekten und Experten konzipiert (wenn noch kein Lösungskonzept vorhanden) und entwickeln die komplette analytische Lösung

Technische Bereitstellung

Egal, ob SaaS, IaaS oder on-premises: Wir führen die Bereitstellung von Services in der Hybrid Cloud für unsere Kunden aus. In Abhängigkeit zu den Anforderungen entwickeln wir die perfekte Vorgehensweise und sorgen für die technische Basis.

Betrieb und Support

Zahlreiche Kunden setzen bereits auf unsere Expertise, wenn es darum geht, den Betrieb der analytischen Plattform sicherzustellen. Mit unseren geschulten Spezialisten stellen wir den Betrieb der Systeme und Erreichbarkeit sicher.

Für jedes Projekt den richtigen Hersteller:

Sie suchen technische Unterstützung zu Big Data, Data Warehouse und Data Lake? Wir arbeiten mit Open Source-Technologien und kommerziellen Lösungen folgender Hersteller:

Logo MicrosoftLogo Microsoft
Google LogoGoogle Logo
Logo OracleLogo Oracle
Logo Open SourceLogo Open Source

IBM

IBM Cloud Pak for Data, die neue Open Source basierte Plattform watsonx der IBM sowie klassische Datenbanken wie Db2 Warehouse oder Netezza Performance Server sind Lösungen für Data Warehouse, Data Lake(house), Data Fabric oder Data Mesh.

Mehr erfahren

Microsoft

Mit diversen Lösungen in der Azure Cloud wie Synapse, Data Factory, Power Apps, Azure SQL oder Databricks und Data Lake Storage oder on-premise rund um SQL Server bietet Microsoft Technologien für die Entwicklung von Data Warehouses, Data Lakes oder Data Lakehouses.

Mehr erfahren

Google

Basierend auf Ihrer zentralen Cloud Platform GCP bietet Google mit Werkzeugen wie Dataflow, Data Fusion, BigQuery oder Looker eine integrierte Plattform für den Aufbau eines Data Warehouse, Data Lake oder Data Fabric.

Snowflake

Entwickelt als native Cloud-Lösung für die Implementierung einer zentralen Datenarchitektur sowohl für klassische Data Warehouse Workload als auch für semistrukturierte und unstrukturierte Daten bietet Snowflake eine hoch performante, skalierbare Plattform für Data Integration & Pipelines, Storage, Query & Analytics und Data Sharing.

Oracle

Die Oracle Datenbank gilt seit vielen Jahrzehnten als leistungsfähige Plattform für analytische Anwendungen und wird von uns in Data Warehouse Projekten eingesetzt.

Mehr erfahren

Open Source

In vielen Aspekten von Data Warehouse, aber besonders in Data Lakes und noSQL Datenbanken spielen OpenSource Technologien eine wichtige Rolle: Object Stores, Spark, Hadoop, Kafka, Postgres oder MongoDB, um nur einige zu nennen. Je nach Ihren Anforderungen setzen wir auch weitere Open Source Technologien ein.

Mehr erfahren

Nehmen Sie jetzt Kontakt zu uns auf!

Gerne beraten wir Sie in einem unverbindlichen Gespräch und zeigen Ihnen die Potenziale und Möglichkeiten von Data Lake, Data Warehouse und Big Data auf. Hinterlassen Sie einfach Ihre Kontaktdaten und wir melden uns dann schnellstmöglich bei Ihnen.

* Pflichtfelder

Wir verwenden die von Ihnen an uns gesendeten Angaben nur, um auf Ihren Wunsch hin mit Ihnen Kontakt im Zusammenhang mit Ihrer Anfrage aufzunehmen. Alle weiteren Informationen können Sie unseren Datenschutzhinweisen entnehmen.