Big Data, Data Lake & Data Warehousing

Bei der Sammlung und Speicherung von Big Data entscheiden wir auf Basis Ihrer Anforderungen, ob Data Warehouse oder Data Lake die richtige Plattform für Sie ist.
Jetzt Kontakt aufnehmen

Was ist Big Data?

Mit Big Data werden besonders große Mengen an Daten bezeichnet, die aus unterschiedlichsten Quellen gesammelt, gespeichert, verarbeitet und ausgewertet werden. Sie zeichnen sich durch ihre Größe, Komplexität, Schnelllebigkeit und schwache Strukturierung aus. Besonders im Rahmen von Business Intelligence (BI) spielt Big Data eine große Rolle. Bei der Analyse gesammelter Daten greift BI neben systematischen Ansätzen insbesondere auf neue Softwarelösungen zur Bewertung großer Datenmengen und zur verbesserten Geschwindigkeit bei der Datenverarbeitung zurück. 

Date Warehouse vs. Data Lake – Plattformen zur Speicherung von Big Data

Wenn es um die Speicherung von Big Data geht, haben sich die Begriffe Data Warehouse und Data Lake etabliert und sind je nach Anforderungen unterschiedlich geeignet. 

 

Grafik zur Unterscheidung von Data Warehouse und Data Lake bei Big Data.

Data Warehouse

Data Warehouse erfasst strukturierte Daten in meinst tabularischer Form, die für einen bestimmten Zweck verarbeitet wurden. Das Datenmodell ist also vorab festgelegt, woraus sich zwar eine geringere Flexibilität neuer Datenquellen ergibt, gleichzeitig sind Daten in einem Data Warehouse sehr robust und einfach zu pflegen. Ein Ansatz zur Modellierung von Data Warehouse stellt das Data Vault dar.

Data Lake

Data Lake hingegen erfasst sowohl strukturierte als auch unstrukturierte Daten, deren Zweck noch nicht definiert ist. Da erst während dem Auslesen das Datenmodell festgelegt wird, stellt dies eine mögliche Fehlerquelle dar. Hingegen sind Data Lakes sehr flexibel und skalierbar.

Data Warehouse oder Data Lake?

Welche Plattform ist besser für Sie geeignet?

Ob Big Data, Data Lake, oder Data Warehouse – immer steht die Sammlung und Speicherung von unternehmensweiten, teilweise unternehmenskritischen Daten im Fokus. Dabei sollte anfangs nicht die Technologie im Vordergrund stehen. Stattdessen werden aufgrund der fachlichen Anforderungen und Restriktionen die richtige Architektur und (Kombination von) Technologien ausgewählt. Dabei schauen wir uns folgende Anforderungen an Ihr Projekt genauer an:

Datenstruktur

Strukturierte Daten lassen sich hervorragend in relationalen Datenbanken speichern und analysieren, dagegen können andere Technologien ihren Vorteil bei unstrukturierten Daten ausspielen.

Leistung

Giga-, Tera- oder Petabyte? Antwortzeiten in Sekunden oder Minuten für dutzend oder tausend Benutzer?

Stabilität

Spätestens, wenn die analytische Lösung der Unterstützung der unternehmensweiten Entscheidung dient, muss Ausfall minimiert, Backup gesichert und Skalierbarkeit gesichert sein.

Kosten

Make or Buy, Cloud oder on-premises, skalierbar oder „Small Footprint“ - jede Entscheidung muss auch hinsichtlich der Kosten bewertet werden.

Vorgehen bei der Umsetzung von Big Data, Date Warehouse und Date Lake

  • Bedarf anhand bisheriger und zukünftiger Anforderungen festlegen.

    Entweder stellen wir mit Ihnen zusammen in den Data Warehouse / Big Data Workshops gemeinsam die Anforderungen fest und konzipieren eine Architektur, oder Sie haben bereits eine vorliegen? Ggfls. führen wir auch eine Modernisierung Ihrer Plattform durch.

  • Entwicklung und Implementierung einer funktionsfähigen Plattform.

    Je nach Architektur on-premises / SaaS / IaaS konzipieren wir die Plattform und implementieren diese.

  • Modellierung, Aufbau und Datenintegration

    Nach der technischen Bereitstellung geht es in die fachliche Umsetzung: Modellierung des Datenmodells, Erstellung der Datenintegrationsprozesse usw.

  • Laufende Begleitung des Projekts

    Ob in Workshops gemeinsam erarbeitet, oder vorgegeben; ob Realisierung durch Sie, uns oder Dritte.


Unsere Services zu Big Data, Data Warehouse und Data Lake

Wir haben uns der Aufgabe verschrieben für unsere Kunden die beste Technologie für den Anwendungsfall zu finden und umzusetzen. Dafür nutzen wir ein Konzept von aufeinander aufbauenden Workshops.

Expertise

Ein Team aus erfahrenen Projektleitern, DHW-Architekten und Experten konzipiert (wenn noch kein Lösungskonzept vorhanden) und entwickeln die komplette analytische Lösung

Technische Bereitstellung

Egal, ob SaaS, IaaS oder on-premises: Wir führen die Bereitstellung von Services in der Hybrid Cloud für unsere Kunden aus. In Abhängigkeit zu den Anforderungen entwickeln wir die perfekte Vorgehensweise und sorgen für die technische Basis.

Betrieb und Support

Zahlreiche Kunden setzen bereits auf unsere Expertise, wenn es darum geht, den Betrieb der analytischen Plattform sicherzustellen. Mit unseren geschulten Spezialisten stellen wir den Betrieb der Systeme und Erreichbarkeit sicher.

Für jedes Projekt den richtigen Hersteller:

Sie suchen technische Unterstützung zu Big Data, Data Warehouse und Data Lake? Wir arbeiten mit OpenSource Technologien und kommerziellen Lösungen folgender Hersteller:

Open Source

In vielen Aspekten von Data Warehouse, aber besonders in Data Lakes und noSQL Datenbanken spielen OpenSource Tools eine wichtige Rolle: Spark, Hadoop, MongoDB um nur einige zu nennen. Je nach Ihren Anforderungen setzen wir aber auch weitere Open Source Technologien ein.

Mehr erfahren

IBM

Relationale IBM Datenbanken wie Db2 / Db2 Warehouse oder Netezza Performance Server, bzw. Object Storage sind Plattformen für Data Warehouse oder Data Lake Lösungen.

Mehr erfahren

Microsoft

Mit SQL Server für on-premise, oder diverse Datenbanken auf Azure inkl. DataBricks und Data Lake Storage bietet Microsoft Technologien für die Entwicklung von Data Warehouses und Data Lakes.

Mehr erfahren

Oracle

Die Oracle Datenbank gilt seit vielen Jahrzehnten als leistungsfähige Plattform für analytische Anwendungen und wird von uns in Data Warehouse Projekten eingesetzt.

Mehr erfahren

Unsere Referenzen:

Nehmen Sie jetzt Kontakt zu uns auf!

Gerne beraten wir Sie in einem unverbindlichen Gespräch und zeigen Ihnen die Potenziale und Möglichkeiten von Data Lake, Data Warehouse und Big Data auf. Hinterlassen Sie einfach Ihre Kontaktdaten und wir melden uns dann schnellstmöglich bei Ihnen.

* Pflichtfelder

Wir verwenden die von Ihnen an uns gesendeten Angaben nur, um auf Ihren Wunsch hin mit Ihnen Kontakt im Zusammenhang mit Ihrer Anfrage aufzunehmen. Alle weiteren Informationen können Sie unseren Datenschutzhinweisen entnehmen.

Sprechen Sie uns an!

Martin Clement
Teamleiter AnalyticsTIMETOACT Software & Consulting GmbHKontakt