arrow arrow--cut calendar callback check chevron chevron--large cross cross--large download filter kununu linkedin magnifier mail marker media-audio media-blog media-video menu minus Flieger phone play plus quote share youtube

Data Lake

Ein Data Lake ist ein zentralisiertes Repository, das große Mengen an Daten in ihrem ursprünglichen Format speichert und verarbeitet. Es kann alle Arten von Daten aus verschiedenen Quellen aufnehmen, einschließlich strukturierter Daten (wie Datenbanktabellen und Excel-Tabellen), halbstrukturierter Daten (wie XML-Dateien und Webseiten) und unstrukturierter Daten (wie Bilder, Audiodateien und Tweets). Die Daten können mit verschiedenen Analysetools und Frameworks analysiert werden.

Haus am See gesucht? Wir können auch DWH.

Wie unterscheidet sich ein Data Lake von einem Data Warehouse?

Ein Data Lake unterscheidet sich von einem Data Warehouse in der Art und Weise, wie die Daten gespeichert und verarbeitet werden. Während ein Data Warehouse verarbeitete Daten für Business Intelligence und Analysen speichert, speichert ein Data Lake Rohdaten für maschinelles Lernen und KI. Ein Data Lake kann auch mit einem Data Warehouse kombiniert werden, um eine sogenannte "Data Lakehouse" Architektur zu schaffen, die eine bessere Integration, weniger Datenbewegungen, eine verbesserte Data Governance und Unterstützung bietet. 

Welche Vorteile bietet ein Data Lake?

Ein Data Lake bietet eine Reihe von Vorteilen, darunter: 

  • Die Fähigkeit, riesige Mengen an Informationen zu speichern. 
  • Flexibilität bei der Analyse im Big-Data-Segment. 
  • Vielfältige Nutzbarkeit der Daten. 
  • Anschlussfähigkeit für viele Analysen. 
  • Speicherung der Daten im Rohformat.

Interessiert wie wir Data Lakes umsetzen? Hier gibt es mehr Infos:

In welchen Bereichen werden Data Lakes eingesetzt?

Data Lakes werden in verschiedenen Branchen eingesetzt. Beispielsweise nutzen Streaming-Dienste in der Medienbranche Data Lakes, um große Mengen an Nutzerdaten zu speichern. Die Analyse dieser Daten ermöglicht es ihnen, den Nutzer*innen basierend auf den bisher konsumierten Inhalten passende neue Songs oder Serien vorzuschlagen. 

Deep Dive gewünscht? In unserem Blog zeigen wir, was man zu Data Lakes auf Azure wissen muss und erklären in einem Whitepaper, wie ein Data Lake auf AWS eingerichtet wird.