Data Lakes als Chance und Herausforderung für moderne BI.
Die Business Intelligence vollzieht derzeit große Veränderungen, um den Anforderungen, die durch Big Data entstanden sind, gerecht zu werden. Laut einer Studie des IDC wird sich die jährlich generierte Datenmenge bis zum Jahr 2025 um den Faktor zehn vergrößern (von 33 Zettabyte auf 175 Zettabyte). Da Unternehmen vermehrt danach streben, aus Daten verschiedener Systeme (ERP, DWH, NoSQL, Webseiten, Social Media) neue Erkenntnisse zu gewinnen, benötigen die jetzigen BI-Lösungen eine Erweiterung, um für steigende strukturierte und unstrukturierte Datenmengen gewappnet zu sein.
Die bisherigen, konventionellen Data Warehouses (DWH) erreichen ihre Grenzen, wenn Terrabyte an Daten aus den verschiedensten Quellen aggregiert und gespeichert werden müssen. An dieser Stelle setzen Data Lakes (DL) an. Da es sich mehrheitlich um unstrukturierte Daten handelt, sind diese nicht direkt verwertbar. Trotzdem können die Daten für Unternehmen, zu einem späteren Zeitpunkt, eine wichtige Quelle für Auswertungen und Unternehmensausrichtungen sein.
In diesem White Paper zeigen wir, was für die Einrichtung eines Data Lakes notwendig ist und wie man auf diesen reporten kann. Die ganze Infrastruktur wird auf AWS Basis nach dem best-practice-Ansatz realisiert. Darüber hinaus werden wir einen aktuellen Bug beseitigen, welcher das Ausrollen der Infrastruktur verhindert.