Data Warehouse
Übersicht
zuletzt besuchte Definitionen...
1. Begriff: Ein Data Warehouse (DWH) ist ein Datenhaltungssystem dispositiver Daten, das von den operativen Datenbeständen getrennt, themenorientiert aufbereitet und logisch zentralisiert ist. Ein DWH integriert unternehmensweit Datenbestände aus verschiedenen operativen internen Systemen (z.B. Kernbanksystemen und Enterprise-Ressource-Planning-Systemen) sowie externen Systemen (z.B. Börseninformationssystemen und Systeme für externe Ratings) und dient idealtypisch als unternehmensweite, einheitliche und konsistente Datenbasis für alle Arten von Systemen der Entscheidungsunterstützung. Das Data Warehouse ist i.d.R. eine Kernkomponente umfassender Business-Intelligence-Konzepte. Aufgrund von verschärften regulatorischen Anforderungen aus v.a. europäischen Aufsichtsbehörde (z.B. BCBS 239), setzen immer mehr Banken DWHs als zentrale Softwarekomponenten ein, um solche Anforderungen zu erfüllen.
2. Merkmale: Die Definition des Data Warehouses wurde von W.H. Inmon stark geprägt. Er charakterisiert ein Data Warehouse mithilfe von vier Eigenschaften: vgl.
a) Themenorientierung: Dispositive Daten des DWH sind explizit an den Interessenslagen der Entscheidungsträger ausgerichtet. So werden die operativen bzw. externen Daten in ihrer Ausrichtung für die Ablage im DWH aufbereitet und z.B. auf Kunden-, Produkt- oder Lieferantensicht transformiert.
b) Integration: Daten aus den unterschiedlichen operativen und externen Quellen werden im DWH zu einer inhaltlich widerspruchfreien Datensammlung zusammengeführt.
c) Zeitraumbezug: Während Daten in operativen Quellsystemen in der Regel transaktionsorientiert und somit zeitpunktbezogen abgelegt werden, repräsentieren Daten im DWH meist einen Zeitraum, z.B. einen Tag, eine Woche oder einen Monat.
d) Nicht-Volatilität: Daten im DWH werden dauerhaft abgelegt und für die Analyse zur Verfügung gestellt. DWH-Daten werden somit in der Regel nicht mehr geändert, überschrieben oder entfernt.
3. Teilkomponenten eines DWH-Konzepts: Üblicherweise besteht ein unternehmensspezifisches DWH-Konzept aus einem Konglomerat verschiedener dispositiver Datenhaltungssysteme, die sich primär durch ihre Verdichtungsgrade und ihre Applikationsorientierung unterscheiden.
a) Rückgrat der meisten Ansätze ist hierbei ein sog. Core Data Warehouse (C-DWH). Seine Befüllung erfolgt meist über sog. ETL-Prozesse (Extraktion, Transformation, Laden) direkt aus den operativen internen und externen Quellsystemen bzw. aus vorgeschalteten, unten näher erläuterten Operational Data Stores (ODS). C-DWHs basieren meist auf relationalen Datenhaltungssystemen, sind weitestgehend applikationsneutral modelliert und können heute Datenvolumina bis in den Terabyte-Bereich aufweisen.
b) Häufig werden C-DWHs nicht direkt für die Analysezwecke herangezogen, sondern dienen primär der Befüllung sog. Data Marts. Diese sind kleinere Datenpools, die üblicherweise für einen eingeschränkten Benutzerkreis aufgebaut und auf deren Applikationsfeld ausgerichtet werden.
c) Ein Operational Data Store (ODS) beinhaltet als Vorstufe eines C-DWHs aktuelle, transaktionsorientierte Daten aus verschiedenen Quellsystemen und stellt sie für spezielle Anwendungs- und Auswertungszwecke bereit. Operational Data Stores verfügen meist über keine Mechanismen der Historienbildung, so dass ein ODS in Abgrenzung zum DWH primär eine zeitpunktbezogene, volatile Datenhaltung darstellt. Ein ODS kann somit eine Vorstufe eines DWHs bilden und gleichzeitig als konsistente Datenquelle für geschäftsprozessorientierte Anwendungssysteme fungieren, die historisch gewachsene, meist funktional ausgerichtete IT-Landschaften auf der Datenebene integriert.
4. DWH-Implementierungsansätze: Die Nutzung eines DWHs im konkreten Applikationsumfeld (Analyseumfeld) wird als Data Warehousing bezeichnet. Hierbei können grundsätzlich vier Implementierungsvarianten unterschieden werden: das klassische, Real-time, Closed-loop und Active Data Warehousing.
a) Klassisches Data Warehousing erlaubt im Rahmen der Analyse ausschließlich lesende Zugriffe auf das in periodischen Abständen zu aktualisierende Data Warehouse. Diese Art der Datenversorgung ist die ursprüngliche, nach W. H. Inmon definierte Form der Datenanbindung und findet primär bei standardisierten Planungs- und Kontrollsystemen mit kurz- bis mittelfristigem Entscheidungshorizont Einsatz.
b) Closed-loop Data Warehousing ermöglicht Rückkopplungen von Analyseergebnissen in die operativen und sonstigen dispositiven Datenbestände. Hierbei werden die Datenbestände um Zusatzinformationen erweitert, welche für die Entscheidungsumsetzung oder weitere Analysen von Relevanz sein können. Ein typisches Anwendungsgebiet findet sich im Customer Relationship Management. Hier können beispielsweise die auf der Basis von Business-Intelligence-Analysen identifizierten relevanten Kundensegmente als Zusatz- bzw. Strukturinformationen in die operativen Daten integriert werden, um eine automatisierte Kampagnendurchführung mit diesen Zielgruppen zu ermöglichen.
c) Real-time Data Warehousing bezeichnet die direkte, transaktionsnahe Datenversorgung des DWH, so dass die Analysesysteme auf harmonisierte Echtzeitdaten aufsetzen können. Typische Anwendungsgebiete liegen demnach im Bereich der zeitkritischen Analysen, wie sie z.B. bei Börsen und Banken im Kontext des Wertpapierhandels von Relevanz sind.
d) Active Data Warehousing setzt auf dem Closed-loop Data Warehousing auf und erweitert die Analysen um operative Komponenten, indem automatisierte Aktionen aufgrund spezifischer Datenkonstellationen angestoßen werden. Auf diese Weise lassen sich strukturierte, wiederkehrende Entscheidungssituationen wirkungsvoll unterstützen, z.B. im Rahmen der Lösung von logistischen Optimierungsproblemen im Liefer- und Frachtbereich. Abschließend lässt sich konstatieren, dass die o.a. Implementierungsansätze der wirksamen Entscheidungsunterstützung unterschiedlicher betrieblicher Problemstellungen dienen. Die Ansätze (Closed-loop, Realtime und Active Data Warehousing) vervollständigen auf diese Weise die traditionellen Lösungen, machen diese aber keineswegs obsolet. Aus diesem Grund werden in leistungsfähigen DWH-Konzepten in aller Regel mehrere Data-Warehousing-Ansätze parallel realisiert, deren konkrete Ausgestaltung stets organisationsindividuell vor dem Hintergrund der realen Anforderungen der Unternehmung zu erfolgen hat.