SAP & Data Warehouse vs. Data Lake

Ich erinnere mich gut an einige Gespräche mit dem Fachbereich, bei denen mein Gegenüber der Meinung war, Big Data ist, wenn Excel nicht mehr ausreicht. Und dafür hätte man dann ja z. B. SAP BW.

Interessanterweise ist das auch oft das Bild, welches man durchaus bekommen kann. Oft werden Begriffe undifferenziert verwendet und Schlagwörter verwendet wie „wenn wir HANA haben, dann sind alle unsere Probleme gelöst“.

Gut das selbst die SAP mittlerweile erkannt hat, das HANA evtl. doch nicht die Eierlegende Wollmilchsau ist und an der einen oder anderen Stelle auf ergänzende Technologien angewiesen ist. HANA Vora (seit 03/2016 GA) ist so ein Beispiel.

Aber schon zuvor hat sich SAP gemeinsam mit Hortonworks an einer Big Data Reference Architecture versucht. Und wirbt gerne auch direkt bei den CIO’s mit ihrem Angebot, Big Data in den Griff zu bekommen.

Nun, wenn das DWH schon für Big Data steht, wofür benötigt man eigentlich ein HANA Vora oder gar ein Data Lake? Im folgenden möchte ich die beiden Konzepte etwas besser voneinander abgrenzen. Zuvor jedoch soll noch erwähnt sein, dass  DATAVERSITY einen empfehlenswerten Übersichtsartikel zu dem Thema bietet, welcher mich auch dazu inspiriert hat, hier einmal zu schauen, wo SAP sich dabei sieht..

Die erste Erwähnung und Prägung des Begriffs „Data Lake“ stammt wohl vom Chief Technology Officer von Pentaho:

If you think of a datamart as a store of bottled water – cleansed and packaged and structured for easy consumption – the data lake is a large body of water in a more natural state. The contents of the data lake stream in from a source to fill the lake, and various users of the lake can come to examine, dive in, or take samples.

– James Dixon, CTO Pentaho
Quelle: https://jamesdixon.wordpress.com/2010/10/14/pentaho-hadoop-and-data-lakes/

SAP hat aus meiner Sicht hier für kompakte 2 1/2 Minuten gar nicht schlecht ihre Sichtweise für die Bedeutung eines Data Lakes dargestellt.

Wie bekommt man den nun ein Gefühl, wie sich Data Lake tatsächlich von Data Warehouse abgrenzt?

DWHvsDL

Die dargestellten Aspekte zeigen gut, dass ein Data Lake und ein Data Warehouse durchaus sich ergänzenden Ansätze darstellen. Nur weil in den letzten Jahren neue Datenquellen relevanter und verwertbarer geworden sind, sind bisherige Ansätze nicht obsolet. Jedoch muss man auch sehen, dass, obwohl gewisse Ansätze und Zielsetzungen recht ähnlich sind, der Skill und die Herangehensweise doch sehr unterschiedlich sein können.

In ihrer Roadmap zeigt die SAP, dass Sie hier eine gemeinsame technologische Architektur mit einer zentralen HANA-Plattform sieht, in der in einer absehbaren Zukunft auch das SAP BW im HANA Data Warehouse aufgehen wird:

SAP HANA DW-Roadmap

Dabei hat eben auch HANA Vora seinen Platz und wird als verbindender und integrierter Bestandteil zwischen Hadoop und HANA in dieser zukünftigen SAP HANA Data Warehousing Plattform dargestellt:

HANA_DW_Plattform

Die Zeit wird zeigen ob diese doch verschiedenen Ansätze tatsächlich sinnvoll kombiniert werden können und evtl. das eine Konzept in dem anderen aufgeht. Oder ob die Ansätze nur eine theoretische Möglichkeit darstellen, mit welcher man schön Marketing machen kann, welche so jedoch nicht Realität werden wird.

Advertisements

BW vs. S/4 HANA

Viel wird diskutiert darüber, ob mit einer S/4 HANA oder eben auch noch einer Suite on HANA ein SAP BW (on HANA) überhaupt noch notwendig ist.

Schon die Frage ist falsch gestellt. Den es gibt schon abgesehen von der Unternehmensrealität gänzlich verschiedene Grundsituationen.

Beispielsweise hat die DSAG bereits 8 grundlegende Szenarien für Analytics on HANA unterschieden:

8 HANA Bausteine

Quelle: DSAG-Leitfaden SAP HANA

Dann stellt sich ja nicht nur die Frage, BW oder ERP on HANA. Es gibt auch ein embedded BW oder ein HANA DW welche in diesem Zusammenhang wieder ganz andere Aspekte hineinbringen und zu berücksichtigen haben. Genauso kann die aktuelle Prüfung von Cloud-Angeboten eine Rolle spielen. Auch ist ein bestehendes SAP BW-System, in welches man bereits über Jahre viel investiert hat, doch ein starkes Kriterium gegen eine Ablösung durch ein ERP-basiertes Reporting.

Aus meiner Sicht favorisiert und kommuniziert die SAP die Ansätze HANA Live und S/4 HANA Analytics für operatives Reporting in einem Kontext, der i. d. R. auf das eine System und die darin regulär vorkommenden Daten beschränkt ist.

Trotzdem will ich im folgenden eine kurze Übersicht über Aspekte geben, welche eine erste Orientierung geben können, wann S/4 HANA evtl. ausreicht oder nach wie vor ein SAP BW, evtl. eben auch „on HANA“, sinnvoll ist.

BWvsS4HANA

Quelle: eigene Recherchen, DSAG-Leitfaden, Erfahrungswerte

Zuletzt ist jedoch immer eine individuelle Betrachtung der eigenen Situation, sowie der zukünftigen Planung entscheidend.

SAP BO Web Intelligence

SAP BusinessObjects Web Intelligence, gerne auch als WebI abgekürzt und im Weiteren so verwendet, gehört wohl zu den ältesten noch immer im Einsatz befindlichen BO BI-Werkzeugen.

Lt. Wikipedia lässt sich WebI bis 1997 zurückverfolgen. Lt. SAP ist WebI „Web-based reporting and analysis as part of an integrated BI platform solution“

WebI kommt mit eine Thin-(Web) und einem Rich-Client (Desktop) daher und ist tief in die SAP BI Plattform integriert. So habe ich mir das einerseits schon von SAP-Leuten sagen lassen, andererseits sieht man dies bspw. auch an den differenzierten Möglichkeiten, für das Werkzeug die Berechtigungen zu steuern. Auch ist WebI untrennbar mit dem BI-LaunchPad verbunden und kann im Prinzip garnicht separat installiert werden. Auch als Rich-Client kommt es als Teil der BO Client-Tools daher und nicht als einzelnes Installationspaket. Dies zieht sich bis zur Dokumentation durch, welche unter der BI-Plattform-Doku zu finden ist.

Funktional ist WebI sicherlich kein OLAP-Tool, auch wenn sich bspw. Drill-Möglichkeiten bieten. Es kann aber gut das Spektrum von Standardreporting bis hin zum ansprechenden Dashboard abdecken. Bekannt ist es auch stark für Ad-hoc-Reporting. Also dem schnellen Erstellen eines Berichts zu einer konkreten Fragestellung. Da WebI doch sehr Self-Service-like ist, erfreut es sich, was ich so höre, in den Fachbereichen großer Beliebtheit.

Als Datenquellen stellen Universen eine umfassende Möglichkeit in der BO-Welt dar. Aber auch BEx-Queries, HANA-Zugriff oder Freehand SQL auf Datenbanken sind möglich.

WebI war nach meinem Gefühl eine Zeit lang nicht im Fokus der BI-Entwicklung der SAP. Mittlerweile zeigt sich in den letzten Releases jedoch ein starker Innovationsschub.

Im Rahmen der Vereinfachung des BI-Tool Portfolio der SAP hat WebI klar seinen Platz neben Crystal Reports für den Bereich Reporting.

sap BI convergence

Quelle: ASUG

Da die Releases mit der BI-Plattform mitgehen, ist WebI aktuell (18.08.2016) im Release 4.2 SP3 verfügbar.

 

William Playfair

William Playfair (1759 – 1823) war ein schottischer Ingenieur und Volkswirt.

Playfairs Beitrag zu Business Intelligence ist die Erfindung und erste bekannte Verwendung des Kuchen– sowie des Balkendiagramms. Darüber hinaus wird ihm auch noch das Linien- und Zirkeldiagramm zugeschrieben.

Playfair veröffentlichte zwei Bücher über Volkswirtschaft, in denen er stark auf den Einsatz von Diagrammen baute:

The Commercial and Political Atlas (1786) – mit 43 Zeitreihenanalysen und wahrscheinlich dem ersten Balkendiagramm.

Statistical Breviary (1801) – mit dem ersten bekannten Kuchendiagramm.

Zitat:

Figures and letters may express with accuracy, but they can never represent either number or space.

William Playfair, Atlas, 1st ed., 1786, p.3.