Twitter SAP Analytics Flash 07/2019

Aus Spaß einfach mal ein Stück weit, was sich in der Twittersphäre so tut. In kompakter Form. Allein wenn man mal wie hier rund 2 Wochen zurück geht, zeichnet sich ein recht klarer News-Flow Gewinner in der SAP Analytics Twittersphere ab.

SAP Analytics allgemein

Ein Highlight zuletzt war die DSAG Handlungsempfehlung zu „Zukunftsorientiere Analytische Plattformen„, die auf hoher Flughöhe zeigt, wie man mit SAP-Mitteln einen ganzheitlichen, modernen Ansatz für Analytics schaffen kann.

Daneben freut man sich natürlich immer über eine gute Research-Platzierung wie hier im neusten BARC BI Score.

SAP Analytics Cloud

Zunehmend fließt SAC in die verschiedenen, vor allem Cloud-basierten Tools wie SuccessFactors ein. Das Thema People Analytics wird hier groß geschrieben. Tammy Powlas dokumentiert für uns den aktuellen Stand der Planning-Roadmap für SAC. Auch die Smart Predict-Funktion integriert sich hier bereits gut in die Plannung. SAC liefert flexible Möglichkeiten, eigene berechnete Dimensionen (Measure Based Calculated Dimension) anzulegen. Warum man überhaupt in Richtung SAC gehen sollte, erklärt uns Ingo Hilgefort. Er geht aber gerne auch mal in die Details und erklärt, wie Simulationen wie das Minimum Wage Analysis Scenario in SAC umgesetzt werden können. Mittlerweile bietet SAP zum Einstieg sogar Expert-guided Implementation an. Zuletzt kam das 14. Release von SAC mit natürlich jeder Menge neuer Funktionen heraus. Und als ein Major Highlight kann der zuletzt eingeführte Analytics Designer angesehen werden, der den Einsatz von Scripting erlaubt. Ein spannendes Thema mit SAP und CloudFoundry ist IoT, wie hier gezeigt wird. Aber natürlich nie die Sicherheitsaspekte vernachlässigen. Beim Thema Integration wurde eine ganze Tutorial-Serie für HANA Service in der SAP Cloud Platform durch die HANA Academy zur Verfügung gestellt.

SAP BusinessObjects BI

SAP BO BI 4.3 steht an. Wenn auch erstmal in der Beta-Phase. Auf was man sich alles freuen kann, findet man schonmal bei SAP-Partner 360Suite.

HANA Analytics

Wie man mit Smart Data Integration (SDI) in CloudFoundry arbeitet, wird in diesem Blog erklärt. Wer sich für die Neuerungen in SDI und SDQ interessiert wird hier mit dem Nötigsten versorgt. Die Möglichkeiten der Nutzung von R mit HANA werden gut hier gezeigt. Wer lieber den Zugriff und die Verarbeitung mit Python mag, freut sich über dieses End to End Machine Learning Scenario.

SAP Data Warehousing

VisualBI zeigt uns, welche Veränderungen sich in der DSO-Modellierung von BW/4HANA 1.0 auf 2.0 ergeben haben. Wie BW/4HANA gut mit S/4HANA zusammenarbeitet, zeigt uns SAP-Partner Itelligence UK. Mit der Vora-Technologie kann der Data Warehouse-Ansatz auf einen Data Lake ausgedehnt werden. Wer hier bzgl. Hadoop mal eine Einführung möchte, dem wird hier geholften. Gleichzeitig startet das Data Warehouse Cloud bald mit spannenden Features in die Beta-Phase.

SAP Data Hub

Wie SAP Data Hub mit der Process Mining Software Celonis Snap zusammen arbeitet zeigt uns Frank Schuler. Genauso zeigt er, wie man mit Lineage Informationen besser Vertrauen zu seinen Daten aufbauen kann.

S/4HANA Embedded Analytics

Insight to Action wird hier durch die richtige KPI Tile ermöglicht. Selbst kleinen Herausforderungen wie der Darstellung von Prozentzeichen wird sich aktuell angenommen.

SAP HANA – What’s New SDI/SDA Journey

Smart Data Integration (SDI) und Smart Data Access (SDA) sind die Technologien zur Integration von non SAP-Daten in die HANA Datenbank. Dabei werden drei Arten der Integration unterschieden. Batch, Real-time und virtuell. Die Kommunikation mit den Quelldatenbanken bei SDA findet über ODBC statt.

Smart Data Access wird als ein Weg gesehen um Smart Data Integration für den virtuellen Zugriff auf Tabellen zu implementieren.

SAP HANA 1.0 SPS06: Ab hier ist Smart Data Access (SDA) verfügbar.

2
Virtuelle Tabellen als Kernkonzept von SDA – SAP, 2017

SAP HANA 1.0 SPS07: Neue Datenquellen wie Oracle 12c, Microsoft SQL Server 11 und Hadoop Hortenworks HDP 1.3 sind verfügbar. Virtuelle Tabellen können u. a. in Calculation Views verwendet werden.

SAP HANA 1.0 SPS08: Neue Datenquellen sind IBM DB2 UDB ver10.1 und Netezza ver7. Analytic und Attribute Views werden nun unterstützt.

SAP HANA 1.0 SPS09: Ab hier ist Smart Data Integration (SDI) verfügbar. Für Real-time Integration wird die Sybase Replication Server Technologie für Change Data Capture für ausgewählte Quellen genutzt. Batch ist für alle Quellen möglich. Es gibt ein Adapter Framework auf Basis einer Java oder C++ API. Unter anderem kam ein Twitter und OData Adapter hinzu. Über Replication Tasks in der Web-based Development Workbench kann Real-time Replikation gesteuert werden. Im Data Flow UI können komplexe Real-time und Batch Transformationen eingerichtet werden.

1.PNG
Smart Data Integration – SAP, 2014

SAP HANA 1.0 SPS10: Für folgende Adapter kann in flowgraphs ein Data Sink-Node erstellt werden, welcher Daten zurück schreibt: ASE, File, HANA, Teradata, DB2, Oracle und MSSQL. Die bisherige Data Flow UI wird durch flowgraphs ersetzt. Neu sind hier SDQ-Funktionalitäten wie Cleanse und Match. Die Tabellensuche in Remote Sources wird nun unterstützt. Neu wird auch Dynamic Tiering in flowgraphs unterstützt. SDA bringt einen Spark SQL-Adapter mit. DP Agent Groups werden als failover-Konzept eingesetzt.

SAP HANA 1.0 SPS11: Für SDA ist das Monitoring im HANA Cockpit neu, wie dies auch schon im HANA Studio verfügbar war. Für MSSQL, Oracle und DB2 können SDA-Quellen in SDI-Quellen konvertiert werden. Andersherum können SDI-Quellen für SDA genutzt werden (Lizenz vorausgesetzt). SDI unterstützt nun Workload Management. Außerdem kann auf neue Remote-Quellen zugegriffen werden (SAP ERP-Tabellen und ODP DataSources für BW, MS Excel und SOAP Web Services, CamelAdapter und CamelFacebookAdapter). Flowgraphs werden an vielen Stellen wie JIT Data Preview, neue Datenquellen (Virtual Functions, SQL Views und Calculation Views) und Hierarchische Transformationen (XML/SOAP).

SAP HANA 1.0 SPS12: SDA unterstützt nun die UPSERT-Funktion. SDI-Quellen können mit SDA nun ohne zusätzliche Lizenz genutzt werden. SDI liefert neue Adapter für Google+, Outloook PST und Informix. OData und HDFS werden als Ziele unterstützt. Eine neue Monitoring UI für Flowgraphs und Replication Tasks ist verfügbar. E-Mail Benachrichtigungen für verschiedene Zustände sind nun verfügbar. Data Masking für Transformationen ist neu. Der Flowgraph Editor wurde an vielen Stellen erweitert.

SAP HANA 2.0 SPS00: SDA wurde im Bereich virtuelle Tabellen bei der Synchronisation von Metadaten und dem Result Caching verbessert. Mittels eines neuen ODBC Adapters für Vora kann direkt auf Hadoop zugegriffen werden. SDA kann nun im HANA Cockpit 2.0 gemonitort werden. Bei SDI ist Flowgraph in XSA ein neues Feature. Mit Task Partitioning wurden Datenmenge und Performance in XSC und XSA verbessert. MS Access wurde als Adapter erweitert sowie an weiteren Adaptern Verbesserungen vorgenommen.

SAP HANA 2.0 SPS01: SDA Virtuelle Tabellen können ab sofort transportiert werden. Mit dem Feature Linked Tables müssen Virtuelle Tabellen bei HANA zu HANA-Verbindungen nicht mehr explizit definiert werden. Dabei sind neue Berechtigungen zu berücksichtigen. Für SDI ist in XSA ein neuer File Format Editor verfügbar und XSA Flowgraphs wurden um verschiedene Transformationen (Pivot, Unpivot, Match) erweitert. Für den Data Provisioning Agent (DPA) gibt es ein neues Command Line Interface. Neue Adapter für PostgreSQL, Apache Impala und Camel JDBC wurden zur Verfügung gestellt sowie viele Adapter erweitert.

SAP HANA 2.0 SPS02: SDA unterstützt nun für einige Datenbanken Ausfallsicherheit für Remote Sources, indem beim Ausfall des Remote active worker node auf den Remote standby node zurückgegriffen wird. Für ODBC-Verbindungen kann nun zwischen einem high performance mode über den Indexserver (für SAP-Quellen) oder einen safe mode über den Script Server (3rd Party). In SDI wurden diverse Adapter erweitert (ASE, Excel, CamelFacebook, …). In XSA Flowgraphs werden nun PAL-Aufrufe unterstützt und Virtuelle Tabellen können als Datenziel dienen.

SAP HANA 2.0 SPS03: SDA ermöglicht nun den virtuellen Zugriff auf Spatial Daten in anderen HANA-Systemen. SDA wird nun auch im SAP HANA Database Explorer unterstützt. In SDI werden hauptsächlich Erweiterungen bei Adaptern und in Flowgraphs umgesetzt.

SAP HANA 2.0 SPS04: SDA wird um das Generic Adapter Framework erweitert, durch welches die Anpassung an Remote Sources vereinfacht wird. Im Weiteren wird DDL für Remote Sources unterstützt. Für SDI unterstützt der DP Agent Load Balancing, Whitelisting für Quelltabellen und das Abschalten von Adapter Writeback. Der Zugriff auf Cloud Foundry bzw. HANA as a Service wird nun unterstütz. Auch einige Cloud Datenbanken bei AWS und Azure werden nun unterstütz. Replication Tasks sind nun in XSA/Web IDE verfügbar.

3
SDA Generic Adapter Framework – SAP, 2019

 

Soweit zum Stand SDI/SDA. Weitere Quellen:

2180119 – FAQ: SAP HANA Smart Data Access

1868209 – SAP HANA Smart Data Access 1.0 Master Release Note

2352696 – SAP HANA Smart Data Access 2.0 Master Release Note

2600176 – SAP HANA Smart Data Access Supported Remote Sources

2400022 – FAQ: SAP HANA Smart Data Integration (SDI)

 

SAP HANA – What’s New PAL Journey

Im Folgenden ein Überblick über die Neuerungen (auf Basis der What’s New-Präsentationen) zu SAP HANA Predictive Analysis Library (PAL) von SAP HANA 1.0 SP06 bis SAP HANA 2.0.

PAL wurde bereits mit SPS05 unter dem Framework Application Function Library neben der Business Function Library (BFL) gestartet. Die Bereitstellung erfolgte initial nur über SQL Skript. Die Implementierung erfolgte in C++ als Teil der HANA-Datenbank.

SAP HANA 1.0 SPS06: Mit diesem SPS wurden bereits 28 Algorithmen für Data Preparation und Machine Learning/Data Mining zur Verfügung gestellt. Darunter C4.5, CHAID, diverse Regressionsalgorithmen, Apriori, K-Means oder DBSCAN. Ab hier wurde der Application Function Modeler (AFM) als grafischer Editor zusätzlich verfügbar gemacht.

SAP HANA 1.0 SPS07:  (Ca. 11/2013) Ziel war es, die Implementierung komplexer Algorithmen zu vereinfachen bzw. Alternativen bereitzustellen. Hier kamen neue Uni- und Multivariate statistische Methoden (Mittelwert, Median, Varianz, Schiefe, Chi-Quadrat Test, F-Test, …), die Behandlung von fehlenden Werten und die Partitionierung von Datensets hinzu. Neue Algorithmen waren u. a. Support Vector Machine (SVM), Forecast Smoothing, Agglomeratives hierarchisches Clustering. Auch gab es Optimierungen und Erweiterungen an verschiedenen Algorithmen. Des weiteren wurde die AFM-Unterstützung verbessert.

1
Application Function Library Framework in SAP HANA (SAP, 2013)

SAP HANA 1.0 SPS08: (Ca. 05/2014)  Hier wurden im Schwerpunkt Erweiterungen auf Basis der Priorisierung durch Kunden und anderen Stakeholder gemacht. 8 Algorithmen kamen hinzu (FP-Growth, CART, K-Medoid, ARIMA, Distribution Fit, Cumulative Distribution Function, Quantilfunktion, Random Distribution Sampling). Wieder wurden Erweiterungen wie die automatische Handhabung fehlender Werte durchgeführt.

SAP HANA 1.0 SPS09: (Ca. 11/2014) Ebenfalls 8 neue Algorithmen wie Top K Rule Discovery, Back-Propagation, Croston Method und Principal Component Analysis (PCA) kamen hinzu. An der AFL wurden Änderungen vorgenommen und Berechtigungen erweitert. Der AFM wurde Re-Designed (HANA Studio) und um Funktionen zu flowgraphs erweitert, welche u. a. auch die Integration von R-Scripts ermöglichen.

SAP HANA 1.0 SPS10: (Ca. 06/2015) In den SPS sind 7 neue Algorithmen ergänzt worden. U. a. Confusion Matrix, Gaussian Mixture Model (GMM) und Latent Dirichlet Allocation (LDA). Daneben wurde das Fehlerhandling verbessert und die PAL-Integration mit Seriendaten und Window Funktionen eingeführt. Mit SPS 10 wurde auch der web-basierte Editor (Web-based Development Workbench) eingeführt.

SAP HANA 1.0 SPS11: (Ca. 12/2015) 6 neue Algorithmen werden hier zur Verfügung gestellt, darunter Random Forest, Kaplan-Meier Survival Analysis und Area under curve (AUC). Für Smart Data Streaming wurden Algorithmen wie Adaptive Hoeffding Decision Tree und DenStream eingebettet.

2
Smart Data Streaming in SPS11 – SAP, 2018

SAP HANA 1.0 SPS12: (Ca. 05/2016) In dem SPS kam Auto-ARIMA für Zeitreihenanalyse sowie Erweiterungen zu bestehenden Algorithmen hinzu. Für Scale-out-Szenarien kamen verteilte Berechnungen über den Node Script Server hinzu.

SAP HANA 2.0 SPS00: (Ca. 12/2016) Mit dem SPS wurden 8 Algorithmen auf insgesamt 91 Algorithmen erweitert. Unter den neuen Algorithmen sind Gradient Boosting Decision Trees, Fast Fourier Transform (FFT) und Sequential Pattern Mining. Technisch wurde die parallele Ausführung von Scoring-Funktionen auf partitionierten Daten erweitert.

SAP HANA 2.0 SPS01: (Ca. 04/2017) 6 Algorithmen wurden hier erweitert (u. a. Accelerated K-Means, ANOVA oder T-Test). Als neue Algorithmenklasse kam Recommender Systems mit Factorized Polynomial Regression hinzu. Im Bereich Ausreißeranalysen kam One Class SVM hinzu. Ebenso ist Real Time Scoring hinzugekommen.

SAP HANA 2.0 SPS02: (Ca. 07/2017) 2 Algorithmen im Bereich Data Preparation wurden ergänzt (Factor Analysis und Multi dimensional scaling). Seit diesem SPS kam die Möglichkeit zur Integration von TensorFlow hinzu (External Machine Learning – EML). Auch wird ab hier PAL über die Web IDE supported. Die Schnittstelle zum Aufruf der PAL-Funktionen wurde vereinfacht. Auch Treiber für Python sind ab hier verfügbar. Weitere Funktionen für das im vorherigen SPS eingeführten Real Time Scoring wurden ermöglicht.

3
SAP HANA TensorFlow Integration – SAP, 2017

 

SAP HANA 2.0 SPS03: (Ca. 04/2018) SAP stellt das Machine Learning Portfolio unter dem Namen SAP Leonardo neu auf. Auch kommt das SPS Data Scientists mit Resampling und Hyperparametersuche entgegen. 4 neue Algorithmen kommen hinzu (Hierarchical Forecasting, Alternating Last Squares, Field-aware Factorization Machines und PageRank). Der Python-Zugriff wird durch die Unterstützung von SQLAlchemy verbessert.

4
SAP Leonardo Machine Learning Portfolio – SAP, 2018

SAP HANA 2.0 SPS04: (Ca. 05/2019) Neben Python wird nun auch eine R API für das direkte Arbeiten mit R auf HANA zur Verfügung gestellt. Neue Algorithmen sind u. a. Hybrid Gradient Boosting Tree, Change Point Detection, Conditional Random Fields und Regression Comparison Function. Insgesamt 10 Neue. Die Automated Predictive Library (APL) ist nun Teil von SAP HANA.

Soweit nun die Reise der PAL-Bibliothek bzw. zunehmend auch weiterer Möglichkeiten wie APL, Streaming Analytics, Tensorflow, R und Python.

Viele Technologien rund herum unterstützen die analytischen Fähigkeiten der SAP HANA Platform.

 

Research: Cloud Data Warehouse

Seit kurzem scheint das Thema „Cloud Data Warehouse“ (CDW) im Trend zu sein. Zumindest Forrester hat für Q4/2018 eine eigene Forrester Wave herausgegeben genau zu dem Thema. Darin wurden 14 Anbieter untersucht.

Forrester definiert das Cloud Data Warehouse wie folgt (frei übersetzt):

Ein sicheres, skalierbares On-Demand Self-Service Data Warehouse, welches die Datenbeschaffung, Administration, Tuning, Backup und Recovery automatisiert um Analytics und wertvolle Erkenntnisse bei gleichzeitiger Minimierung der administrativen Anforderungen zu liefern.

– The Forrester Wave™: Cloud Data Warehouse, Q4 2018

Nachdem GA für SAP Data Warehouse Cloud erst für Q4/2019 angekündigt ist, sind andere Anbieter hier schon deutlich länger auf dem Markt, z. B.:

  • Google Big Query (11/2011)
  • Amazon Redshift (10/2012)
  • Snowflake Computing (06/2015)
  • Microsoft Azure SQL Data Warehouse (07/2016)
  • Oracle – Autonomous Data Warehouse Cloud (03/2018)

In sofern ist SAP in The Forrester Wave auch nicht vertreten bzw. hat offensichtlich den Kriterien der Untersuchung nicht genügt.

Im Magic Quadrant von Gartner (01/2019 – Gartner Magic Quadrant for Data Management Solutions for Analytics) findet SAP noch seinen Platz und auch der Cloud-Trend bleibt nicht unbemerkt. Eine Abgrenzung wird von Gartner hier jedoch noch nicht vorgenommen. Somit wird BW/4HANA, HANA selbst (welche jedoch als in der Cloud verfügbar wahrgenommen wurden) sowie der SAP Cloud Platform-basierte Big Data Service analysiert. Trotz Kritikpunkten bei Themen wie der Elastizität wird beispielsweise die Multi-Cloud Strategie positiv hervorgehoben und SAP ist bei Gartner im Leader-Quadranten vor Anbietern wie Snowflake, IBM und Google zu finden.

Bei Forrester sind die Leader ganz klar Amazon Web Services (AWS), Snowflake, Google und auch noch Oracle.

2017 hat BARC im ihrer Reseach Study „BI and Data Management in the Cloud: Issues and Trends“ folgende Feststellung gemacht (frei übersetzt):

Unternehmen betreiben eher BI (Frontend)-Anwendungen in der Cloud als Data Warehouses, Data Marts oder Datenintegration.

Data Management-Lösungen benötigen IaaS und PaaS sowie die Prüfung von Datenschutz, Datensicherheit und unternehmenspolitischer Aspekte.

In der BARC Research Study „Datenmanagement im Wandel“ von 2014 zeigt sich ein noch viel nüchterneres Bild:

  • Bei der Frage, was sich aktuell konkret verändert, antworteten nur 6% mit „Rückgriff auf cloud-basierte Data Warehouse“
  • Die Frage nach dem Umgang mit Self-Service BI beantworteten gerade mal 2% mit „Auslagerung in die Cloud“
  • Im Vergleich zu anderen Ansätzen war die Lösung „Cloud-basierte Data Warehouse-Lösungen“ zur einfacheren Umsetzung von DWH-Anforderungen weit abgeschlagen. Wichtiger waren „In-Memory Datenbanksysteme“, „Automatisiertes DWH“, uvam.

Im Whitepaper „Cloud Data Warehouse Trends for 2019“ wird nun jedoch die Frage aufgeworfen, ob das CDW gar der Schlüssel zur Digitalen Transformation ist. Die Antwort folgt schnell. Das CDW wird als wichtiger erster Schritt zum datengetriebenen Unternehmen gesehen.

Lt. Whitepaper sind die Top-Gründe für das CDW:

  • Flexibles Kostenmodell
  • Vorteil der Nutzung von Cloud-Features
  • Bessere Performance

Typische Anwendungsfälle sind:

  • Kundenanalysen für das Marketing
  • Finanzanalysen
  • Vertriebsunterstützung
  • Anbindung an einen Data Lake für Analytics
  • Kundenserviceanalysen
  • IT-Analytics

Die größten Herausforderungen dabei sind:

  • Data Governance
  • Integration von Daten aus unterschiedlichen Quellen
  • Daten in das Data Warehouse zu bekommen
  • Einfacher Datenzugriff für den Anwender
  • Kosten

Nun gut, es zeigt sich, dass Thema Cloud Data Warehouse ist nicht neu. Der Self-Service Trend hat jedoch das Angebot sicherlich verändert. So positioniert SAP sein angekündigtes SAP Data Warehouse Cloud mit der Zielgruppe Business Analyst, wie auch schon SAP Analytics Cloud.

Persönlich denke ich, als BI-Berater wird man deshalb nicht arbeitslos. Aber Aufgaben werden sich verändern. Die Fachbereiche werden mündiger und können einen immer größeren Bereich selbst abdecken. Das ist gut, weil es die faktenbasierte Entscheidungsfähigkeit bei richtiger Strategie stärkt. Denn eines ist klar. Excel ist und bleibt das beliebteste Tool für BI und ist dank Office 365 auch in der Cloud verfügbar mit Power Pivot und Power BI als Verstärkung. Ob das gut ist, ist eine ganz andere Frage.

Die Herausforderungen sind immer neue Datenquellen, gerade wegen der Cloud. Die Harmonisierung und semantisch saubere Integration der Daten überfordert Fachbereiche oder führt dort zur Spezialistenbildung. Die zunehmende Dynamik im Internet wie auch die zunehmende Agilität in Unternehmen erfordert eine schnelle BI-Adaption und Konzept-Know-How im Umgang mit historischen Daten. Daten sind nicht mehr nur strukturiert, sondern das, was bisher Big Data und NoSQL geleistet hat, wird zunehmend integriert und erhöht die Anforderungen. Basistechnologien wie SAP HANA liefern heute Funktionalitäten wie Text, Spatial, Predictive Analytics oder Graph-Verarbeitung, um höheren Nutzen aus den Daten zu ziehen. Die Komplexität der nutzbaren Methoden nimmt damit immer weiter zu. Die Vielfalt verfügbarer Komponenten und neuer oder unterschiedlicher Schnittstellen ebenso. Die Anforderung an die Datenqualität werden deutlich steigen und eine ganzheitliche Sicht auf das Unternehmen rückt eher in die Ferne als Realität zu werden.

Für Unternehmen mit einfachen operativen Systemen und überschaubaren Anforderungen an Reporting und Datenanalysen werden es also leicht haben, jedoch auch nur geringen Nutzen aus einer zunehmen Digitalisierung ziehen. Für alle anderen ist Self Service und zunehmende Data Literacy eine Notwendigkeit um irgendwie noch mithalten zu können, da die IT-Fachkräfte nicht schnell genug vom Baum wachsen werden.

SAP Data Warehouse Cloud

Wie in meinem Blog „SAP und das Data Warehouse“ gezeigt, ist ein neuer Spieler am Markt. SAP Data Warehouse Cloud (DWC) ist aktuell (06/2019) noch nicht öffentlich verfügbar, geht aber bald in die Beta-Phase.

Ich möchte die Seite dazu nutzen, den aktuellen Stand, was hier kommen wird, zu sammeln und aufzubereiten.

Lesenswert für einen ersten Überblick ist sicherlich auch der Webcast Recap-Blogs (1/2) von Tammy Powlas.

SAP DWC ist Teil des HANA Cloud Services. Diese bestehen aktuell aus folgende Services:

DWC_1

SAP DWC wird also als Service auf Basis der SAP HANA Cloud Services zur Verfügung gestellt. Damit sind voraussichtlich auch HANA-Fähigkeiten wie die Analytics-Komponenten dort verfügbar.

Eine Frage, die sich bei sowas immer gerne stellt ist, ob das das neue SAP BW bzw. BW/4HANA in der Cloud ist. Die zugehörige FAQ macht dazu folgende Aussage:

„SAP Data Warehouse Cloud is our new approach for agile and enterprise data warehousing in the cloud. It will not replace the SAP BW (on premise), but it will provide a new modern approach for data warehouse in the cloud. Of course, we will support scenarios where customers can use the SAP Data Warehouse Cloud to extend and sometimes migrate existing SAP Business Warehouse scenarios. SAP HANA Cloud Services is not a Data Warehouse, but the underlying cloud-service.“

Ähnlich wie bei SAP Analytics Cloud scheint die Positionierung aktuell für den Business User zu sein und nur bedingt für die IT-Abteilung.

Was ich mich gefragt habe, ist dies das in 2018 propagierte „Project Blueberry“? In 2018 wurde noch klar eine gemeinsame Code-line auf Basis BW/4HANA 2.0 kommuniziert:

DWC_8
Quelle: SAP, 2018 (What’s New with BW/4HANA 1.0, SP08)

Mit der Freigabe Ende Februar 2019 war dann aber plötzlich nicht mehr viel von Project Blueberry zu hören. Eine indirekte Aussage von der SAP gab es dazu, in dem DWC als Cloud-native Entwicklung bezeichnet wurde, was aus meiner Sicht oben dargestellte „single code-line“ ausschließt. Eine ganz klare Aussage habe ich leider noch nicht gehört, allerdings sprechen bspw. die Kommentare hier doch dafür, dass Projekt Blueberry in diesem ursprünglichen Sinne tot ist.

Den besten bisherigen Einblick in DWC gab es aus meiner Sicht bei der Live-Demo zur letzten SAPPHIRE Now.

Ebenfalls wurde von Axel Meier ein LOB use case gezeigt, der bereits einiges an Informationen liefert und auch die Bulding Blocks des DWC zeigt:

DWC_3
Quelle: Axel Meier, SAP 2019

Ende Juli/Anfang August wird es eine Beta Experience geben, bei dem ein erster Zugriff auf ein System möglich sein wird. Aktuell laufen hier bereits die Vorbereitungen über Sessions mit der SAP.

Das Data Warehouse Cloud bietet auf Basis des HANA Cloud Service folgende aufbauenden Services:

  • Repository
    • Semantic Layer
      • Consumption Model
      • KPI
      • Fact
      • Dimension
      • Hierarchy
    • Data Layer
      • Virtual/Local Tables
      • Views
      • Data Store Object
      • Dataflows
      • Connections
  • Modeling
    • Graphical Data Modeling
    • SQL Editor
    • Reusable Semantics
  • Data Warehousing
  • Governance
    • Spaces – Konzept
      • Object isolation
      • Data model definition
      • Data access control
      • Assign connections
      • Resources isolation
      • Elasticity & Self-scaling
      • Pay-per-use
      • Monitoring
    • Business Catalog
      • Trusted Source
      • Intuitive Searche Function
      • Documentation
      • Data Lineage
      • Versioning and artifacts comparison

 

Meine Eindrücke bisher:

DWC_2
Tweet Link

Warum?

  • BW Workspaces: Das Konzept der „Spaces“ ist grundsätzlich in der SAP Cloud Platform verfügbar. Wie ich gesehen habe, soll eine verbindung zu zentralen Daten möglich sein, wie dies im SAP BW on HANA/BWA bzw. BW/4HANA mit BW Workspaces bereits möglich war. BW Workspaces will die SAP zwar wohl zu Gunsten von SAP Analytics Cloud aufgeben, allerdings scheint das Konzept im DWC doch nochmal einen Heimat gefunden zu haben.

    DWC_7.PNG
    Quelle: Youtube, SAP 2019
  • BW Analysis Process Designer: Das war eher eine Fehlannahme, da die Modellierung so flow-like ausgesehen hat. Eigentlich ist das aber eher eine Business-like Modellierung virtueller Datenmodelle:
    DWC_4.PNG
    Quelle: Youtube, SAP 2019
  • Smart Data Access: Wie die Übersicht der Building Blocks oben zeigt, sind „Virtual Table for federated data access“ einer dieser Bausteine.
  • SCP Open Connectors: Selten habe ich bei der SAP bisher in der Cloud eine solche Vielzahl an Konnektoren gesehen:
    DWC_5
    Link: SAP Open Connectors

    Und ebenso eine Auswahl findet sich nun auch hier:

    DWC_6
    Quelle: Youtube, SAP 2019
  • BO Universes: Der Ansatz eines semantischen Layers ist ja nicht neu und SAP hat diesen seit der Übernahme von BusinessObjects im Portfolio. Das Konzept scheint auch hier Eingang gefunden zu haben. Wie es sich heute so gehört, wohl mit Machine Learning-Unterstützung.

 

Zu SAP Analytics Cloud ist noch zu sagen, dass es den Anschein einer integrierten Funktion macht, wobei nach dem was ich gelesen habe auch andere BI-Werkzeuge auf die Daten zugreifen können werden.

Auch erwähnenswert ist, dass an Templates und einer Art Business Content gebaut wird, um den Start zu erleichtern.

Nun, noch ist DWC wie geschrieben noch nicht einmal verfügbar. Bis zur GA im Herbst 2019 wird es sicherlich noch einige Informationen geben.

 

SAP Analytics Cloud – wo starten?

SAP Analytics Cloud ist das neue Flagship-Produkt der SAP im Frontend. Von der SAP wird es ganz klar bevorzugt zu den klassischen BusinessObjects BI-Werkzeugen gepushed.

Aktuell ist ein neues Buch dazu erschienen:

SAP Analytics Cloud – Das Praxishandbuch

Die Frage, die sich mir dabei stellt, ist, ob ein Buch bei einem sich so schnell entwickelndem Produkt viel Sinn macht?

https://mobile.twitter.com/sapanalytix/status/1136830553511137281

Grundsätzlich ist ja jede Versorgung mit Infos zu begrüssen. Im Cloud-Umfeld im Speziellen habe ich jedoch schon schlechte Erfahrungen z. B. mit Smart Business Services gemacht. Und auch bei SAC sind Features mittlerweile schon wieder komplett verschwunden (z. B. automatische Erstellung von Stories), haben sich komplett geändert (z. B. Digital Boardroom) oder es sind komplett neue Bereiche wie Smart Predict oder Analytics Designer (Application Design) hinzugekommen.

Die Quellen im Netz sind vielfältig. https://www.sapanalytics.cloud/ bietet u. a. mit dem Learning-Bereich schonmal einen guten Start.

Die Videoliste auf  Youtube ist sehr hilfreich um sich neue Features anzuschauen und ist zum Teil auch auf http://www.sapanalytics.cloud verlinkt.

Wer sich gerne Buch-like einliest, dem kann auch https://sapanalyticscloudbook.com/ empfohlen werden. Auch wenn es sich teilweise eher wie eine kommentierte Präsentationssammlung liest.

In Zeiten, in denen Blogs schon nach kurzer Zeit veraltet sein können, sind Wikis, solange gut gepflegt, sicherlich sehr interessant.

Die Community-Seite der SAP ist als zentrale Anlaufstelle sicherlich auch sehr wichtig.

Ich denke auch 2019 und bei einem Thema wie „Cloud“ macht es noch Sinn, ein Buch in die Hand zu nehmen. Man muss sich aber klar sein, dass die schnelle technologische Entwicklung  auch sich schnell anpassbare Medien und Informationsquellen notwendig macht. Und während in der On-Premises-Welt immer noch relativ alte Systemstände zu finden sind, bei denen man eigentlich ganz froh ist, ein Buch von vor ein paar Jahren zu finden, wird dies bei der Cloud-Releaserate nicht mehr so sein.

 

 

SAP Analytics on Twitter 19-04/05

Vor einem Monat habe ich über typische retweetete Tweets gezeigt, was sich so in der SAP Analytics-Welt aktuell tut. Schauen wir einfach mal, ob sich seither im letzten Monat ebenso viel getan hat und was aktuell die Themen sind.

18.04.2019 – 02.05.2019:

SAP Analytics Cloud

Auch im Vormonat war Planung u. a. mit SAP Analytics Cloud ein Thema. Hybride Szenarien mit BPC on Premise und SAP Analytics Cloud erweitern die Möglichkeiten und bauen die Brücke in die Cloud:

1.PNG
Tweet Link

Mittlerweile hatte sich auch jemand die Mühe gemacht, die Planungsmöglichkeiten mit SAC zusammenzufassen. Wobei ich sagen würde, dass daraus ein eher allgemeiner Überblick zu verschiedenen technischen Aspekten der SAC geworden ist:

9
Tweet Link

Wobei hier vielleicht eher auf folgende Seite zu referenzieren ist: https://sapanalyticscloudbook.com/

Als neustes, in der Breite verfübares Feature wurde Application Design mit SAP Analytics Cloud freigegeben:

13
Tweet Link

Die Integration mit bestehenden Technologien oder zumindest mal der darunter liegenden SAP Cloud Platform ist natürlich auch kein größeres Thema:

12
Tweet Link

Wer es gerne etwas technischer mag, darf aber auch gerne hier einsteigen. Leider nicht komplett mit einem Trial Account machbar:

23
Tweet Link

Die Weiterentwicklung ist eng getaktet und lässt sich natürlich nicht aufhalten. Auch die Features werden zeitnah von der Community umgesetzt:

15
Tweet Link 1 / Tweet Link 2

Auch in bestehende Cloud-Anwendungen wie SuccessFactors oder C/4HANA findet eine immer tiefere Integration statt:

24
Tweet Link

Auch on Top of SAP Analytics Cloud tut sich im Bereich SAP Data Hub etwas:

10
Tweet Link

SAP Data Hub

Data Hub hat vielfältige Einsatzmöglichkeiten bei der Integration und Verarbeitung von Daten. Moderne Ansätze wie Container werden hier eingesetzt, um skalierbare Systeme zu bauen. Dabei können Systeme wie ein BW/4HANA on Premise oder eine HANA in der SCP eingebunden werden:

2
Tweet Link

Mittlerweile hat SAP für Data Hub auch verschiedenen Blueprints zur Verfügung gestellt:

8
Tweet Link

Der Reifegrad von Data Hub erhöht sich nach und nach. So wurde bietet Ceph beispielsweise neue Möglichkeiten, die Daten im Kontext von Data Hub zu speichern:

21
Tweet Link

BW/4HANA

Seit BW/4HANA 2.0 verfügbar ist, gibt es natürlich immer wieder Updates zu den wachsenden Möglichkeiten:

20
Tweet Link

Während sich der Business Content in der Vergangenheit nur träge entwickelt hat, wurde für BW/4HANA der Content komplett neu und auf die neuen Möglichkeiten mit HANA unter dem Namensraum IMO (In Memory Optimized) bereitgestellt. In einem Webcast wurden hier aktuelle Neuerungen erklärt:

3
Tweet Link

BW/4HANA ist in der SAP CAL (Cloud Appliance Library) verfügbar und die Evaluierung der neuen Features und einen Start zu erleichtern:

28
Tweet Link

Mit zunehmender Etablierung von S/4HANA mit Embedded BW und Embedded Analytics kommt die Diskussion darüber aus, wann man überhaupt noch ein SAP BW/4HANA benötigt:

25
Tweet Link

SAP HANA & Advanced Analytics

Mit SAP HANA Native Storage Extension hat SAP eine Alternative zu Dynamic Tiering und Extension Nodes für „warm data“ vorgestellt:

4
Tweet Link

In folgendem Beitrag hat Lucia Subatin gezeigt, welches Potential in den analytischen Fähigkeiten einer HANA steckt, wenn man diese zu nutzen weiß:

5
Tweet Link

Verschiedene Blogs treiben das Thema immer weiter an und zeigen, was noch möglich ist bei HANA und Advanced Analytics:

19
Tweet Link 1 / Tweet Link 2

Auch unter diesem bescheidenen Blogeintrag ist ein spannender Blog verlinkt, welcher SDI, SDQ, Text Analysis, Graph Processing und weitere in einem Beispiel vereint:

29
Tweet Link

Wem das nicht ausreicht, schon beim letzten Mal habe ich auf neue Möglichkeiten der R-Integration mit HANA hingewiesen. Nun zeigt sich, dass R auch im Kontext von Streaming Analytics genutzt werden kann:

6

Grundsätzlich scheint sich die Integration in HANA immer weiter zu verbessern:

7
Tweet Link

Machine Learning kommt auch beim Thema Robotic Process Automation zum Einsatz. Vor Kurzem wurde es als Service in der SAP Cloud Platform gelaunched:

11
Tweet Link

Tutorials helfen beim Einstieg in die neuen Möglichkeiten mit SAP Leonardo:

22
Tweet Link

Ebenso bietet die SAP im Rahmen von S/4HANA immer mehr Möglichkeiten:

14
Tweet Link