News

Report on Cloud – Effiziente Datenanalyse in großen Datenmengen


30. August 2020

Es gibt einige Szenarien, in denen die einmalige oder regelmäßige Datenanalyse auf enorm große Datenpools gefahren wird (wie z.B. Vorhersage des Einkaufsverhaltens, Analyse der Customer Loyalty, Retention Management, Risikofrüherkennung, …).

Neben den rein fachlichen Anforderungen und Abhängigkeiten ziehen diese vor allem zwei Herausforderungen nach sich:

Herausforderung Nr. 1:Performance-intensive Datenanalyse = Hohe Hardwarekosten & lange Durchlaufzeit

Je nach Komplexität der Datenstrukturen bedarf es entweder einiges an Laufzeit oder an Leistungsfähigkeit der Systeme, um eben diese Laufzeit zu reduzieren. Doch auf welchen Systemen können Sie solch eine Datenanalysen dann auch tatsächlich effizient durchführen? Die produktiven Systeme, die für den operativen Betrieb vorgesehen sind, eigenen sich dafür in vielen Fällen nicht – der Performancebedarf komplexer Analysen bremst den eigentlichen Operativbetrieb aus, was bei regelmäßigen Analysen zum wiederkehrenden Ärgernis werden kann.

Herausforderung Nr. 2:Der Umgang mit personenbezogenen Daten (DSGVO) = Kunden- und Mitarbeiterprofile

Datenwächter achten immer mehr darauf, dass sensible, personenbezogene Daten ohne Zustimmung der Betroffenen nicht für umfassende Profilierungen auf Einzelpersonenebene genutzt werden dürfen. Mit der DSGVO gab es eine deutliche Verschärfung hinsichtlich der Regelungen und besonders hinsichtlich der potenziellen Strafen bei Missachtung. Hier stellt sich die Frage: auf die Datenanalyse verzichten oder die Daten neutralisieren, auch wenn die fachliche Aussagekraft massiv darunter leidet?

Gehen Sie keine Kompromisse ein!Der Cloud-Ansatz von Libelle stärkt Sie beim Umgang mit diesen Herausforderungen

Nutzen Sie dedizierte Systeme, die ausschließlich für Datenanalyse- und Reportingzwecke bereitstehen. Entgehen Sie gleichzeitig dem Investment in Hardware, die ohnehin die meiste Zeit mit geringer Auslastung vor sich hin läuft und für den Analysezweck dann irgendwann doch wieder zu schwach ist. Begrenzen Sie damit auch gleichzeitig den Nutzerkreis für diese Analysesysteme. Betreiben Sie ein Analysesystem, das regelmäßig mit frischen und sinnvoll (!) anonymisierten Produktivdaten versehen wird.

Setzen Sie auf die Datenanalyse bzw. das Reporting in der Cloud. Der Vorteil: die bedarfsgerechte Bereitstellung der benötigten Ressourcen und die nutzungsabhängige Abrechnung. Das bedeutet konkret, Sie betreiben – und bezahlen – ihre cloudbasierten Analyse- und Reportingsysteme

  1. nur in den Zeitfenstern, in denen tatsächlich Analysen laufen.
  2. mit genau den Ressourcen (v.a. CPU Power und RAM), die zum jeweiligen Zeitpunkt benötigt werden.
  3. mit anonymisierten, aber logisch konsistenten Daten, die sowohl der DSGVO wie auch den fachlichen Anforderungen entsprechen.

Solche Systeme aufzubauen und dauerhaft zu betreiben ist deutlich einfacher, als es in vielen Unternehmen und Fachbereichen noch gesehen wird. Denn Libelle und BasisTeam unterstützen mit verlässlichen Best Practices.

Die fachliche Planung

Während der fachlichen Planung arbeiten wir üblicherweise mit Ihren Applikations-, Prozess- und Datenschutzverantwortlichen zusammen, um das optimale Betriebsmodell zu definieren. Dies umfasst

  • die Definition der konkreten Anforderungen an das Analysesystem, darauf basierend
  • die Vorauswahl möglicher Cloud-Anbieter samt PoC-Einplanung,
  • eine Entscheidungsvorlage hinsichtlich der letztendlichen Cloud-Plattform,
  • die Detailplanung der Umsetzungs- sowie der Betriebsphase,
  • die Unterstützung der Umsetzung
  • Und bei Bedarf: Unterstützung in der Betriebsphase

Das Umsetzungsprojekt

Nach der fachlichen Planung erfolgt die Umsetzungsphase, in der wir zusammen mit Ihnen das Analyse-/Reportingsystem in der Cloud entweder „greenfield“, also von Grund auf neu aufbauen, oder in Form einer Migration ein bestehenden Systems in die Cloud ziehen (Migrate2Cloud). Dabei greifen wir auf das umfassende Knowhow unserer Berater, sowie je nach Umsetzungsoption auf Softwarelösungen wie den Libelle DBShadow oder Libelle SystemClone zurück.

Der reguläre Betrieb

Der reguläre Betrieb unterteilt sich üblicherweise in vier Hauptphasen:

  • Normalbetrieb: Das Analysesystem wird von den „üblichen“ Anwendern genutzt für performance-neutrale bis einfache Anfragen genutzt und mit einem „ausreichendem“ Leistungsprofil betrieben.
  • Leistungsphase: Mit der Ankündigung großer, performance-intensiver Analysen wird das Cloudsystem mit einem „performance“-Leistungsprofil aufgeblasen und betrieben. Zum Ende der Leistungsphase wird das Leistungsprofil wieder auf Normalbetrieb zurückgesetzt.
  • Ruhephase: In arbeitsarmer oder arbeitsfreier Zeit wird das Leistungsprofil auf „minimal“ heruntergedreht, oder das Cloudsystem wird komplett außer Betrieb genommen.
  • Refreshphase: Während der Refreshphase werden die aktuellen Produktionsdaten auf das Analysesystem übertragen – bei SAP-Systemen mit Hilfe des Libelle SystemCopy, bei vielen Non-SAP Anwendungen per Libelle DBCopy. Dabei wird ein optimiertes Leistungsprofil angewendet, das entsprechend der Prozessphase automatisch vergrößert bzw. verkleinert wird. Nach dem Übertrag werden personenbezogene oder anderweitig sensible Daten entsprechend gesetzlicher und fachlicher Vorgaben anonymisiert. Auch während dieser Aktivitäten werden die Leistungsparameter des Cloudsystems automatisiert angepasst.
Nächster Artikel Vorheriger Artikel
Weitere News-Artikel
31. August 2020 SAP Systemkopien, DSGVO-konform anonymisiert
29. August 2020 Refresh2Cloud – Aufbau von Testsystemen in der Cloud
28. August 2020 Disaster Recovery-Konzepte mit der hybriden Cloud (DRaaS)

Alle News-Artikel