Master the Basics of Analytics

Wenn man sich mit einem Gebiet im Bereich Analytics beschäftigt oder vielleicht auch von einem bestimmten Anbieter oder Tool kommt, dann steht man evtl. irgendwann vor der Frage, woher das eigentlich alles kommt?

Manchmal ist es evtl. eine gute Idee mal ein Buch in die Hand zu nehmen, um von jemandem zu lesen, der sich als einer der Ersten mit dem Thema beschäftigt hat. Oder eben es als erster schaffte, dass auch auf Papier zu bringen.

 

Data Warehouse

Barry Devlin – Erste Definition des Begriffs (Business) Data Warehouse

Homepage | Twitter | Artikel „Business Data Warehouse“

William (Bill) Inmon – Vater des Data Warehouse

Twitter

Ralph Kimball – Vater der Dimensionalen Modellierung

Homepage

Dan Linstedt – Begründer von Data Vault

Homepage | Twitter

 

Business Intelligence

Hans-Peter Luhn – Vater der Business Intelligence

Artikel „A Business Intelligence System

Howard Dresner – Prägte „Business Intelligence“

Homepage | Twitter

Edward F. Codd – Prägte „On-Line Analytical Processing – OLAP“

Collected Work | Artikel „OLAP“

 

Information Design

Ben Shneiderman – Visual Information Seeking Mantra; Erfinder Tree Maps

Homepage | Twitter

Edward Tufte – Erfinder Sparklines; Prägte „Chart Junk“ und „Data-Ink-Ratio“

Homepage | Twitter | GitHub

Stephen Few – Leader in Datenvisualisierung; Erfinder des Bullet Graph

Homepage I | Homepage II

Rolf Hichert – Mitbegründer der SUCCESS-Rules und des IBCS

Homepage | Twitter | YouTube

 

Data Science

John W. Tukey – Begründer der explorative Datenanalyse

Biography | Report (1993, pdf)

Gregory Piatetsky-Shapiro – Prägte „Knowledge Discovery in Databases – KDD“

Homepage | Twitter

Andrew Ng – Mitgründer Google Brain-Projekt, Mitgründer Coursera

Homepage | Twitter

 

Big Data

Doug Cutting – Vater von Hadoop; Chefarchitekt Cloudera

| Blog | Twitter | Github

Matei Zaharia – Erfinder von Apache Spark; Miterfinder von Apache Mesos

Homepage | TwitterDissertation | GitHub

James Dixon – CTO Pentaho; prägte den Begriff „Data Lake“

Blog „Data Lake“ | Twitter

Nathan Marz – Erfinder von Apache Storm; Erfinder der Lambda-Architektur

Homepage | Twitter | GitHub

Advertisements

Hans Peter Luhn

Hans Peter Luhn (1896 – 1964) war ein deutscher Informatiker bei IBM.

Er arbeitete seit 1941 bei IBM und leistete wichtige Arbeit im Bereich der Datenverarbeitung. Bekannt wurde sein Name in den letzten Jahren durch den 1958 veröffentlichten Artikel „A Business Intelligence System„, welcher oft als Ursprung des Begriffs „Business Intelligence“ angesehen wird.

Der Artikel beschreibt jedoch eher die Verarbeitung und Extraktion von Informationen aus Dokumenten, weshalb der Bezug zum typischen Verständnis von BI umstritten ist.

Dazu passt es, dass er u. a. als Vater des Information Retrivial genannt wird.

Florence Nightingale

Florence Nightingale (1820 – 1910) war Begründerin der modernen Krankenpflege und Reformerin im Bereich der Krankenpflege.

Nightingale, die ihren Vornamen von ihrer Geburtsstadt Florenz hat, wurde von vielen Soldaten hoch verehrt, da sie durch ihre Methoden viele Leben rettete und dies nicht zuletzt durch statistische Methoden und Diagramme, wie das Coxcomb- (Hahnenkamm-) Diagramm, welches auch als Polar-Area Diagramm bekannt ist.

Durch die Visualisierung statistische Daten konnte Sie zeigen, dass mehr Soldaten durch schlechte Bedingungen (Ernährung, mangelnde Aktivität, …) im Krankenhaus starben, als durch Kriegswunden.

Sie war aufgrund ihrer Verdienste 1858 das erste weibliche Mitglied der Royal Statistical Society.

Also sehr gläubige Frau, welche die Krankenpflege als Ihrer Bestimmung sah, obwohl dies für eine Frau aus gutem Hause zu ihrer Zeit nicht unbedingt der Beruf der Wahl war, passt gut das folgende Zitat:

To understand God’s thoughts, we must study statistics for these are the measures of his purpose.
Obwohl seit 1855 erkrankt, wurde sie 90 Jahre alt und veröffentlichte über 200 Bücher und weitere Schriften.

John Snow

John Snow (1813 – 1858) war ein britischer Arzt.

Er leistete Pionierarbeit, indem er während einer Choleraepedemie in London 1854 die Anzahl der Todesfälle auf einer Stadtkarte abbildete. Die Visualisierung zeigte den Krankheitsherd durch eine Wasserpumpe. Mit dieser Entdeckung konnte die Epedemie schnell eingedämmt werden.

Seine Darstellung gilt als eine der ersten geospatialen Visualisierungen überhaupt.

Im Internet gibt es vielfältige Diskussionen und Analysen welche den Ansatz von Snow mit heutigen Methoden nachvollziehen, jedoch auch Kritiker und ähnliche Ansätze von anderen vorstellen. Auch von Alberto Cairo gibt es beispielsweise einen interessanten Artikel dazu.

John Snow gilt heute als einer der Begründer der Epidemologie. Und das, obwohl sein Ansatz lange umstritten war und erst nach seinem Tod die entsprechende Anerkennung bekam.

Charles Joseph Minard

Charles Joseph Minard (1781 – 1870) war ein französischer Bauingenieur, der wesentliche Beiträge zur Entwicklung der Informationsgrafik leistete.

Er ist besonders dafür bekannt, dass er 1869 ein Sankey Diagramm von Napoleons Russlandfeldzug erstellte. Edward Tufte bezeichnete diese als „wohl beste statistische Grafik aller Zeiten“ und hat auf seiner Webseite sogar eine Analyse über die Quellen dieses Diagramms veröffentlicht.

Minard hat Mitte des 19. Jahrhunderts viele weitere Arbeiten dieser Art veröffentlicht, welche zum Teil hier einsehbar sind.

 

William Playfair

William Playfair (1759 – 1823) war ein schottischer Ingenieur und Volkswirt.

Playfairs Beitrag zu Business Intelligence ist die Erfindung und erste bekannte Verwendung des Kuchen– sowie des Balkendiagramms. Darüber hinaus wird ihm auch noch das Linien- und Zirkeldiagramm zugeschrieben.

Playfair veröffentlichte zwei Bücher über Volkswirtschaft, in denen er stark auf den Einsatz von Diagrammen baute:

The Commercial and Political Atlas (1786) – mit 43 Zeitreihenanalysen und wahrscheinlich dem ersten Balkendiagramm.

Statistical Breviary (1801) – mit dem ersten bekannten Kuchendiagramm.

Zitat:

Figures and letters may express with accuracy, but they can never represent either number or space.

William Playfair, Atlas, 1st ed., 1786, p.3.