interview

Interview mit Jörg Blumtritt – Datarella

Jörg Blumtritt DatarellaWer ist Jörg Blumtritt? Bitte stell Dich doch mal kurz vor.

Jörg Blumtritt ist Data Scientist, Blogger und CEO von Datarella.

Damit wir Dich nicht nur aus beruflichem Blickwinkel kennenlernen, verrate uns doch auch einen kleinen Spleen von Dir.

Seit ich 12 bin sammle ich chemische Elemente. Von Wasserstoff bis Wismuth bis zu den natürlich vorkommenden radioaktiven Elementen habe ich eine vollständige Sammlung.

Elevator Pitch! Was macht Eure Firma? Und vor allem: was macht ihr am besten, wo liegt Eure Superpower?

Datarella liefert Data Science as a Service. Wir beherrschen den gesamten Big Data Prozess, von der Datenerzeugung und Datensammlung, Datenspeicherung, Aufbereitung bis zur Analyse. Unsere Spezialität sind Predictions, also Vorhersagemodelle aus Daten. Unsere Lieblingsdaten sind Verhaltensdaten, die auf Smartphones, Wearable Tech wie Smart Watches und auf Geräten des Internet of Things gesammelt werden.

Apropos Superpower: Verrätst Du uns ein „Best Practice“ Beispiel Deiner Firma, wo ihr besonders erfolgreich wart? Was waren Deiner Meinung nach die Erfolgsfaktoren?

Für einen Kunden führen wir Daten aus den Kassensystemen, den Lichtschranken und Bewegungsmeldern in den Läden mit Daten aus der Mobile App und der Website zusammen. Daraus entwickeln wir Vorhersagen, mit wievielen Verkäufen der Kunde mit einem neuen Angebot rechnen kann und wann die Nachfrage zu erwarten ist.

Kaum ein Unternehmen ist aus dem Stand heraus aufgestellt, ein komplexes Datenprojekt zu starten. Meist fehlt nicht nur die Kapazität der internen Mitarbeiter, sondern die bisherige IT-Infrastruktur ist schlicht nicht dafür ausgelegt. Klassische Business Intelligence Lösungen wie Data Warehouses, die für Buchhaltung und Controlling bestens funktionieren, geben in der Regel für echte Big Data Projekte nicht die richtigen Daten her.

Damit beginnt praktisch jedes Projekt mit einem Workshop – Worum geht es? Was sind veränderte Paradigmen? Wie geht man mit Datenschutz und anderen ethischen Fragen um? Am Ende stehen dann eine Reihe von Anforderungen, wo was im Unternehmen angesetzt und eventuell geändert werden muss, wenn das Big Data Projekt erfolgreich werden soll.

Schließlich gilt es die technische Infrastruktur aufzusetzen. Wir arbeiten grundsätzlich wahlweise mit Hadoop, Microsoft Azure oder Amazon S3 als Basis für die Daten. Darauf setzen wir dann die Datenbearbeitung und das Analytics Layer auf, das in Spark umgesetzt wird, gegebenenfalls mit weiteren Modulen, die dann programmiert werden.

Die fertige Lösung läuft entweder direkt auf den Servern des Kunden oder in unserer Cloud.

Wenn Du Dir die Netzwirtschaft insgesamt, Euren Markt, Eure Firma, Deine Position ansiehst, was werden die Haupt-Herausforderungen in den nächsten Monaten oder Jahren sein?

Kurzfristig ist die wichtigste Herausforderung, schnell Know How aufzubauen. Kaum ein Unternehmen hat Mitarbeiter, die mit Hadoop, Spark oder anderen Big Data Technologien umgehen können.

Langfristig kommen durch das Internet of Things ganz neue Themen auf uns zu: Wie gehen wir damit um, dass wir extrem persönliche Daten mit anderen teilen? Wie erreichen wir Transparenz in den Algorithmen, die aus den Daten „etwas machen“ – die Algorithmen Ethik -? Und mit am wichtigsten: Wird das Internet of Things auch wieder von wenigen großen Unternehmen dominiert, wie die PC-Welt einst durch Microsoft, die Mobile-Welt heute durch Apple und Google?

Herausforderung für die Gesellschaft, bzw. den Staat:

Die wichtigste Forderung an die Gesellschaft und unsere Verwaltung ist, gute Rahmenbedingungen für Daten-basierte Unternehmen zu schaffen. Unser aktueller Datenschutz greift nicht mehr richtig, wenn es darum geht, dass viele Menschen ihre Daten sehr wohl gerne mit anderen – auch mit Unternehmen – teilen wollen, aber den Missbrauch fürchten. Der aktuelle Datenschutz geht schließlich eher davon aus, dass die Verbreitung der Daten begrenzt werden muss. Wenn ich aber zum Beispiel an einem offenen Datenprojekt im Bereich der Gesundheitsforschung teilnehmen will, möchte ich ja gerade, dass meine Daten weiter gegeben werden können. Was ich nicht möchte ist aber, dass ich zum Beispiel Nachteile bei Versicherungen oder Kreditvergabe durch meine Teilnahme erleide.

Ein zweiter zentraler Punkt sind fehlende Standards. Für den PC hat das Betriebssystem Windows von Microsoft quasi Monopolstatus erlangt hat, und im Bereich der Smartphones gilt dasselbe heute für Google mit Android und Apple mit iOS, gibt es für das Internet of Things noch keine Standards. Es wäre wünschenswert, dass hier schnell offene Alternativen zu Google und Apple entstehen, die unabhängigen Hardware und Software Unternehmen gute Marktchancen lassen und die Endkunden vor dem „Lock-in“ bewahren, also dem Zwang, ein geschlossenes System einsetzen zu müssen, dass ihnen in den wesentlichen Bereichen der informationellen Selbstbestimmung überhaupt keine Möglichkeit lässt, Einfluss darauf zu nehmen, was mit den persönlichen Daten passiert.

Herausforderung für die Netzwirtschaft in Deutschland / Europa:

Für die Netzwirtschaft geht es vor allem um den schnellen Aufbau an Expertise. In den meisten Ländern Europas und in Deutschland insbesondere gibt es nur wenig Nachwuchs – die Belegschaften überaltern. Hier gilt es, die vorhandenen Kräfte nachzuschulen und junge Mitarbeiter gezielt auf Big Data vorzubereiten.

Was hat Dich bisher am meisten „am Internet“ geärgert, was am meisten gefreut?

Das Internet ist für mich die wichtigste Infrastruktur überhaupt. Am meisten freut mich, wieviele Freunde ich alleine über Twitter kennengelernt habe – zum Beispiel meine Mitgründer. Social Media haben mein Leben bereichert und über die Menschen, zu denen ich auf diese Weise Kontakt habe freue ich mich jeden Tag.

Gib uns doch bitte eine Empfehlung für…

für Twitter. Einfach machen! Twitter ist mehr als nur ein Kommunikations-Tool. Twitter ist eine großartige Informationsquelle. Zu vielen Themen aus Wissenschaft, Technologie und Wirtschaft gibt es Experten, in deren Posts die wichtigsten Artikel, Texte oder Pressemitteilungen kommentiert verbreitet werden – wie eine Fachzeitschrift für jedes erdenkliche Thema. Die Leute findet man nicht schwer – einfach ein paar relevante Fachbegriffe in die Suche eingeben und dann lesen, wer zu den Themen etwas schreibt.

ein spannendes Buch, das Dich inspiriert hat

Zwei Bücher haben mich in diesem Jahr sehr beschäftigt: The Peripheral von William Gibson und SevenEves von Neal Stephenson. Gibson beschreibt in The Peripheral zum einen unsere Welt nach dem Siegeszug von 3D-Druck und dem Internet of Things kurz vor dem Kollaps, der vor allem durch den Klimawandel und andere menschgemachte Einflüsse eintritt, und eine Welt, die von der anderen Seite dieses Kollaps aus einer nicht allzu fernen Zukunft auf die Vergangenheit zurück blickt. Wie immer gelingt es Gibson eine unglaubliche Fülle von technologischen und gesellschaftlichen Trends zu einer spannenden Geschichte zu verweben und uns vor Augen zu führen, wie sich die aktuellen Entwicklungen „anfühlen“, wenn man sie bis ans Ende drückt.

SevenEves ist eine einzige Hymne auf die Ingenieurskunst und vor allem auf die Raumfahrt. Beste „Rocket Fiction“, die ich seit langem gelesen habe. Nach der Lekütre fühlt sich alles langweilig an, was nichts mit bemannter Raumfahrt zu tun hat.

eine Veranstaltung(-sreihe), auf der Du wirklich etwas dazugelernt hast

Keine Konferenz bietet mehr Inspiration zum Thema Daten wie die Strata + Hadoop World Conference, die seit 2010 jedes Frühjahr im Silicon Valley stattfindet. Dort gibt es genau die Dinge, die ich dann das restliche Jahr in meiner Firma umsetzen kann.

Mit welchem Experten würdest Du am liebsten einmal 1 Tag zusammenarbeiten, und warum?

Wenn ich es mir aussuchen könnte, hätte ich gerne einen Tag mit Peter Thiel. Bin politisch zwar vermutlich nicht unbedingt auf derselben Linie, aber seine zum Teil radikalen Gedanken zu Fortschritt und Technologie haben mich schon lange fasziniert und auf neue Ideen gebracht.