linkedin logo xing logo Alessio Analytics E-mail Icon

Wie viel Abfall wird in Düsseldorf jedes Jahr entsorgt? – Open Data Analyse in KNIME und Tableau

 ∗∗∗ 28. August 2018 ∗∗∗ Kategorien: Open Data ∗∗∗ Schlagwörter: , , , , ,

 ∗∗∗ 28. August 2018 ∗∗∗ Kategorien: Open Data ∗∗∗ Schlagwörter: , , , , ,

Europa macht große Fortschritte bei der Erlangung der Open-Data-Reife. Die Open-Data-Transformation beschleunigt sich sogar. Neuere Studien zeigen, dass Open Data sowohl auf makroökonomischer als auch auf Unternehmens-Ebene enorme wirtschaftliche Vorteile verspricht. Für weitere Informationen rundum Open Data in Europa lohnt es sich mal beim European Data Portal vorbeizuschauen.

Da wir aus Düsseldorf kommen freuen wir uns, dass es auch bei uns eine lebhafte Open Data Community gibt. In unser Open Data School nähern wir uns dem Thema Data Science und Advanced Analytics gerne spielerisch. Dazu nutzen wir immer wieder gerne das Portal von Open Data Düsseldorf. In diesem Post zeigen wir euch wie ihr selbst spielerisch erste Erfahrungen mit Open Data machen könnt. Dazu verwenden wir den Open Data Düsseldorf Datensatz: NACH ABFALLARTEN DIFFERENZIERTE ENTSORGTE ABFALLMENGE DER STADT DÜSSELDORF 

Open Data Düsseldorf stellt Datensätze oft in verschiedenen Formaten online, z.B. JSON oder CSV. Für unsere Analyse haben wir uns für CSV entschieden, da man sich einfach mit dieser Art von Datei verbinden kann um eine schnelle Analyse durchzuführen. Oft ist es so, dass Daten nicht ganz „sauber“ bei uns ankommen. Das ist nicht nur bei Open Data der Fall. Oft – eigentlich immer 😉 – müssen Unternehmens-Daten auf irgendeine Art und Weise vorbereitet werden. Deswegen ist „Data Prep“ auch wichtiger Teil des Data Science Prozess‚. Glücklicherweise gibt es im Zeitalter der Digitalisierung zahlreiche, anwenderfreundliche Tools die es Business Usern ermöglichen skalierbare Data Science Workflows zu erstellen.

Wir haben uns dieses mal für KNIME entschieden um die Daten Analyse-fit zu machen. KNIME ist eine Open Source Software die schnellen, einfachen und intuitiven Zugang zu fortgeschrittenen Data Science Methoden ermöglicht. Wir können per Drag-and-Drop einen Workflow konfigurieren der verschiedene „Data Operations“ durchführt. In diesem Fall musste unsere Datei nur ein wenig bereinigt werden.

 

 

Im nächsten Schritt wollen wir die Daten visualisieren und auf einem aussagekräftigem Dashboard Präsentieren. Dafür benutzen wir dieses mal Tableau. Da die Datumswerte alle in einer eigenen Spalte stehen müssen wir noch einen Vorbereitungsschritt in Tableau durchführen. Wir verwenden die Pivot Funktion um eine „Jahr“ Spalte zu erhalten. Dabei wird der Datensatz länger gemacht da für jedes Jahr und Abfallart eine neue Reihe erstellt wird. 

Nun können die Daten mit Visual Analytics Methoden weiter analysiert werden und die Einblicke auf einem anschaulichen Dashboard präsentiert werden. Hier seht ihr unser Open Data Düsseldorf Dashboard zur entsorgten Abfallmenge in Düsseldorf von 2009 bis 2017.

 

Für mehr Infos über Open Data, Data Prep und Visual Analytics abonniere unseren Newsletter. Wenn Du den case nachbauen möchtest melde Dich gerne bei uns unter info@alessio-analytics.com 

 

Autor: Simon Stegelmeier