Ein Bild sagt mehr als zehntausend Zahlen

Blaue Zahlenstränge auf schwarzem Hintergrund. © Fotolia

Die Visualisierung riesiger Datenmengen hilft, versteckte Zusammenhänge zu erkennen, die den Algorithmen entgehen. Von Daniel Saraga

​Ob es sich um staatliche Statistiken handelt, die dank der Open-Data-Bewegung den Archiven entkommen sind, um Geschäfts- und Finanzinformationen oder um die vielfältigen Spuren, die wir im Internet hinterlassen – die verfügbaren Datenmengen werden täglich grösser.

Wie lässt sich daraus nützliches Wissen gewinnen? Mit den leistungsfähigen, aus der Statistik abgeleiteten Algorithmen des Data Mining kann systematisch nach Korrelationen gesucht werden. Aber auch Bilder können die Daten sprechen lassen. "Mit einer guten visuellen Darstellung der Informationen ist unser Auge in der Lage, Beziehungen zu erkennen, die sich den Algorithmen verbergen", sagt Denis Lalanne vom Informatikdepartement der Universität Freiburg. "Das ist zum Beispiel der Fall bei einem Trend, bei Werten ausserhalb des Normalbereichs oder bei Gruppen ähnlicher Daten."

Der Wissenschaftler hat mit seinen Kollegen Ilya Boyandin und Enrico Bertini neue Werkzeuge entwickelt, mit denen insbesondere Daten, die auf einen Ursprung und ein Ziel hin zuordenbar sind, visualisieren lassen. Da die in Freiburg entwickelten Werkzeuge als Open-Source-Software veröffentlicht wurden, haben sie eine Vielzahl von Anwendungen gefunden, die von der Analyse der Mittelflüsse der internationalen Hilfe bis zur Untersuchung der Vertriebskette eines Logistikunternehmens reichen (
http://diuf.unifr.ch/main/divaExternal Link Icon).

"Ich bin vom Echo auf unsere Arbeit überrascht", sagt Lalanne. Gross war es namentlich auf das in Zusammenarbeit mit der Uno realisierte Projekt «Flowstrates», das die zeitliche Entwicklung von Flüchtlingsbewegungen zwischen verschiedenen Ländern untersucht. Von anderen Nutzern wurde das Werkzeug angepasst, um die Mobilität der Arbeitnehmenden in Chile und der Studierenden in Australien, den internationalen Rohstoffhandel oder auch die Bewegungen der New Yorker Taxis unter die Lupe zu nehmen.

Auswahl schafft Klarheit

Eine gute Visualisierung kann nicht alles darstellen, da die Grafiken und Karten sonst unübersichtlich werden. "Man muss die Anwenderbedürfnisse verstehen und die konkrete Anwendung kennen, damit man die relevanten Informationen auswählen kann", erklärt Lalanne. Das Werkzeug muss sicherstellen, dass die Daten interaktiv erkundet und neue Hypothesen aufgestellt werden können, die sich anschliessend mit Hilfe statistischer Werkzeuge leicht prüfen lassen.

"Wir haben die Schlussfolgerungen aus verschiedenen Visualisierungen verglichen. Die Art, wie Informationen dargestellt werden, hat einen Einfluss darauf, welche Schlüsse daraus gezogen werden", sagt Denis Lalanne. "Unser Ziel ist es, so nahe wie möglich an den unverzerrten Daten zu bleiben. Eine Visualisierung zu Kommunikationszwecken kann aber auf jeden Fall unbeabsichtigt bestimmte Interpretationen nahelegen."

Der aufstrebende Bereich der Datenvisualisierung zieht viele Studierende an. Informatiker entwickeln Algorithmen der Visual Analytics, die ihrerseits die von anderen Programmen erzeugten Grafiken analysieren. Aber noch immer ist unser Augenmass unersetzlich, wenn wir uns in der Datenflut zurechtfinden und nicht darin ertrinken wollen.

Daniel Saraga ist Wissenschaftsjournalist und arbeitet für die Presseagentur LargeNetwork.

(Aus "Horizonte" Nr. 101, Juni 2014)