» Datenpool

Foto: albdruck / Lizenz: by-saDatenjournalismus basiert auf Datensätzen, riesigen Tabellen mit Rohdaten. Doch sind solche Zahlen und statistische Erhebungen nur ein paar Klicks von der Google-Startseite entfernt und öffentlich zugänglich? Oder ist ein höherer Rechercheaufwand gefordert? Wir haben uns auf die Suche gemacht und zeigen, wie und wo sich interessante Daten finden lassen.




Kurzeinführung

Im Datenjournalismus existieren zwei Wege, die beide zu einer hoffentlich informativen und verständlichen Grafik führen. So kann man sich mit einer vorhandenen Studie befassen. Diese wird dann darauf untersucht, ob sich anhand der Zahlen und Schlussfolgerungen eine “Geschichte” bilden lässt. In der anderen Variante steht zu Beginn die Idee, für deren Umsetzung im Anschluss gezielt Daten gesucht werden. Wir wollen uns im Datenpool mit diesem zweiten Weg beschäftigen und einen kleinen Überblick bieten, wo und wie Daten bereitgestellt werden.

Datendurst im Kneipendschungel

von Michael Kulmus

In einem öden, langweiligen Kaff möchten die wenigsten studieren. Ein beliebter Indikator für die Qualität eines studentischen Umfelds ist die Kneipendichte. Gleich mehrere Unistädte werben mit der deutschlandweit höchsten Kneipenkonzentration. Schließlich ist studentischer Zuzug begehrt. Doch auf welche Daten greifen die Städte bei ihren Berechnungen zurück? Ein praktisches Beispiel über Hindernisse, Berechnungswirrwarr und überraschende Erkenntnisse bei der Datenrecherche.

Foto: Andreas Dantz / Lizenz:CC BY 2.0Münster, Lübeck, Regensburg: Nicht nur diese Universitätsstädte rühmen sich der höchsten Kneipendichte Deutschlands. Nachvollziehbare Eigenwerbung im Sinne des Stadtmarketings? Aber welche Stadt kann ihren Anspruch auch durch Zahlen belegen? Oder handelt es sich gar nur um „urbane Mythen“? Denn auch Marburg, Berlin, Erlangen und weitere Städte beanspruchen Spitzenplätze bei der Kneipendichte.

Wie geht ein Journalist nun vor, der beispielsweise eine Deutschlandgrafik mit den attraktivsten Kneipenlandschaften erstellen möchte? Wer sich Hilfe von Google verspricht, dem wird schnell klar: Brauchbare Ergebnisse sind dort kaum zu bekommen. Zwar führen dutzende Links auf die Websites von Tourismusbüros, Hochschulen, Foren und Onlinemagazinen. Doch dort werden eher vage Behauptungen ohne verifizierbares Datenmaterial aufgestellt. Das hört sich dann etwa so an: „Die Stadt Aachen mit ihrem herrlichen Altstadtviertel ist bekannt für die höchste Kneipendichte Deutschlands“. Wer die Behauptung aufgestellt hat, bleibt ebenso im Dunkeln wie das entsprechende Datenmaterial selbst. Auch in den Foren wird eifrig diskutiert. Schnell wird klar, dass viele Nutzer einfach ihren eigenen Studienort zum Sieger in Sachen Kneipenvielfalt küren. So gut wie niemand argumentiert mit belastbaren Zahlen, es überwiegen subjektive Einschätzungen. Außerdem kann der Begriff „Kneipe“ nicht fest eingegrenzt werden. Die einen verstehen darunter alternativ-studentische Orte oder die typische Eckkneipe irgendwo in ihrer Stadt. Andere aber auch keimfreie Cafés, in denen eher Bionade denn Bier ausgeschenkt wird. Für Datenjournalisten wird die Suche nach den richtigen Zahlen und Statistiken dadurch erschwert.

Was ist eine Kneipe?

Hilfreich ist daher zunächst die Eingrenzung auf die „getränkeorientierte Gastronomie“, so der amtsdeutsche Begriff. Dann geht es um die Frage, wer entsprechende Zahlen erhebt und ob diese Daten öffentlich zugänglich sind. Erste Anlaufstelle für den Datendurst: die statistischen Ämter. Auf Bundesebene gibt es das Statistische Bundesamt, außerdem die jeweiligen Landesämter sowie kommunale Einrichtungen für Statistik. Die riesigen Datenmengen dieser öffentlichen Einrichtungen sind im Normalfall online verfügbar. Rasch finden sich Umsatzsteuertabellen, aus denen die Umsatzentwicklung im Gastgewerbe hervorgeht. In den Regionaldatenbanken entdeckt man dann auch die Anzahl der „aktiven Betriebe nach Wirtschaftsklassen“. Allerdings sind diese Wirtschaftsklassen breit definiert: Bars und Kneipen sind mit Hotels, Discotheken und Restaurants unter dem Begriff „Gastgewerbe“ zusammengefasst.

Wer also könnte über noch spezifischere Daten verfügen? Ein geeigneter Ansprechpartner ist unter anderem der Deutsche Hotel- und Gaststättenverband (DEHOGA). Dort werden regelmäßig Zahlen und Daten rund um die Hotel- und Gastronomiebranche erhoben. Auf den Seiten des Bundesverbandes und der jeweiligen Landesverbände sind Daten über die Anzahl der jeweiligen Betriebe bequem einsehbar. Gaststätten sind in Kategorien wie „Cafés“, „Schankwirtschaften“ und „Bars“ unterteilt. Der DEHOGA erhebt diese Daten laut eigenen Angaben aus der Umsatzsteuerstatistik des Statistischen Bundesamts. Allerdings endet die Onlinerecherche spätestens dann, wenn es um Datensätze über einzelne Städte geht. Die sind nämlich nicht zu finden.

Weitere Datensammler, die für Recherchen in Sachen Kneipendichte interessant sein können, sind daher die Industrie- und Handelskammern (IHK). Die liefern sogar stadtbezogene Daten im Zuständigkeitsgebiet der jeweiligen IHK. Jedoch sind auch hier Kneipen, Hotels, Discotheken und Co. unter dem Begriff „Gastgewerbe“ zusammengewürfelt. Wie gehen dann also die Stadtverwaltungen bei ihren Berechnungen vor? Viele Antworten der Pressestellen sind ernüchternd: Etwas so Spezifisches wie ein Kneipendichteindex wird gar nicht erst berechnet. Jedoch verweisen die Städte auf ihre Gewerbeämter: Dort sind nämlich alle Gaststätten in den Gewerberegistern verzeichnet. Allerdings wird nicht zwischen Cafés, Imbissen, Kneipen und Restaurants unterschieden.

      Praktische Tipps für die Datensuche:
  • Bevor man auf die Suche nach Zahlen geht, sollte man die Begrifflichkeit geklärt haben. Was genau zählt als “Kneipe”?
  • Die “Granularität” der Daten, die man braucht, ist für die Recherche entscheidend. Kann aus den vorhandenen Datensätzen also die Art der Gastronomie herausgelesen oder ein Ortsbezug hergestellt werden?
  • Neben Behörden (Statistische Ämter, Stadtverwaltungen, Gewerbeämter) sind auch Branchenverbände oft ein guter Einstiegspunkt für die Datenrecherche.

Jedes kleine Dorf ein Kneipenparadies?

So gibt es in Münster derzeit 1040 Gaststätten. Umgerechnet auf die Einwohnerzahl, ergibt das eine Gaststätte auf 275 Einwohner. Doch die Gewerberegister sind nicht öffentlich einsehbar. In Münster und anderen Städten erteilen die Ordnungsämter bei berechtigtem Interesse aber Auskünfte aus dem Gewerberegister – gegen eine Gebühr. Auch in Regensburg werden die vom „Amt für öffentliche Ordnung und Gewerbewesen“ erhobenen Zahlen normalerweise nicht veröffentlicht. Regensburg hat knapp 150.000 Einwohner und laut eigener Auskunft über 500 gastronomische Betriebe – also eine Gaststätte auf 300 Einwohner. In Marburg sind es 274 Einwohner pro Gaststätte, dort gibt es insgesamt 292 gastronomische Betriebe bei rund 80.000 Einwohnern. Doch mit den Bevölkerungszahlen ist das so eine Sache: Zwar wohnen viele Studenten in den jeweiligen Unistädten, sie sind dort oftmals aber nicht offiziell gemeldet und fallen somit aus der Einwohnerstatistik.

Überhaupt stellt sich früher oder später die grundlegende Frage nach den Berechungsmethoden. Gewöhnlich wird das Verhältnis der Einwohnerzahl zu den Gastronomiebetrieben berechnet. Anstatt den Einwohnerzahlen könnte man aber genauso gut auch die Stadtfläche heranziehen. In beiden Fällen ist wahrscheinlich jedes kleine Dorf mit einer Kirche und zwei Wirtshäusern rein statistisch ein Kneipenparadies.

Datenrecherche ist also weit mehr als ein bisschen googeln. Denn auch die schönste Visualisierung muss auf belastbaren Zahlen und Statistiken basieren. Nicht immer sind die gewählten Begriffe und Parameter eindeutig, häufig gibt es verschiedene Interpretationsmöglichkeiten. In Sachen Kneipendichte gilt dann auch eher: Es gibt wahrscheinlich nicht nur einen Sieger. Irrwege, auf denen man sich bei der Datenrecherche verlaufen kann, gibt es jedenfalls genug.

» nach oben



Statista: eine Welt aus Zahlen

von Jakob Rondthaler


Im Büro in Hamburg bereiten Mitarbeiter die Daten auf. Foto: statista.com

Welcher männliche Prominente hat den größten Sexappeal? Wie häufig essen die Deutschen abgepackte Wurst aus dem Kühlregal? Welche Web-2.0-Anwendungen nutzen Blinde in Deutschland? Und in welchen Ländern wird eigentlich das meiste Marihuana beschlagnahmt?

Auf Fragen, die sich die meisten Leute wohl niemals stellen würden, gibt es, irgendwo da draußen im Datendschungel, Antworten – in Form von wissenschaftlich erhobenen Daten. Statista, ein Unternehmen mit Sitz in Hamburg, sammelt Datensätze von Instituten, Fachzeitschriften und Ämtern, und bereitet diese auf, macht die Datensätze also einheitlich zugänglich. Nicht nur die Online-Portale des Spiegel, der Zeit und des Focus greifen auf das Angebot zurück.

Friedrich Schwandt und Tim Kröger haben Statista im Jahr 2007 gegründet. Mittlerweile sind nach eigenen Angaben 35 Mitarbeiter bei dem Unternehmen beschäftigt: Datenbank-Experten, Redakteure und Statistiker. Eine Welt, bestehend aus Zahlen? „Ich sehe hinter vielen Sachen Statistiken“, sagte Schwandt 2009 in einem NDR-Interview. Eine gewisse „Affinität zu Zahlen“ gebe es also sicherlich.


Die Gründer von Statista: Friedrich Schwandt (l.) und Tim Kröger. Foto: statista.com

Seit dem 20. Mai 2008 präsentiert das Unternehmen mehr als eine Million Statistiken auf statista.com. Das Spektrum umfasst Kategorien wie „Agrarwirtschaft“ oder „Gesellschaft“, Unterpunkte sind dann zum Beispiel „Fischerei“ oder „Demographie“. Die Datensätze werden mit Tags versehen, die die Suche erleichtern. So findet man schnell Statistiken, die mit den gefundenen zusammenhängen. Außerdem sind jeweils Originalquelle und Details zur Erhebung der Statistik genannt (beispielsweise, in welchem Zeitraum die Zahlen erhoben, und wie viele Menschen dafür befragt worden sind).

Der Service ist nicht billig: 139,90 Euro kostet eine einmonatige Nutzung der Plattform, für ein Jahresabo zahlt man 29,90 Euro im Monat. Ungefähr 20 Prozent der Statistiken gibt es kostenlos. Bei Daten, deren Recherche und Aufbereitung laut Unternehmen aufwändig ist, muss der kostenpflichtige Zugang genutzt werden. Quellen der kostenpflichtigen Statistiken seien vor allem Studien sowie Ergebnisse aus der aktuellen Marktforschung. Außerdem hat man mit dem kostenpflichtigen Zugang Zugriff auf die Rohdaten, die zu jeder Statistik im Excel-Format vorliegen.

Für wen ist Statista gemacht? „Zwei Nutzergruppen“, so Schwandt in einem Meedia-Interview: zum einen Geschäftskunden, darunter Journalisten und PR-Berater, auf der anderen Seite auch Privatleute – zum Beispiel „Studenten, für die Hausarbeit“. Studierende der Hochschule Darmstadt – und der Technischen Universität – können dank einer Campus-Lizenz auf die kostenpflichtigen Statistiken und deren Basisdaten zugreifen. Die Zahlen dürfen unbeschränkt weiterverwertet werden. Die Lizenz erlaubt es auch, die erstellten Statistiken zu veröffentlichen – gleiches Recht also wie für Inhaber des kostenpflichtigen „Premium-Accounts“.

Statista, von Spiegel Online einmal als „Google für Statistiken“ bezeichnet, bezieht Daten von Partnern – „aus weit über 10.000 unterschiedlichen Quellen“, wie auf der Homepage zu lesen ist. Dabei greift das Unternehmen unter anderem auf Zahlen des Instituts für Demoskopie Allensbach, der OECD und des Deutschen Institut für Wirtschaftsforschung zurück. Doch die Quellen können auch mal unkonventioneller sein: Wie die Zeit schon feststellte, stammen einige der angebotenen Statistiken über das Sexualleben der Deutschen (so die Frage, welche „speziellen sexuellen Erfahrungen“ man bislang gemacht habe) vom Kondom-Hersteller Durex.

Ach, übrigens: Richard Gere ist der Mann mit dem meisten Sexappeal, ihm folgt George Clooney, beide liegen deutlich vor Brad Pitt. Ein Viertel aller Deutschen isst mehrmals pro Woche abgepackte Wurst. Blinde Internet-Nutzer lesen vor allem Wikis, 60 Prozent hören Podcasts. Das meiste Marihuana wurde in den Jahren 2005 bis 2007 in den Niederlanden beschlagnahmt – so viel wie in Südafrika, Jamaika und Kolumbien zusammen.
» nach oben



Datenquellen für Datenjournalisten: Die Linkliste

von Michael Kulmus

Datenjournalisten sind auf öffentlich zugängliches Datenmaterial angewiesen. Oft machen staatliche Stellen und Behörden in diesem Bereich leider noch keine gute Figur. Das wird spätestens bei der Datenrecherche deutlich. Aber: Es tut sich was in Sachen Informationsfreiheit und Datentransparenz – weltweit. An dieser Stelle eine Auswahl hilfreicher Quellen für die professionelle Datensuche.

Das Statistische Bundesamt: Mächtiger Datenpool mit Verwirrungspotential

Egal ob Konjunkturdaten, Migrationszahlen, Sterbefälle oder Umsatzsteuertabellen: Das Statistische Bundesamt bietet eine Vielzahl an statistischen Daten. Das Datenmaterial ist öffentlich zugänglich und verifizierbar. Allerdings sollte man schon genau wissen, wonach man sucht – ansonsten kann sich die Suche wegen der vielen einzelnen Datensätze schnell in die Länge ziehen. Tiefer gegliederte Ergebnisse der statistischen Ämter in Deutschland sind über die Regionaldatenbank abrufbar. (Tabellenformate: CSV, Excel, HTML, PDF)


Die statistischen Ämter der Bundesländer

Weitere Datenquellen sind neben dem Statischen Bundesamt als überregionale Einrichtung auch die statistischen Ämter der Bundesländer. Dort finden sich regionalbezogene Zahlen und Auswertungen. Die jeweiligen Onlineangebote sind ähnlich strukturiert wie die Seite des Statistischen Bundesamtes.



Statista: Bequemes, aber kostenpflichtiges Werkzeug

Das private Portal wirbt unter anderem mit dem Motto: „Schneller recherchieren, effizienter arbeiten“. In der Tat: Wem die trockene Suche nach den richtigen Zahlen in den Datenbanken beispielsweise des Statistischen Bundesamtes zu mühsam ist oder wer gerade einfach keine Zeit für umfangreiche Datenrecherchen hat, der ist hier richtig. Denn das Unternehmen bietet die Datenvielfalt unterschiedlichster Quellen sorgfältig aufbereitet und bequem einsehbar an. Dafür ist der Großteil des Angebots aber kostenpflichtig, nur die Basis-Statistiken sind kostenfrei. (Tabellenformate: Excel)

Statistiken der Bundesagentur für Arbeit: Arbeitsmarktspezifische Daten

Das Statistikportal der Bundesagentur für Arbeit stellt detailliertes Datenmaterial rund um den deutschen Arbeitsmarkt zur Verfügung.. Das Datenmaterial ist nach Themenschwerpunkten sortiert und kann zeitlich und regional eingegrenzt werden. Auch grafische Darstellung in Form von Diagrammen und Landkartengrafiken werden angeboten. (Tabellenformate: Excel, PDF)

Zensus 2011: Ein Volk unter der Lupe

Gegen Ende 2012 werden die Ergebnisse der Befragungen im Rahmen des Zensus 2011 vorliegen. Ermittelt werden demografische und sozioökonomische Daten, sowie Daten zur Wohnsituation. Die letzte Volksbefragung fand 1987 statt. Die Ergebnisse dienen als Basisdaten für eine Vielzahl von statistischen Erhebungen und werden online zur Verfügung stehen.

Informationssystem der Gesundheitsberichterstattung: Das Gesundheitswesen der BRD in Zahlen gefasst

Umfangreiches Datenmaterial rund um unser Gesundheitswesen findet sich auf diesem Portal. Das Angebot existiert seit rund zehn Jahren und ist eine Gemeinschafts-einrichtung von Statistischem Bundesamt, Gesundheitsministerium und Robert-Koch-Institut. (Tabellenformate: CSV)

Statistikportal der Bundesbank

Datenmaterial rund um die Finanzpolitik in Deutschland und der EU stellt die Bundesbank zur Verfügung. So sind etwa aktuelle Zahlen und Statistiken zur Zinsentwicklung und Devisenkursen bequem abrufbar. Oft werden die Datensätze durch Fachartikel ergänzt. (Tabellenformate: CSV, PDF)

eurostat: Das Statistikportal der Europäischen Union

Das statistische Amt der Europäischen Union nennt sich eurostat. Daten der statistischen Ämter der EU-Mitgliedsstaaten werden hier zusammengeführt und veröffentlicht. So sind Vergleiche zwischen den EU-Ländern etwa im Bereich des Arbeitsmarktes möglich. Das eurostat-Onlineportal bietet mehrsprachigen, kostenfreien Zugriff auf die erhobenen Zahlen und Statistiken. (Tabellenformate: Excel, HTML, XML, CSV, PDF)

Statistiken der OECD

Der Organisation für wirtschaftliche Zusammenarbeit und Entwicklung (OECD) gehören derzeit 34 Mitgliedsstaaten an. Die Organisation erhebt nicht nur Daten im Rahmen der bekannten „PISA“-Studien, sondern ermittelt vor allem Wirtschaftskennziffern ihrer Mitglieder und anderer Staaten. Das zweisprachige (englisch und französisch) Statistikportal der OECD ermöglicht den kostenfreien Zugriff auf diese Daten. (Tabellenformate: Excel)

Statistiken der Vereinten Nationen: Der UN-Datenpool

Die Vereinten Nationen (UN) und die zahlreichen UN-Organisationen erheben eine Vielzahl von Statistiken. Etwa über die allgemeine Bevölkerungsentwicklung, den Energieverbrauch oder auch Handelsbeziehungen und Tourismus. Das relativ neue Internetportal greift auf die Daten der diversen UN-Organe zurück und ist somit ein hilfreiches Tool bei der Datenrecherche. (Tabellenformate: XML, Excel)

Statistikportal der WHO: Gesundheitsentwicklung weltweit

Durchschnittliche Lebenserwartung, Kindersterblichkeitsraten, HIV-Neuinfektionen – die Weltgesundheitsorganisation WHO sammelt weltweit entsprechende Daten und wertet diese aus. Die statistische Informationsseite der UN-Organisation bietet Zugriff auf die erhobenen Datensätze und macht Vergleiche zwischen Ländern und Regionen möglich. (Tabellenformate: CSV, Excel)

Statistikportal der WTO: Die Globalisierung in Zahlen gefasst

Die Welthandelsorganisation WTO erhebt ökonomische Kennzahlen weltweit und ermöglicht Einblicke in globale Handelsströme. Das Statistikportal der Organisation stellt neben den Basisdaten auch die entsprechenden Datendiagramme zur Verfügung.
(Tabellenformate: Excel, PDF)

Statistik Schweiz

Das Bundesamt für Statistik der Schweiz bietet umfassenden Zugriff auf die in den einzelnen Kantonen erhobenen statistischen Daten. Das Online-Angebot ist übersichtlich gestaltet und bietet einen Schnellzugriff auf bestimmte Themengebiete. Außerdem wartet die Seite mit einer „Zahl der Woche“ auf. (Tabellenformate: Excel)

Data.gov: Das Datenportal der US-Regierung
Der allgemeine Zugang zu Verwaltungsdaten hat im angelsächsischen Raum traditionell hohe Priorität. Seit zwei Jahren existiert das umfassende Datenportal der US-Regierung im Rahmen der „Open Government“-Initiative. Die Seite bietet schnellen Zugriff auf Datenbanken und grafische Datenvisualisierungen der amerikanischen Bundesbehörden – von Verbrechensstatistiken des FBI über Schadstoffdaten der Umweltschutzbehörde (EPA) bis hin zu Fluggastzahlen des Transportministeriums. (Tabellenformate: CSV, XML)

Kommentare