Wissenschaft & Datenjournalismus: Start von acht Projekten

In der Ausschreibung "Wissenschaft und Datenjournalismus" hat ein internationales Gutachtergremium entschieden: Für acht Projektideen wurden insgesamt 750.000 Euro durch die VolkswagenStiftung bewilligt.

Das Echo auf die Ausschreibung "Wissenschaft und Datenjournalismus" war groß: 81 Anträge gingen bis zum Stichtag im Juni 2015 bei der Stiftung ein und gingen zur Begutachtung an ein internationales Expertengremium. Ihm gehörten einerseits renommierte Datenjournalist(inn)en an, andererseits Vertreter(innen) verschiedener wissenschaftlicher Disziplinen: Informatik, Statistik, Soziologie und Künstliche Intelligenz. Bei der anschließenden Sitzung des Gutachtergremiums in Hannover wurden der Stiftung acht Projekte mit einer Fördersumme von insgesamt 750.000 Euro empfohlen und von der VolkswagenStiftung bewilligt. Nach einem gemeinsamen Auftaktworkshop der neu geförderten Journalist(inn)en und Wissenschaftler(innen) am 22. Oktober 2015, dem Vortag der Fachtagung "Datenlabor" des Netzwerks Recherche an der TU Dortmund, haben die Gruppen ihre Arbeit aufgenommen. Für die Realisierung der Projekte ist ein Zeitraum von neun Monaten vorgegeben. Die Ausschreibung soll 2016 mit einem zweiten Workshop enden, bei dem die Geförderten ihre Projektergebnisse vorstellen. Die VolkswagenStiftung wird die Zeit bis dahin, aber auch den Workshop selbst, dazu nutzen, das Thema "Wissenschaft und Datenjournalismus" zu vertiefen und den Austausch mit Wissenschaftler(inne)n und Journalist(inn)en fortzusetzen.

Kurzbeschreibungen der bewilligten Projekte:

Networks of Outrage: Mapping the Emergence of New Extremism in Europe (Prof. Dr. Jeanette Hofmann, Dr. Cornelius Puschmann, Julian Ausserhofer, Alexander von Humboldt-Institut für Internet und Gesellschaft gGmbH, Berlin; Noura Maan, Markus Hametner, Der Standard)

Soziale Netzwerke spielen in der Selbstorganisation und Interaktion rechter Protestbewegungen wie Pegida in Europa eine immer größere Rolle. Das Projekt wird die Social-Media-Kommunikation von mehreren Formationen aus europäischen Ländern bis auf die Ebene individueller Meinungsführer ergründen, kartographieren und in einem zweiten Schritt quantitativ analysieren. Für die Publikation sind ergänzend aktuelle Reportagen von drei Schauplätzen geplant, die aufgrund der vorangegangenen Analyse ausgewählt werden.  Geplant sind einerseits wissenschaftliche Veröffentlichungen, andererseits Beiträge in der Zeitung und der Onlineausgabe des österreichischen Mediums Der Standard. Um eine größtmögliche Reichweite sicherzustellen, werden für Deutschland und die Schweiz Veröffentlichungspartner involviert.

Data Extraction and Interactive Visualization of Unexplored Textual Datasets for Investigative Data-Driven Journalism (Prof. Dr. Chris Biemann, Dr.-Ing. Tatiana Landesberger von Antburg, Dr. Alexander Panchenko, Kathrin Ballweg, TU Darmstadt; Marcel Rosenbach, Dr. Michaela Regneri, Der Spiegel)

Journalist(inn)en sind im Arbeitsalltag gezwungen, immer mehr Informationen in immer kürzerer Zeit zu erfassen und zu bewerten. Unterstützen soll sie dabei in Zukunft ein Analyse-Tool, das die neuesten Forschungserkenntnisse aus der automatischen Sprachverarbeitung und der Informationsvisualisierung verbindet. Es wird Journalist(inn)en ermöglichen, den Inhalt großer Textmengen (auf Englisch und Deutsch) schnell zu erfassen, indem es in intuitiver Weise darstellt, welche Akteure im Text wie miteinander in Verbindung stehen. Gleichzeitig wird das Tool auch publizierbare Datenansichten liefern und den Leser(inne)n ermöglichen, die Sicht des Journalisten auf die Daten nachzuvollziehen. Eine Publikation ist u. a. bei SPIEGEL ONLINE geplant.

#socialcontagion: An Analysis of Virtual Social Networks in Non-Suicidal Self-Injury (PD Dr. Paul Plener, Universitätsklinikum Ulm; Robert Young, University of Glasgow; David Goldwich, freiberuflicher Software Entwickler und Datenjournalist; Tin Fischer, freier Journalist)

Das soziale Netzwerk Instagram wird von Teenagern dafür benutzt, Fotos und Bilder von Selbstverletzungen (sogenanntes "Ritzen") zu verbreiten und zu kommentieren – ein weltweit zu beobachtendes, bislang aber nicht erforschtes Phänomen. Die Projektgruppe #socialcontagion wird ein Auswertungstool programmieren, mit dessen Hilfe die in Frage kommenden Fotos bei Instagram systematisch erfasst und näher untersucht werden, um mehr über die Motive und Interaktionen der beteiligten Jugendlichen herauszufinden. Anhand dieser Erkenntnisse könnten Präventionsprogramme verbessert und der Umgang von Instagram mit diesem Phänomen (Bilder von Selbstverletzungen werden nicht so strikt sanktioniert wie Pornografie) hinterfragt werden.  Publikationen sind als datenjournalistische Reportagen im Print sowie als Social-Media-Reportage auf Instagram geplant. 

Data-Driven Campaign Coverage (Dr. Andreas Graefe, Mario Haim, LMU München; Mirko Lorenz, Deutsche Welle; Saim Alkan, AX Semantics)

Bewertet ein Rezipient einen Artikel anders, wenn ihm die Recherchemethoden und Datenquellen offengelegt werden? Wie nehmen Leser Inhalte auf, die auf der Visualisierung großer Datensätze beruhen? Wie beurteilen sie die Qualität computergenerierter Artikel? – Diese drei Fragen stehen im Mittelpunkt eines Projekts, das am Beispiel der US-Wahlkampfkampagne für 2016 die Potenziale datenjournalistischer Anwendungen evidenzbasiert untersuchen wird. Das Projekt baut auf der Plattform PollyVote auf, an deren Entwicklung Gruppenmitglieder beteiligt waren und die seit 2004 auf wissenschaftlicher Basis Wahlprognosen erstellt.

Debate Explorer: Interactive Journalistic Investigation of Large Text Collections (Prof. Dr. Jonas Kuhn, Universität Stuttgart; Eva Wolfangel, freie Wissenschaftsjournalistin)

Wer sich in der politischen Debatte zu Wort meldet, verfolgt bestimmte Interessen. Doch Politiker(innen) ändern bisweilen ihre Argumentation oder Standpunkte. Warum? Eine klassische Fragestellung für investigative Journalist(inn)en. Mit dem DebateExplorer wollen Computerlinguist(inn)en und Datenjournalist(inn)en in diesem Projekt eine technische Lösung schaffen, die es investigativen Journalist(inn)en erlaubt, mit einfach zu handhabenden Filtern enorm umfängliche, heterogene und in die Vergangenheit reichende Textbestände (Parlamentsberichte, Ausschussprotokolle, Antworten auf parlamentarische Anfragen, Gesetzesentwürfe etc.) für ihre individuellen Zwecke auszuwerten. Die intuitive Suchmöglichkeit soll dazu beitragen, die sich stetig verringernde Zeit für tiefgründige Recherchen zu kompensieren. Für die beteiligten Wissenschaftler(innen) ist die Kooperation mit Journalist(inn)en ein Testfeld, um die bislang unter experimentellen Bedingungen angewandten computerlinguistischen Analysen auf extrem heterogene, "Real Life"-Datensätze zu übertragen und daraus neue Forschungsfragen zu entwickeln. Mit dem DebateExplorer wollen Computerlinguist(inn)en und Datenjournalist(inn)en in diesem Projekt eine technische Lösung schaffen, die es investigativen Journalist(inn)en erlaubt, mit einfach zu handhabenden Filtern enorm umfängliche, heterogene und in die Vergangenheit reichende Textbestände (Parlamentsberichte, Ausschussprotokolle, Antworten auf parlamentarische Anfragen, Gesetzesentwürfe etc.pp.) für ihre individuellen Zwecke auszuwerten - beispielsweise um den Einfluss von Lobbyisten auf die Gesetzgebung zu untersuchen. Publikationen sind u. a. bei Spektrum der Wissenschaft und Bild der Wissenschaft geplant.

Combining Data of Different Spatial Granularity (CoGran) (Prof. Dr. Ing. Jochen Schiewe, HafenCity Universität Hamburg; Julius Tröger, Berliner Morgenpost)

Thematische Karten, bspw. die empirische Verteilung von Kriminalfällen nach Stadtgebieten, sind ein Klassiker im Datenjournalismus. Problematisch wird es, wenn man mehrere Themen in einer einzigen Stadtkarte übereinanderlegt und kombinieren will, um auf diese Weise zu neuen journalistischen Fragestellungen oder wissenschaftlicher Erkenntnis zu gelangen. Denn je nach Qualität der zugrunde liegenden Datensätze weisen die Karten zu verschiedenen Aspekten eine höchst unterschiedliche Detailgenauigkeit aus, inhaltlich wie geografisch. Dies wiederum ist der Grund dafür, warum sich unterschiedliche thematische Landkarten kaum miteinander kombinieren lassen, zumindest nicht, wenn man eine wissenschaftlich belastbare Empirie anstrebt. Geoinformatiker(innen) und Datenjournalist(inn)en wollen in diesem Projekt versuchen, eine Software zu entwickeln, die unter Einhaltung wissenschaftlicher Standards die Verbindung geografischer Themenkarten ermöglichen soll. Das Arbeitsergebnis wird als Open Source Software Tool interessierten Journalist(inn)en und Wissenschaftler(inne)n zur Verfügung stehen, um gemeinsam daran weiterzuarbeiten.  Eine Publikation ist in der Berliner Morgenpost (Interaktiv-Team mit Julius Tröger) geplant.

Check Your Government (Prof. Dr. Lutz Maicher, Universität Jena und Fraunhofer-Zentrum Leipzig; Ian Michael Prilop, Fraunhofer-Zentrum Leipzig; Ingrid Müller, Hendrik Lehmann, Jost Müller-Neuhof, Der Tagesspiegel)

Wer macht wirklich die Gesetze in Deutschland? Zumeist unbemerkt von der Öffentlichkeit nehmen Interessenvertreter(innen) schon früh Einfluss auf Gesetze. Nach welchen Mustern diese Prozesse verlaufen, will die Projektgruppe entschlüsseln. Dafür will sie transparent machen, an welchen Stellen des Gesetzgebungsverfahrens welche Beziehungen zwischen Regierungsvertreter(inne)n, Bundestagsabgeordneten und externen Akteur(inn)en bestanden. Das Leipziger Fraunhofer-Zentrum für Internationales Management und Wissensökonomie wird für die Analyse die Datensätze bestehender Initiativen wie "Offenes Parlament", "Lobbypedia", "Lobbycloud", "Lobbyradar" und "DIGIWHIST" strukturiert auswerten und mit neuen Datensätzen aus verschiedenen Quellen ergänzen. Dafür sollen Quellen verwendet werden, die öffentlich zugänglich sind, aber bisher nicht ausgewertet wurden. Das Projektteam will darüber hinaus gemeinsam neue Quellen erschließen. Die Offenlegung der Mechanismen von Einflussnahme auf die Gesetzgebung soll Journalist(inn)en neue Ansatzpunkte für Recherchen liefern. Die beteiligten Wissenschaftler(innen) versprechen sich neue Ansätze und Methoden für die Konkurrenz- und Wettbewerbsanalyse. Wichtige Bereiche der im Projekt entwickelten Informationsplattform sollen nach einer Übergangszeit der interessierten Öffentlichkeit zur Nutzung zur Verfügung stehen.  Über ihre Arbeit wird die Projektgruppe auf tagesspiegel.de berichten.

Bail-in Tracker – BAT (Prof. Dr. Martin Richard Götz, Prof. Dr.Tobias Tröger, Universität Frankfurt/Main; Stephan Lorz, Börsen-Zeitung)

Die Banken- und Finanzkrise hat den deutschen Steuerzahler Abermilliarden von Euro gekostet: Banken wurden gerettet, Rettungsfonds aufgelegt, Konjunkturhilfen finanziert und rezessionsbedingte Steuermindereinnahmen hingenommen. Um künftige Krisen zu verhindern und Banken gegenüber Finanzschocks widerstandsfähiger zu machen, wurde die Regulierung verstärkt, Eigenkapitalanforderungen erhöht und Abwicklungsmechanismen entwickelt, um den Rückgriff auf den Steuerzahler zu verhindern. Stattdessen soll zunächst der (höhere) Eigenkapitalpuffer aufgebraucht sowie Aktionäre und Gläubiger zur Bankenrettung herangezogen werden. Allerdings kann die Wirkung und Wechselwirkung eines solchen Bail-in noch kaum abgeschätzt werden. Der "Bail-in-Tracker" soll nun durch die Analyse eines großen Datensatzes (emittierte Anleihen) das Bail-in-fähige Fremdkapital europäischer Banken im Zeitablauf erfassen, um die Effektivität eines Bail-in beurteilen zu können. Entscheidend ist die rechtliche Klassifizierung der Anleihen (juristische Prüfung), weil nicht alle diese Papiere im Krisenfall "bail-in-fähig" sind. Diese Daten werden auf folgende Fragen geprüft: Wäre die Möglichkeit des Bail-ins während der Finanzkrise ausreichend gewesen, um die Staatsfinanzierung krisengeschüttelter Banken zu vermeiden? Haben Banken auf die rechtliche Möglichkeit des Bail-in reagiert, indem sie ihr Emissionsverhalten verändert haben, um ihr Bail-in-fähiges Fremdkapital zu verringern?  Auf einer gemeinsamen Internetplattform werden die Erkenntnisse der Öffentlichkeit interaktiv präsentiert. Interessierte Nutzer sollen sich etwa über die aktuelle Höhe des Bail-in-fähigen Fremdkapitals europäischer Banken informieren können.

Die Datenjournalismusprojekte fokussieren sich unter anderem auf die Analyse von Vernetzungen. (Foto: djahan - Fotolia.com)