Vor der Bundestagswahl haben wir in einem Blogbeitrag das Wahlprogrammquiz vorgestellt. Zur Erinnerung: Das Wahlprogrammquiz hat (beinah) zufÀllig ausgewÀhlte SÀtze aus den Wahlprogrammen der sechs (nun) im Bundestag vertretenen Parteien angezeigt. Die Nutzerinnen[1] musste dann raten, bei welcher Partei der jeweilige Satz im Wahlprogramm steht.
Archiv des Autors: Jirka Lewandowski
Der Manifesto Corpus: ein mehrsprachiges, annotiertes und digitales Wahlprogrammarchiv
dieser Beitrag ist bereits zuvor auf dem digital humanities Blog erschienen.
Der Berliner Digital-Humanities Preis ging dieses Jahr an den Manifesto Corpus. Der InterdisziplinĂ€re Forschungsverbund Digital Humanities in Berlin zeichnet mit diesem Preis âherausragende Berliner Projekte auf dem Gebiet der Digital Humanitiesâ aus. Doch, was ist der Manifesto Corpus eigentlich, wo kommt er her, was kann man mit ihm machen und wie kann man ihn nutzen?
Eine EinfĂŒhrung
Der Manifesto Corpus ist ein frei zugĂ€nglicher, digitaler, mehrsprachiger und annotierter Textkorpus von Wahlprogrammen. Er erlaubt die Analyse von Sprache, Positionen und PrioritĂ€ten von politischen Parteien in vielfĂ€ltiger Art und Weise. Die Textsammlung umfasst Wahlprogramme von Parteien aus ĂŒber 45 LĂ€ndern in 34 Sprachen. Dabei handelt es sich gröĂtenteils um OECD-Demokratien. Damit hat die Sammlung einen starken Fokus auf europĂ€ische LĂ€nder (West und Osteuropa), doch sie umfasst auch zahlreiche auĂereuropĂ€ische Demokratien wie Australien, Neuseeland, USA, Mexiko und SĂŒdafrika. Insgesamt beinhaltet die Sammlung fast 2.000 maschinenlesbare Dokumente von mehr als 500 Parteien und 350 Wahlen seit 1945. Folgende Grafik veranschaulicht die Abdeckung des Manifesto Corpus: Je stĂ€rker ein Land eingefĂ€rbt, desto mehr Dokumente sind digital verfĂŒgbar.
Wo kommt er her: Auf den Schultern von (analogen) Giganten
Die Wurzeln des Manifesto Corpus reichen bis in die spĂ€ten 1970er Jahre zurĂŒck. Damals wurde die Manifesto Research Group (MRG) als Forscher_innengruppe von Ian Budge initiiert mit dem Ziel, auf Basis einer inhaltsanalytischen Untersuchung von Wahlprogrammen lĂ€nderĂŒbergreifende vergleichbare Analysen ĂŒber die Positionen der Parteien machen zu können. Hans-Dieter Klingemann institutionaliserte das Forschungsvorhaben und siedelte das Projekt als Comparative Manifestos Project (CMP) ab 1989 am Wissenschaftszentrum Berlin fĂŒr Sozialforschung (WZB) an. Seit 2009 wird das Projekt als Manifesto Research on Political Representation (MARPOR) im Rahmen einer Langfristförderung durch die Deutsche Forschungsgemeinschaft finanziert. Aktuell ist es unter der Leitung von Andrea Volkens am Wissenschaftszentrum Berlin fĂŒr Sozialforschung in der Abteilung Demokratie & Demokratisierung von Wolfgang Merkel angesiedelt.
Forschungsinteresse des Manifesto-Projekts sind Positionen und PrioritĂ€ten von politischen Parteien in Demokratien. Wie verĂ€ndert sich eine Partei ideologisch ĂŒber Zeit und welche Themen priorisiert sie: Gibt es Belege fĂŒr eine Sozialdemokratisierung der CDU? Wendet sich die SPD in den letzten Jahren stĂ€rker neoliberalen Wirtschaftspositionen zu? Zudem lĂ€sst sich auch untersuchen, wie sich Position und PrioritĂ€ten zwischen Parteien unterscheiden: Vertreten grĂŒne Parteien in unterschiedlichen LĂ€ndern nicht nur bei Umweltfragen Ă€hnliche Themen? Welche Rolle spielen Wirtschaftsthemen oder die EuropĂ€ische Union fĂŒr unterschiedliche Parteien? Um solche Fragen zu beantworten, analysieren LĂ€nderexpert_innen jedes Statement in den Wahlprogrammen nach einem 56 Kategorien umfassenden Analyseschema, das alle relevanten Politikbereiche und Themen umfasst. Damit können Aussagen darĂŒber gemacht werden, welche Themen wie oft in einem Wahlprogramm vorkommen und welche Positionen Parteien einnehmen. Die erhobenen Daten stellt das Manifesto-Projekt schlieĂlich in einem frei zugĂ€nglichen Datensatz Wissenschaftler_innen und politisch Interessierten zur VerfĂŒgung.
In der Vergangenheit mussten die Wahlprogramme direkt vor Ort gesammelt werden und analog, mit Stift auf Papier, analysiert werden. Seit 2009 hat das Projekt alle vorhandenen Manifestos sowie schlieĂlich auch den Prozess der Dokumentensammlung und -aufbereitung digitalisiert. Die Originaldokumente werden seitdem als PDFs gesammelt, maschinenlesbar gemacht und mit Metadaten zu Sprache, Partei und Wahljahr versehen. Im Anschluss annotieren Muttersprachler_innen digital jedes Statement eines Wahlprogramms nach dem vorgegeben Analyseschema.
Ein wesentliches Ergebnis dieses digitalen Prozesses ist der Manifesto Corpus. Er enthÀlt die Originaltexte sowie Annotationen, schafft somit eine hohe Transparenz der Datenerhebung und ermöglicht vollstÀndig reproduzierbare Analysen. Damit eröffnen sich neue Wege in der Nutzung der Daten und gestatten einen umfassenden Zugriff auf die Programmatik von Parteien.
Was kann man mit dem Corpus machen?
Die von LĂ€nderexpert_innen vorgenommenen Annotationen erlauben den Vergleich zwischen verschiedenen Parteien und welche Bedeutung sie einem bestimmten Thema in ihrem Wahlprogramm einrĂ€umen. Mit Hilfe des Corpusâ und automatisierter Textanalyse lĂ€sst sich nun noch viel genauer beobachten, wie Parteien ĂŒber diese Themen sprechen und ob sie sich in der Art, wie sie Themen diskutieren, unterscheiden. Die menschlichen Kodierungen können beispielsweise genutzt werden, um aus einem Wahlprogramm alle Textstellen zu einem bestimmten Thema zu extrahieren. Eine beispielhafte Illustration findet sich in der folgenden Grafik:
Die Grafik zeigt die WorthĂ€ufigkeiten in den Programmen von CDU/CSU und den GrĂŒnen zu den Themen Multikulturalismus und kulturelle Traditionen. Je gröĂer die Wörter, desto hĂ€ufiger sind sie im Wahlprogramm zu finden. âDeutschlandâ ist bei beiden Parteien das am meisten vorkommende Wort, aber darĂŒber hinaus gibt es deutliche Unterschiede. WĂ€hrend bei den GrĂŒnen Worte wie âGesellschaftâ, âMenschenâ und âVielfaltâ im Vordergrund stehen, sind es bei CDU/CSU âDeutscheâ, âLandâ und âunsereâ. Dieser Vergleich der WorthĂ€ufigkeiten gibt einen ersten Eindruck darĂŒber, in welchem Zusammenhang Multikulturalismus von beiden Parteien diskutiert wird und eignet sich damit als Startpunkt fĂŒr detailliertere Analysen.
Die Forschungsfragen mĂŒssen dabei nicht auf Deutschland begrenzt sein, denn der Corpus beinhaltet Wahlprogramme aus 45 LĂ€ndern. Wir können uns also nicht nur den Diskurs ĂŒber Multikulturalismus innerhalb eines Landes anschauen, sondern auch wie dieses Thema in unterschiedlichen LĂ€ndern von Parteien diskutiert wird. Hier zum Beispiel in Deutschland, in den USA und in Finnland:
In allen LĂ€ndern sind das eigene Land und die eigenen BĂŒrger die wichtigsten Worte im Zusammenhang mit Multikulturalismus: âDeutschlandâ, âAmericansâ, âAmericaâ und âSuomenâ. Es lĂ€sst sich erkennen, dass die Debatte in den USA besonders mit der nationalen Sicherheit verknĂŒpft ist, in Deutschland Integration und Gesellschaft eine wesentliche Rolle spielen und in Finnland der Name einer rechtspopulistischen Partei (perussuomalaisten, die âWahren Finnenâ) aber auch das Wort âsozialâ eine wichtige Rolle spielen.
Die Wahlprogramme lassen sich auch unabhĂ€ngig von der menschlichen Kodierung betrachten, um etwa die Konjunktur eines bestimmten Begriffs in dem politischen Diskurs zu beobachten. Aktuell ist âFluchtâ eines der bedeutendsten Themen in der öffentlichen Debatte in Deutschland. Bereits in der Vergangenheit hat das Thema schon eine wichtige Rolle gespielt. Die folgende Grafik zeigt, dass sich die deutschen Parteien auch in den 50er Jahren viel mit Fluchtthematiken beschĂ€ftigt haben â damals im Kontext der eigenen Fluchterfahrung vieler Deutscher.
Ein ganz anderes Bild ergibt sich, wenn man sich die HĂ€ufigkeit des Wortes âdigitalâ in den Wahlprogrammen anschaut – ein Thema ohne das es Projekte wie den Manifesto Corpus nicht geben wĂŒrde. Lange Zeit kam es auf der politischen Agenda so gut wie nicht vor, bis seine Bedeutung in den neunziger Jahren exponentiell anstieg.
Wie kann man ihn nutzen: Vielseitiger Zugang
Ăber unsere Webseite und eine API (engl. application programming interface â dt. Programmierschnittstelle) stellen wir verschiedene Zugriffsmöglichkeiten auf die Daten bereit. So können Forscher_innen und politisch Interessierte unterschiedlichen Fragen zur thematischen Ausrichtung von Parteien nachgehen. Die Daten sind am einfachsten ĂŒber die Projektseite abrufbar. Sie können sowohl als Rohdaten heruntergeladen werden als auch auf unserer Website analysiert werden. Technisch versiertere Nutzer_innen können die API mit ihrer prĂ€ferierten Programmiersprache ansprechen. Zudem haben wir das Software-Paket manifestoR entwickelt, welches den Zugriff auf und den Umgang mit den Daten in R – einer der Standardsprachen fĂŒr statistische Problemstellungen – erleichtert und eine Integration in bestehende Textanalyse-Werkzeuge derselben erlaubt. Die Software ist frei zum Download verfĂŒgbar und quelloffen.
Der Manifesto Corpus ist die umfangreichste, mehrsprachige, annotierte, digitale Sammlung von Wahlprogrammen. Er wird stĂ€ndig erweitert, ist frei zugĂ€nglich und ermöglicht die Bearbeitung vielfĂ€ltiger Fragestellungen. Bereits in der Vergangenheit hat das Projekt zahlreiche Forschungsarbeiten angeregt und möchte zukĂŒnftig mit dem Manifesto Corpus Inspiration und Datengrundlage sein fĂŒr Forschung in Politikwissenschaft, Soziologie, Linguistik, Computer Science, Economics, etc.
Mehr Informationen zum Manifesto Corpus:
– Website of the Manifesto Corpus
– Explore Corpus Online
– The Manifesto Corpus: A new resource for research on political parties and quantitative text analysis (Open-Access Artikel in Research & Politics)