MigPress-Workshop: Textdaten für die Migrations- und Integrationsforschung

Prof. Dr. Andreas Blätte im MigPress-Workshop

In einem zweiteiligen Workshop des Projektes „MigTex – Textressourcen für die Migrations- und Integrationsforschung“ wurden die Datenbestände des Projekts vorgestellt. Wie können größere Textdaten aufbereitet und für die Forschung genutzt werden? Diese Frage zu erörtern stand im Fokus der Veranstaltung. Die Organisation und Konzeption unterlag Prof. Dr. Andreas Blätte, der Projektmitarbeiterin Merve Schmitz-Vardar sowie dem Projektmitarbeiter Christoph Leonhardt.

Der „Mining Migration Debates – Workshop II” widmete sich im ersten Teil dem parlamentarischen Diskurs. Hier wurde in das Datenpaket MigParl kompakt eingeführt, das einen thematischen Korpus migrations- und integrationspolitisch relevanter Reden der 16 deutschen Landtage (und perspektivisch des Deutschen Bundestages) von 2000 – 2018 darstellt. Auch wurde die Analyseumgebung polmineR und die korpuslinguistische Methoden, die in diesem Kontext angewendet werden können, vorgestellt und diskutiert.

Der Fokus des zweiten Teil des Workshops lag auf dem Datenpaket MigPress – Das DeZIM-Zeitungskorpus. Das Korpus ist eine Sammlung der migrations- und integrationspolitischen Berichterstattung zweiter überregionaler Tageszeitungen, namentlich der Süddeutschen Zeitung (2000-2019) und der Frankfurter Allgemeinen Zeitung (2000-2018). Nach der Vorstellung der unterschiedlichen lizenzrechtlichen Regelungen und Zugänge, wurde die Strategien beim Sampling der relevanten Artikel vorgestellt. Die Abschlussdiskussion orientierte sich an den Forschungsbedarfen mit der Frage „Was ist migrations- und integrationspolitisch relevant?“.

Die überaus positive und erfolgreiche Rückmeldung der Teilnehmenden verdeutlicht erneut, dass der Datenaufbereitungsprozess in den meisten Fälle die eigentliche Hürde bei der Arbeit mit größeren Textdaten ist. Das Interesse der Teilnehmenden war – neben Einblicke in Projekte der DeZIM-Gemeinschaft und maschinenlesbare Aufbereitung von Textdaten – die Daten für ihre eigene Forschung nutzbar zu machen.

Das MigTex-Projekt hat das Ziel, grundlegende und relevante Datenbestände für den Forschungsbereich zu identifizieren, zu analysieren, in maschinenlesbarer Form aufzubereiten und nachhaltig bereitzustellen. MigTex wird in einer Kooperation zwischen der Universität Duisburg-Essen (Interdisziplinäres Zentrum für Integrations- und Migrationsforschung / InZentIM) und dem Wissenschaftszentrum Berlin (WZB) durchgeführt und durch das Bundesministerium für Familie, Senioren, Frauen und Jugend (BMFSFJ) gefördert. Das MigTex-Projekt baut dabei auf der Infrastruktur, der Codebasis und den Zielsetzungen des PolMine-Projektsauf. Als Strukturprojekt trägt es zur Forschungsdateninfrastruktur des Deutschen Zentrums für Migrations- und Integrationsforschung (DeZIM) bei.

Teile diesen Inhalt: