Veröffentlichung des GermaParl Korpus 1949-2021 für die Beta-Nutzung

Seit dem 23. Mai 2022 – dem Tag des Grundgesetzes – steht eine neue Version des GermaParl Korpus, das Plenardebatten des Deutschen Bundestages von 1949 bis 2021 enthält, für die Beta-Nutzung zur Verfügung. Das GermaParl Korpus wird unter der Leitung von Prof. Dr. Andreas Blätte in Zusammenarbeit mit Christoph Leonhardt an der NRW School of Governance entwickelt und bietet vielfältige Analysemöglichkeiten der parlamentarischen Sprache, Themensetzung und Praktiken im Deutschen Bundestag.  Das Korpus verfügt über umfassende linguistische Annotationen, ist reich an Metadaten und hat die Anforderungen der sozialwissenschaftlichen Forschung besonders im Blick. Insbesondere ist die Aufbereitung der Rohdaten reproduzierbar, so dass die Datenqualität sukzessive verbessert werden kann.

Interessierte Wissenschaftler*innen können über die Website von Zenodo Zugang zu den Daten erhalten und als Beta-Nutzer*innen mit den Daten arbeiten. Während der Betaphase – und darüber hinaus – sind alle Nutzer*innen herzlich dazu eingeladen, Feedback zu den Daten und den dazugehörigen Tools zu geben, um die Qualität des Korpus zu sichern und verbleibende Fehler zu beseitigen. Neben dem Bericht konkreter Fehlermeldungen soll es am 19. Juli 2022 einen Nutzer*innenworkshop geben, um mehr über die Erfahrungen bei der Arbeit mit dem Korpus zu lernen und die Nutzer*innenfreundlichkeit der Ressource zu erhöhen. Nach dem Abschluss dieser Feedbackschleife im Herbst soll das Korpus der gesamten wissenschaftlichen Community Open Access über Zenodo zur Verfügung stehen.

Diese Weiterentwicklung des Korpus wurde durch die Finanzierung durch KonsortSWD und Text+ im Rahmen der nationalen Forschungsdateninfrastruktur (NFDI) mitermöglicht. Mit der manuellen Qualitätskontrolle hat das SOLDISK Team an der Universität Hildesheim maßgeblich zur Qualität des Korpus beigetragen.

Teile diesen Inhalt: