Herzlich Willkommen!
Kurzbeschreibung
GraphVar ist ein Korpus, das aus über 1.600 Abiturklausuren der Fächer Deutsch, Biologie und Geschichte besteht. Die Klausuren wurden zwischen 1923 und 2018 an einem nordwestdeutschen Gymnasium geschrieben. Das Korpus eignet sich primär, aber nicht ausschließlich für linguistische Untersuchungen; auch für didaktische, soziologische sowie geschichtswissenschaftliche Fragestellung ist es relevant. Im Moment (Version 4, Stand September 2021) sind 1398 Klausuren mit mehr als 2 Mio. Tokens verfügbar. Das sind alle Jahrgänge nach 1948; die übrigen Jahrgänge werden sukzessive eingepflegt.
Der Zugang erfolgt über das Korpus-Suchtool ANNIS. Bei wissenschaftlichem Interesse können Sie hier mit uns Kontakt aufnehmen, um einen Zugang zu beantragen. Bitte spezifizieren Sie kurz Ihre Fragestellung und den Hintergrund Ihrer Arbeit. Bei Fragen helfen wir Ihnen gerne weiter. Alternativ steht das aktuelle Korpus im EXMARaLDA-Format zum Download zur Verfügung. Benutzername und Passwort stimmen mit den von uns ausgegebenen Daten für ANNIS überein.
Die Daten sind anonymisiert, sodass kein Rückschluss auf Einzelpersonen gezogen werden kann. In den Metadaten sind Neben dem jeweiligen Fach und dem Jahrgang das Geschlecht sowie die Benotung der Arbeit abrufbar. Alle Texte sind transkribiert, normalisiert sowie hinsichtlich der Fehlerannotiert. Jedem laufenden Wort sind außerdem Wortart und Lemma zugewiesen; jeder Satz ist hinsichtlich seiner Topologie annotiert (und bereits teilweise manuell validiert).
Das Korpusprojekt wird vom Lehrstuhl für Germanistische Linguistik der Rheinischen Friedrich-Wilhelms-Universität Bonn betrieben, der seit dem Wintersemester 2019 von Prof. Dr. Kristian Berg besetzt ist.
Eine weiterführende Dokumentation über das Korpus finden sich in der Dokumentation.
Eine Liste bereits publizierter Arbeiten ist unter der Rubrik Forschung einsehbar. Wir würden uns freuen, wenn wir Ihre Arbeit nennen dürfen!