Johannes Hellrich

johannes_hellrich

Dienstadresse

Johannes Hellrich, M.A.
Friedrich-Schiller-Universität Jena
Graduiertenkolleg „Modell Romantik“
Bachstraße 18k | R. 115
07743 Jena
johannes.hellrichuni-jena.de
Tel. +49 (0) 3641 9 44199
http://www.julielab.de/Staff/Johannes+Hellrich.html

Curriculum Vitae

Johannes Hellrich (geb. 1982) studierte 2006 bis 2010 in einem Bachelorstudiengang die Fächer Deutsche Philologie und Geschichte an der Universität Regensburg. Von 2010 bis 2012 absolvierte er einen Masterstudiengang Germanistische Sprachwissenschaft an der FSU Jena. Während seines Studiums war er Hilfskraft am Institut für Germanistik an der Universität Regensburg und am Lehrstuhl für Computerlinguistik der FSU Jena. Von 2012 bis 2015 war Johannes Hellrich dort wissenschaftlicher Mitarbeiter im Rahmen des EU-Projekts MANTRA. Seit Oktober 2015 ist er Kollegiat des Graduiertenkollegs „Modell Romantik“.

Dissertationsprojekt

Automatische Analyse diachroner Bedeutungsdimensionen der Lexik der Romantik

Ziel dieser Arbeit ist es, Bedeutungsunterschiede in der für die Romantik relevanten Lexik zu quantifizieren. Als relevant werden dabei die Wörter betrachtet, die häufig in der Literatur der Romantik verwendet werden, aber auch die Wörter „romantisch“ und „Romantik“. Die Untersuchungen werden die letzten beiden Jahrhunderte und mehrere europäische Sprachen umfassen, wobei vorrangig diachrone, aber auch synchrone Vergleiche geplant sind.
Technische Grundlage sind Verfahren aus der Computerlinguistik, mittels derer die Semantik von Wörtern über ihren Kontext approximiert wird. Es ergibt sich ein hochdimensionaler Vektorraum, im einfachsten Fall direkt durch die Kookkurrenzen bestimmt, aus dem dann eine niederdimensionale Repräsentation gewonnen werden kann. Diese Repräsentationen können durch mathematische Verfahren synchron und diachron auf ihre Ähnlichkeit hin verglichen werden, wodurch Bedeutungswandel quantifizierbar wird. Konkret sollen Verfahren wie word2vec zum Einsatz kommen, die auf Forschungen zu künstlichen neuronalen Netzwerken basieren.
Textuelle Grundlage für initiale Arbeiten ist das multilinguale Google Books N-Gram Korpus. Dieses wurde durch die Digitalisierung von Bibliotheksbeständen erstellt und enthält ca. 4 % aller jemals gedruckten Bücher. Zur besseren Erfassung der heutigen Alltagssprache ist eine Erweiterung auf synchrone Korpora denkbar, die durch Webcrawler gewonnen werden könnten.
Die erwarteten Ergebnisse umfassen nicht nur die zunehmende Trivialisierung der Wörter „romantisch“ und „Romantik“ während der letzten 200 Jahre, sondern auch eine Reflexion des deutschen Nationalismus im 19. und 20. Jahrhundert.
Methodische Herausforderungen sind, neben der Messung des Bedeutungswandels an sich, auch die Evaluation der Messergebnisse und die Integration dieser quantitativen Untersuchungen mit den in den Geisteswissenschaften üblichen qualitativen Ansätzen.

Forschungsinteressen

Digital Humanities, Computerlinguistik, Sprachwandel, Sprachvergleich

Publikationen