Kollegiat:innen 1. Kohorte

Dr. Johannes Hellrich

Dr. Johannes Hellrich
Friedrich-Schiller-Universität Jena
Jena University Language & Information Engineering Lab
johannes.hellrich@uni-jena.de

Curriculum Vitae

2006 - 2010 Bachelorstudium der Fächer Deutsche Philologie und Geschichte an der Universität Regensburg

2010 - 2012 Masterstudiengang „Germanistische Sprachwissenschaft“ an der FSU Jena

2012 - 2015 wissenschaftlicher Mitarbeiter im Rahmen des EU-Projekts MANTRA

Oktober 2015 - September 2018 Kollegiat des Graduiertenkollegs „Modell Romantik“

März 2019 Abschluss der Promotion

seit Oktober 2019 Teamleiter in der Entwicklung von Sprachassistenzsystemen für die Automobilindustrie bei der semvox GmbH

Dissertationsprojekt (abgeschlossen)

Automatische Analyse diachroner Bedeutungsdimensionen der Lexik der Romantik

Ziel dieser Arbeit ist es, Bedeutungsunterschiede in der für die Romantik relevanten Lexik zu quantifizieren. Als relevant werden dabei die Wörter betrachtet, die häufig in der Literatur der Romantik verwendet werden, aber auch die Wörter „romantisch“ und „Romantik“. Die Untersuchungen werden die letzten beiden Jahrhunderte und mehrere europäische Sprachen umfassen, wobei vorrangig diachrone, aber auch synchrone Vergleiche geplant sind.
Technische Grundlage sind Verfahren aus der Computerlinguistik, mittels derer die Semantik von Wörtern über ihren Kontext approximiert wird. Es ergibt sich ein hochdimensionaler Vektorraum, im einfachsten Fall direkt durch die Kookkurrenzen bestimmt, aus dem dann eine niederdimensionale Repräsentation gewonnen werden kann. Diese Repräsentationen können durch mathematische Verfahren synchron und diachron auf ihre Ähnlichkeit hin verglichen werden, wodurch Bedeutungswandel quantifizierbar wird. Konkret sollen Verfahren wie word2vec zum Einsatz kommen, die auf Forschungen zu künstlichen neuronalen Netzwerken basieren.
Textuelle Grundlage für initiale Arbeiten ist das multilinguale Google Books N-Gram Korpus. Dieses wurde durch die Digitalisierung von Bibliotheksbeständen erstellt und enthält ca. 4 % aller jemals gedruckten Bücher. Zur besseren Erfassung der heutigen Alltagssprache ist eine Erweiterung auf synchrone Korpora denkbar, die durch Webcrawler gewonnen werden könnten.
Die erwarteten Ergebnisse umfassen nicht nur die zunehmende Trivialisierung der Wörter „romantisch“ und „Romantik“ während der letzten 200 Jahre, sondern auch eine Reflexion des deutschen Nationalismus im 19. und 20. Jahrhundert.
Methodische Herausforderungen sind, neben der Messung des Bedeutungswandels an sich, auch die Evaluation der Messergebnisse und die Integration dieser quantitativen Untersuchungen mit den in den Geisteswissenschaften üblichen qualitativen Ansätzen.

Publikationen

Aufsätze

  • Johannes Hellrich/Sven Buechel/Udo Hahn: Inducing Affective Lexical Semantics in Historical Language, in: arXiv, 21.06.2018
  • Johannes Hellrich/Sven Buechel/Udo Hahn: JeSemE: A Website for Diachronic Changes in Word Meaning and Emotion, in: Proceedings of COLING 2018 Santa Fa (2018), to appear.
  • Johannes Hellrich/Christoph Rzymski/Vitus Vestergaard: The Trans-Medial Fight for Glory, in: Medievalism and Metal Music Studies: Throwing Down the Gauntlet, ed. by Ruth Barratt-Peacock and Ross Hagen, forthcoming Bingley 2019.
  • Johannes Hellrich/Christoph Rzymski: Computational Detection of Medieval References in Metal, in: Medievalism and Metal Music Studies: Throwing Down the Gauntlet, ed. by Ruth Barratt-Peacock and Ross Hagen, forthcoming Bingley 2019.

Kleinere Beiträge