PhD students 2nd cohort

Tinghui Duan, M.A.

Curriculum Vitae

2006 - 2010 B.A. Studium der Deutsche Linguistik und Literatur an der Renmin University of China (中国人民大学), Beijing, China

2010 - 2011 Freiberuflicher Übersetzung (Chinesisch-Deutsch)

2011 - 2015 M.A. Studium der Auslandsgermanistik (Deutsch als Fremd- und Zweitsprache) an der Universität Jena (Unterrichtspratika in Jordanien und in der Türkei)

2012 - 2013 Erasmus-Programm an der Universität Wien mit dem Schwerpunkt Deutsch als Fremd- und Zweisprache sowie Deutsche Philologie

2015 - 2018 Wissenschaftliche Hilfskraft am Lehrstuhl Deutsch als Fremd- und Zweitsprache (Prof. Dr. Bernt Ahrenholz) an der Universität Jena

2017 - 2018 Wissenschaftliche Hilfskraft am Lehrstuhl Copmuterlinguistik (Prof. Dr. Udo Hahn) an der Universität Jena (von Juli bis September 2018 als wissenschaftlicher Mitarbeiter)

seit Oktober 2018 Kollegiat am Graduiertenkolleg „Modell Romantik“

PhD Project

Romantic Code - Computerlinguistische Modellierung der literarischen Romantik

Mein Promotionsprojekt hat das Ziel, anhand von stilistischen Merkmalen und durch computerlinguistische Methoden ein statistisches Modell für die literarische Romantik zu erstellen. Das Modell soll einerseits dazu dienen, sprachbezogene Hypothesen über Texte der literarischen Romantik zu überprüfen. Andererseits soll das Modell in der Lage sein, Texte, die der literarischen Romantik bisher nicht zugeordnet sind, hinsichtlich ihrer „Romantizität“ zu bewerten, um ihren Zusammenhang mit der Romantik zu entdecken.

Um das Ziel zu erreichen, wird zuerst eine Sammlung von Texten zusammengestellt, die zum Kanon der literarischen Romantik gehören. Dann werden bekannte stilistische Indikatoren, die in der Literaturwissenschaft durch hermeneutisches Verfahren ermittelt und der Romantik-Epoche zugeschrieben worden sind, gesammelt und mithilfe computerlinguistischer Methoden quantifiziert. Beispielsweise wird die Beobachtung des französischen Schriftstellers Alfred de Musset, dass romantische Texte besonders viele Adjektive enthalten, dadurch quantifiziert, dass der Anteil von Adjektiven in den zu untersuchenden Texten errechnet wird. Auf dieser Basis kann man überprüfen, welche Merkmale für welche Texte gelten. Außerdem werden weitere linguistische Merkmale untersucht, die zwar in der Romantikforschung bisher nicht erforscht wurden, jedoch zum Repertoire der Computerlinguistik gehören, wie z.B. Type/Token-Ratio, syntaktische Komplexität, Verlauf der Emotionalität. Dadurch könnten Merkmale der romantischen Texte entdeckt werden, die dem Literaturwissenschaftler oder der Literaturwissenschaftlerin beim Close Reading nicht auffallen, die jedoch statistisch signifikant sind.

Damit das Modell in der Lage ist, romantische Texte von nicht-romantischen Texten zu unterscheiden bzw. einen beliebigen Text hinsichtlich seiner „Romantizität“ zu bewerten, werden neben den romantischen Texten auch nicht-romantische Texte untersucht. Dazu gehören beispielsweise nicht-literarische Texte aus der Romantik-Epoche oder literarische Texte der benachbarten literarischen Epochen. Durch eine computerlinguistische Modellierung werden die signifikanten unterscheidenden linguistischen Merkmale herausgefunden.

Da es auch in der Literaturwissenschaft oft umstritten ist, ob ein bestimmter Text zur Romantik gehört, wird neben einem voreingestellten Modell die Möglichkeit angeboten, dass die einzelnen Forscherinnen und Forscher die zur Modellbildung dienende Textbasis selbst bestimmen, sodass ein subjektiviertes Modell Romantik erstellt werden kann.

Publications

Herausgeberschaft

Hg. mit Britta Hövelbrinks, Isabel Fuchs, Diana Maak & Beate Lütke. Der-Die-DaZ – Forschungsbefunde zu Sprachgebrauch und Spracherwerb von Deutsch als Zweitsprache. Festschrift für Bernt Ahrenholz zum 65. Geburtstag. Berlin, Boston: De Gruyter Mouton, 2018.

Aufsätze

Mit Jessica Neumann. Lesbarkeitsformeln Zur Messung Sprachlicher Komplexität in Schulbuchtexten. In: Der-Die-DaZ – Forschungsbefunde Zu Sprachgebrauch und Spracherwerb von Deutsch als Zweitsprache. Hg. von Britta Hövelbrinks, Isabel Fuchs, Diana Maak, Tinghui Duan & Beate Lütke. Berlin, Boston: De Gruyter Mouton, 2018.
Mit Udo Hahn. Corpus Assembly as Text Data Integration from Digital Libraries and the Web. In: JCDL ’19: Proceedings of the 2019 ACM/IEEE Joint Conference on Digital Libraries, June 02–06, 2019, Urbana-Champaign, IL, USA.
Mit LI Yuan und LIU Haitao. Is the Distribution of Nouns an Invariant in Human Languages? — An Investigation Based on Written German Corpora. In: The Journal of Zhejiang University (Humanities and Social Science), 5(6), 2019.
Mit Bernd Kampe und Udo Hahn. Allgemeine Musikalische Zeitung as a Searchable Online Corpus. In: LREC 2020 - Proceedings of the 12th International Conference on Language Resources and Evaluation. Marseille, France, May 11-16, 2020 (In-Person Conference Cancelled). Pages 969–976.

Presentations

Digital Humanities & Angewandte Linguistik. Gastvortrag am Institut für German Studies an der Zhejiang University, 29. März 2019, Hangzhou, China.
Corpus Assembly as Text Data Integration from Digital Libraries and the Web. Paper Talk at JCDL ’19: 2019 ACM/IEEE Joint Conference on Digital Libraries, June 02–06, 2019, Urbana-Champaign, IL, USA.
Compiling Digital Fragments of Allgemeine Literatur-Zeitung, a Major Textual Resource for German Romanticism Research, into a Single Comprehensive Text Corpus. Poster Presentation at the 10th International Corpus Linguistics Conference (CL2019), July 22–26, 2019, Cardiff, Wales.
„Romantik“ im aktuellen parteipolitischen Diskurs auf Twitter. Posterpräsentation (Online) auf der 7. Jahrestagung des Verbands Digital Humanities im deutschsprachigen Raum (DHd 2020), 02–06. März 2020, Paderborn.