DH und ihre Nachbardisziplinen
(Autor: Stefan Kellendonk, 16.2.2016)
Als Computerlinguist und Student der Digital Humanities stellt man sich die Frage, wie das Verhältnis zwischen Computerlinguistik und DH beschrieben werden könnte.
Die Computerlinguistik beschäftigt sich in erster Linie mit der Verarbeitung bzw. Analyse von Sprachdaten mit Hilfe von Algorithmen. Sie gilt als Schnittstelle zwischen Linguistik und Informatik und scheint daher auf den ersten Blick eine geradezu prototypische Disziplin der DH zu sein. Nun geht der Aufgabenbereich der Computerlinguistik aber über die rein wissenschaftliche Arbeit hinaus und sie findet Anwendung in einer Vielzahl von Feldern, z.B. bei der Übersetzung von Texten, der Spracherkennung, der Übertragung von gesprochener zu geschriebener Sprache und vielem mehr.
Außerdem sind die Methoden der Linguistik hinsichtlich der Wissenschaftstheorie sehr naturwissenschaftlich, speziell die der quantitativen Linguistik und der Korpuslinguistik. Beide Teildisziplinen profitieren sehr stark von computerlinguistischen Untersuchungen, v.a. die Korpuslinguistik wäre in ihrer heutigen Form ohne Computer(-linguistik) undenkbar.
Computerlinguistik ist also offenbar keine typische Geisteswissenschaft, sie geht über den Rahmen der Geisteswissenschaften zum einen in Richtung Naturwissenschaft, zum anderen in Richtung Praxisanwendung hinaus. Außerdem beschäftigt sich die Computerlinguistik heute nur noch zu einem geringen Teil mit klassischen linguistischen Fragestellungen, das Hauptaugenmerk liegt klar auf der Sprachverarbeitung. Die Methodologie und die Werkzeuge der Computerlinguistik unterscheiden sich stark von denen der klassischen Linguistik, entsprechend können auch Forschungsfragen untersucht werden, zu denen die klassische Linguistik keinen Zugang hat.
Diese Feststellungen deuten darauf hin, dass die Frage nach dem Verhältnis von DH und Computerlinguistik nicht so einfach beantwortet werden kann. Unzweifelhaft ist aber die Tatsache, dass in der Computerlinguistik entwickelte Werkzeuge für die DH von größter Bedeutung sind. Die Computerlinguistik liefert bspw. Tokenizer, Tagger und Parser, ohne die die Verarbeitung größerer Textsammlungen undenkbar wäre.
Die Computerlinguistik liefert also Werkzeuge und betreibt grundlegende Untersuchungen, auf die große Teile der DH angewiesen sind. Sie ist daher Teil der ohnehin einigermaßen diffus definierten DH, auch wenn bestimmte Bereiche der Computerlinguistik über die DH hinausgehen, da sie streng genommen nicht mehr im Gebiet der Geisteswissenschaften anzusiedeln sind. Berücksichtigt man allerdings die Tatsache, dass auch in den DH viele Anwendungen für die Praxis entstehen, sollte dieses Argument nicht überbewertet werden.
Da die Anfänge der Computerlinguistik in den späten 50er-Jahren des 20. Jahrhunderts liegen, sie also nur wenig später als die DH (s.a. Geschichte der DH im Virtuellen Museum) entstand, verwundert es nicht, dass die Computerlinguistik schon früh Eingang in die DH fand und abgesehen von Editionsarbeiten zu den frühesten Anwendungen im Bereich der DH zählt.
Chomsky, Noah (1957): Syntactic Structures, The Hague/Paris: Mouton