"Topfen" ist uns nicht "Powidl"
Im Rahmen des "Austrian Media Corpus" (AMC) können Sprachwissenschafter auf einen einzigartigen Sprachfundus zurückgreifen - und zeigen dabei auch, dass "Erdäpfel" und "Paradeiser" eher nicht vom Aussterben bedroht sind.
Die Frage des "Überlebens" österreichischer Spielarten der deutschen Sprache wird nicht erst seit dem breiten Einzug deutscher Fernsehsender in heimische Haushalte kontrovers diskutiert. Wie die so veränderliche Sprache über die Zeit hinweg tatsächlich gebraucht wird, lässt sich nicht so einfach erheben. Entstanden ist das Forschungsprojekt "Austrian Media Corpus" vor rund fünf Jahren im Rahmen einer Zusammenarbeit des Instituts für Corpuslinguistik(*) und Texttechnologie (ICLTT) der Österreichischen Akademie der Wissenschaften (ÖAW) mit der APA - Austria Presse Agentur. Als Nachrichtenagentur brachte die APA große Teile ihrer digitalen Archivbestände ein. Darunter finden sich alle digital verfügbaren APA-Meldungen seit 1955, die Textinhalte fast aller Tages- und Wochenzeitungen und der wichtigsten Magazine Österreichs seit Beginn der 1990er-Jahre sowie Transkripte österreichischer TV- und Radio-Nachrichtensendungen, die allesamt den Wissenschaftern zugänglich gemacht wurden. Insgesamt waren das zum Beginn bereits rund acht Milliarden Wörter - Tendenz steigend.
International einzigartig
"Was das AMC international einzigartig macht, ist die fast lückenlose Abdeckung der Printmedienlandschaft über rund zweieinhalb Jahrzehnte. Es gibt im deutschsprachigen Raum mehrere Sprachkorpora, aber keines in dieser Form der Zusammensetzung", so Jutta Ransmayr, die sich an der ÖAW und der Universität Wien mit dem "Österreichischen Deutsch" auseinandersetzt, gegenüber APA-Science. Die Datenbank hält eine große Bandbreite an Quelltexten, beispielsweise aus den Bereichen Agentur- und Printjournalismus, bereit, die sich qualitativ wie quantitativ auswerten lassen. So kann ein wichtiger Teil des Sprachgebrauchs strukturiert dokumentiert werden. "Zeitungstexte gelten in einer Gesamtsprache wie dem Deutschen als Modelltexte für gute Sprache, für Hochdeutsch, für Standardsprache", erklärte auch Alexandra Lenz von Institut für Germanistik der Universität Wien.
Durch die Zusammenarbeit mit dem Rat für deutsche Rechtschreibung "können nun auch Daten zum orthografischen Schreibgebrauch aus Österreich in die Diskussion über Maßnahmen und Empfehlungen des Rechtschreibrats einfließen. Dies ist umso wichtiger, da sich die Schreibpräferenzen zwar selten, aber doch fallweise zwischen Österreich und Deutschland bei einzelnen Wörtern unterscheiden", sagte Ransmayr. So habe sich zum Beispiel die Schreibweise "Büfett" in Österreich nie durchgesetzt, man trifft sich hierzulande immer noch vornehmlich am "Buffet".
Auf Basis der Daten aus dem AMC konnten Wissenschafter auch regionale Spielarten des Österreichischen im "Variantenwörterbuch des Deutschen" verankern. Überdies erlaubt die Datenbank die großflächige Analyse grammatikalischer Strukturen und auch nationale Sprachtrends lassen sich sozusagen ablesen. Wortschatz-Frequenzanalysen, die auf der Datenbank basieren, flossen überdies in die 43. Auflage des Österreichischen Wörterbuchs ein. Auch für die kommende Auflage seien Kooperationen geplant. Daneben geht man beispielsweise Anfragen von Studierenden im Rahmen von Abschlussarbeiten nach: Etwa wenn es darum geht, herauszufinden, mit welchen Begriffen und sprachlichen Konzepten der ereignisreiche und vor allem lange Präsidentschaftswahlkampf ausgetragen wurde.
23 "geschützte Austriazismen"
Der AMC gibt aber auch Einblick darin, wie es den 23 "geschützten Austriazismen" aus dem österreichischen Kulinarikwortschatz ergeht, die von österreichischer Seite aus beim EU-Beitritt eigens ins Amtsdeutsch der EU hineinverhandelt wurden. In dem Zusammenhang führte Lenz eine Studie von Wolfgang Koppensteiner - einem Doktoranden in ihrem Forschungsteam - an, der sich darin dem Verbleib von "Powidl", "Eierschwammerl", "Fisolen" oder "Topfen" in der heimischen Presselandschaft in den vergangenen 20 Jahren widmete.
So wurde klar, dass sich die Begriffe sozusagen bester Gesundheit erfreuen: Ihre Verwendungshäufigkeit schwankte demnach nämlich nur um rund zehn Prozent. Sie halten sich also erstaunlich stabil im Sprachschatz und würden in der Presselandschaft laut Lenz "vehement verteidigt". Es scheine, als wäre hier "die Presse ein wichtiger Stabilisierungsfaktor".
Trotz dieses Beispiels handelt es sich bei Sprache um ein sehr wandelbares Forschungsobjekt. Gerade dieser Sprachwandel ist für Ransmayr eines der spannendsten Phänomene, denen man sich mit Textkorpora wie dem AMC annähern könne.
Service: Austrian Media Corpus: oeaw.ac.at/acdh/tools/amc-austria-media-corpus
(*)Korpuslinguistik: (Quelle: Wikipedia; Hannes Pirker/ÖAW)
Die Korpuslinguistik ist ein Bereich der Sprachwissenschaft, der durch die Verwendung von Sprachdaten charakterisiert ist, die in großen Korpora dokumentiert sind. Diese Korpora liegen heutzutage üblicherweise in digitaler Form vor und es kommen spezialisierte Programme für deren Auswertung zur Anwendung. Die Sprachdaten können entweder schriftlich entstanden sein oder es kann sich um gesprochene Sprache handeln. Ziel der Korpuslinguistik ist es, anhand dieser Daten bestehende linguistische Hypothesen zu überprüfen oder durch explorative Datenanalyse neue Hypothesen und Theorien über den Gegenstand zu gewinnen. Die Erkenntnisse der Korpuslinguistik basieren somit auf natürlichen Äußerungen einer Sprache - also auf Sprache, wie sie tatsächlich verwendet wird.
Von Nikolaus Täuber / APA-Science