Sprachliche Dynamik im Großraum Tunis: Ein korpusbasierter Ansatz

Projektleitung: Univ.-Prof. Dr. Stephan Procházka
Nationaler Forschungspartner: Dr. Karlheinz Mörth (ÖAW)
MitarbeiterInnen: Mag. Ines Dallaji, Ines Gabsi BA, Ines Ben Brahim BA, Mag. Omar Saim
Laufzeit: 01.08.2013–31.07.2016
Fördergeber: FWF
Fördersumme: EUR 247.177,–

Der arabische Dialekt der tunesischen Hauptstadt hat lange Zeit zu den am ausführlichsten beschriebenen Stadtdialekten der arabischen Welt gezählt. Erste wissenschaftliche Beschreibungen gehen bereits auf das 19. Jahrhundert zurück. Der überwiegende Teil der bisher vorliegenden Arbeiten widmet sich phonologischen und morphologischen Fragen sowie soziolinguistischen Analysen. Im Gegensatz dazu fehlen syntaktische Studien und Wörterbücher, die auf authentischen Texten basieren, so gut wie vollkommen. Ebenso wenig hat sich die dialektologische Forschung mit der sprachlichen Dynamik der letzten Jahrzehnte beschäftigt, welche hauptsächlich durch tiefgreifende demographische Veränderungen in der Region ausgelöst wurde. Die heute in Tunis gesprochene Varietät des Arabischen kann mit Recht als eine Koiné bezeichnet werden, welche nicht nur im Großraum der Stadt selbst, sondern darüber hinaus auch in anderen Teilen Tunesiens verwendet wird.

Das Projekt wird in Kooperation mit dem Institute for Corpus Linguistics and Text Technology an der Österreichischen Akademie der Wissenschaften durchgeführt und fokussiert auf die Sprache jener jungen Generation, die zwar schon in der Stadt aufgewachsen ist, deren Eltern jedoch größtenteils aus verschiedenen Regionen des Landes in den Großraum Tunis gezogen sind. Neben dem Hauptziel der Beschreibung der Sprache der unmittelbaren Gegenwart soll das Projekt zu zwei konkreten Produkten führen: einem repräsentativen digitalen Korpus, das auf authentischen und spontanen Gesprächen basiert, und einem darauf aufbauenden digitalen Wörterbuch. Offen zugängliche digitale Korpora arabischer Dialekte, welche sowohl eine linguistische Transkription als auch Übersetzungen bieten, existieren bisher so gut wie nicht. Außer als Quelle zur Erstellung eines elektronischen Wörterbuchs soll dieses Korpus auch dazu dienen, ausgewählte syntaktische und morphologische Phänomene zu untersuchen. Was das Wörterbuch betrifft, so wird es auch auf gezielten Interviews sowie Daten aus bereits publizierten Glossaren und Wortlisten gespeist werden. Damit erhält es eine diachrone Dimension, welche es erlauben wird, die sprachlichen Dynamiken im Bereich des Lexikons zu analysieren.

Einer der innovativen Ansätze des Projekts liegt darin, dass es arabistisch-philologische Forschung mit modernster Informationstechnologie verknüpft und dadurch neue Perspektiven eröffnet. Die dabei verwendeten Tools und die aus dieser Kooperation gewonnenen Erfahrungen und Ergebnisse können für ähnliche strukturierte Studien genutzt werden. Dazu gehört die enge Verknüpfung von Korpus und Wörterbuch, die direkten Zugriff auf die jeweils andere Datenressource ermöglichen wird. Über ein Web-Interface werden diese Daten der Scientific Community zur Verfügung gestellt und können in Zukunft auch von anderen genutzt und erweitert werden. Besonderes Augenmerk wird auf die derzeit in der digitalen Philologie gültigen Standards sowie auf die Wiederverwertbarkeit und längerfristige Verfügbarkeit der Daten gelegt werden.

Projekthomepage:
http://clarin.aac.ac.at/exist/apps/tunico.ac.at/index.html?page=087cedbe