Prof. Dr. Rosemarie Lühr

Informationsstruktur in älteren indogermanischen Sprachen


Förderung: DFG
Mitarbeiter: Dr. Susanne Schnaus, Dr. Carlotta Viti (bis Februar 2010), Mag.A. Matthias Passer (ab März 2010)

Die Information in Sätzen ist nach pragmatischen Gesichtspunkten strukturiert, es gibt den Satzgegenstand, das Topik, und die markierte oder neue Information, den Fokus. In gesprochenen Sprachen helfen intonatorische Unterschiede bei der Ermittlung der fokussierten Information, beispielsweise in den Sätzen „Paul hat Paula auf die Stirn geküsst“, „Paul hat Paula auf die Stirn geküsst“ und „Paul hat Paula auf die Stirn geküsst“. Außerdem gibt es für moderne Sprachen Frage- und Korrekturtests, um Topik und Fokus eines Satzes zu ermitteln. In Korpussprachen sind diese Verfahren nur bedingt anwendbar. So gibt es oftmals weder phonologische noch eindeutige morphologische oder syntaktische informationsstrukturelle Markierungen. Um zuverlässige Daten zu erhalten, werden deshalb in der Annotation möglichst differenziert die verschiedenen Dimensionen der Informationsstruktur (IS) unabhängig voneinander behandelt. Außerdem werden alle behandelten Sprachen einheitlich annotiert, um sie vergleichbar zu machen. In insgesamt drei Jahren werden im Rahmen des Projekts die einschlägigen Daten in den Sprachen Latein, Griechisch, Hethitisch und Altindisch annotiert und analysiert. Auf der Grundlage dieser Daten sollen abschließend folgende Fragen beantwortet werden:

    1.    Vollzieht sich ein Wandel von diskursorientierten zu syntaxorientierten Sprachen? Wenn ja, gibt es sprachspezifische Übergänge oder unterschiedliche Grade von Diskursorientiertheit?
    2.    Wie erfüllen diese Sprachen, die wohl keine dem deutschen Vorfeld, Mittelfeld und Nachfeld entsprechende Feldergliederung haben, die solchen Feldern zukommenden IS-Aufgaben?
Altindogermanische Sprachen sind morphologiereiche Sprachen, die die grammatischen Funktionen durch Flexion ausdrücken und so Wortstellungsfreiheit begünstigen. Es ist zu vermuten, dass diese Freiheit genutzt wird, um an verschiedenen Positionen pragmatisches Ausdruckspotential zu binden. Der Schwerpunkt des Projekts liegt folgerichtig auf den für die Informationsstruktur relevanten pragmatischen Kategorien. Neben diesen pragmatischen IS-Kategorien werden aber auch semantische und stilistische Kategorien sowie rein grammatische Angaben wie Wortarten- und Phrasenbestimmung annotiert. Die Daten, die im Rahmen des Projekts erfasst werden, werden in Zusammenarbeit mit der ANNIS-Datenbank öffentlich zugänglich gemacht und sind somit im Anschluss an das Projekt auch für Abfragen anderer Art nutzbar (z.B. Flexionsmorphologie, Syntax). Da die Verteilung von Topik und Fokus kontextabhängig ist, werden keine Einzelsätze, sondern zusammenhängende Texte informationsstrukturell analysiert. So lassen sich auch untergeordnete Strukturen innerhalb eines Textes untersuchen, und eventuelle Unterschiede zu Hauptsätzen können deutlich gemacht werden. Auch zu den Funktionen der Partikeln in den verschiedenen Sprachen können neue Erkenntnisse gewonnen werden. Des Weiteren werden Gemeinsamkeiten und Unterschiede in der Informationsstruktur in den verschiedenen indogermanischen Sprachen herausgearbeitet. Auf Basis dieser Analyse lassen sich dann sprachtheoretische Aussagen treffen, vielleicht sogar über die Informationsstruktur des Indogermanischen.

Demo
Analysekriterien

Impressum | Kontakt | Login