Synopses & Reviews
This study presents an approach to the automatic derivation of structured linguistic descriptions from a set of isolated individual data. Structure inferencing takes place on the basis of the identification of relations between the data, plus generalizations about those data. Quality criteria are used for the formal evaluation of various descriptions for a given set of data and the direct comparison of those descriptions. This provides the basis for the selection of good descriptions. The efficiency of the procedure is illustrated by application to linguistic data relating to noun inflexion and syntactic verb classification in German.
Synopsis
In dieser Arbeit wird ein Verfahren entwickelt, mit dem strukturierte linguistische Beschreibungen maschinell erzeugt werden. Ausgangspunkt fur eine zu erstellende Beschreibung ist eine Menge von Einzeldaten, die einen bestimmten linguistischen Gegenstandsbereich charakterisieren. Das aus diesen Daten automatisch gewonnene linguistische Wissen wird in der Sprache DATR reprasentiert, einem innerhalb der Computerlinguistik entwickelten vererbungsbasierten Formalismus zur Reprasentation lexikalischer Information.
Die Strukturierung eines gegebenen linguistischen Bereiches erfolgt uber die Identifikation und Reprasentation von Beziehungen zwischen den Einzeldaten, durch Generalisierung uber den Daten sowie durch Abstraktion von ihren Eigenschaften, was zur Reprasentation linguistischer Klassen fuhrt. Das Lernverfahren, das diese Strukturierung leistet, basiert auf einer Menge von Regeln, die Vererbungsbeziehungen zwischen einzelnen Daten herstellen, und einem Algorithmus, der durch die Inferenz von Default-Information uber den Daten generalisiert. Da fur eine gegebene Menge von Daten viele unterschiedliche Beschreibungen moglich sind, werden Gutekriterien verwendet, die bestimmen, wodurch sich eine gute Beschreibung fur einen konkreten Phanomenbereich auszeichnet. Durch den formalen Vergleich von Beschreibungen in DATR anhand dieser Kriterien erfolgt die Auswahl des Ereignisses.
Die Leistungsfahigkeit des implementierten Verfahrens wird durch Anwendungen auf linguistische Daten aus zwei unterschiedlichen Bereichen gezeigt. In der ersten Gruppe von Aufgaben werden Flexionsklassen auf Grund flektierter Substantivformen des Deutschen gebildet. In den Aufgaben des zweiten Bereichs werden Verben auf Grund ihrer syntaktischen Eigenschaften klassifiziert.
Synopsis
Diese Arbeit stellt einen Ansatz vor, mit dem strukturierte linguistische Beschreibungen automatisch aus einer Menge von isolierten Einzeldaten gewonnen werden. Die Inferenz der Strukturierungen basiert auf der Identifikation von Beziehungen zwischen den Daten und auf Generalisierung ber den Daten. Anhand von G tekriterien werden verschiedene Beschreibungen f r eine gegebene Menge von Daten formal bewertet und direkt miteinander verglichen, was die Auswahl von guten Beschreibungen erm glicht. Die Leistungsf higkeit des implementierten Verfahrens wird durch Anwendungen auf linguistische Daten aus den Bereichen der deutschen Substantivflexion und der syntaktischen Verbklassen des Deutschen gezeigt.
Synopsis
Over the past few decades, the book series Linguistische Arbeiten Linguistic Studies], comprising over 500 volumes, has made a significant contribution to the development of linguistic theory both in Germany and internationally. The series will continue to deliver new impulses for research and maintain the central insight of linguistics that progress can only be made in acquiring new knowledge about human languages both synchronically and diachronically by closely combining empirical and theoretical analyses. To this end, we invite submission of high-quality linguistic studies from all the central areas of general linguistics and the linguistics of individual languages which address topical questions, discuss new data and advance the development of linguistic theory.