Synopses & Reviews
Synopsis
Tabellen finden sich in fast jedem Medium wieder. In Zeitungen, B chern, Rechnungen oder in elektronischen Medien vermitteln sie dem Leser Daten in strukturierter Form, die aus blo em Text weitaus schwieriger ersichtlich sind. Wie die Tabellen repr sentiert werden, ist f r den Menschen irrelevant - denn nahezu ohne Schwierigkeiten ist er in der Lage, deren Strukturen zu erkennen und aufzunehmen. Automatische Prozesse m ssen sich hingegen m hsam an verschiedenen Informationsquellen bedienen, um die Datenstruktur verstehen zu k nnen. Die Menge an verschiedenen Dokumententypen und die verschiedenen Arten von Tabellenlayouts erschweren den Prozess einer automatischen Tabellenerkennung zus tzlich. Ein format bergreifender Austausch von tabellarischen Strukturen, selbst bei den g ngigsten Dokumentarten, wird nicht unterst tzt. Insbesondere der Transfer von Tabellen aus pixelbasierten Dokumente fehlt. Eine besondere Herausforderung besteht folglich darin, Tabellen aus verschiedenen Dokumentarten einheitlich abzulegen. Diese Arbeit beschreibt die Entwicklung eines Modells, worin tabellenf rmige Daten dokument bergreifend abgelegt werden k nnen.