Raster- und Vektorformate

Geografische Daten können auf zwei Arten repräsentiert werden: Als Raster- oder als Vektordaten.

Rasterdaten sind wie Fotos (und kommen auch häufig von Satellitenfotos): Sie sind aus Punkten (die natürlich auch z. B. einem km² entsprechen können) zusammengesetzt. Die Punkte können Attribute wie Farbe, Höhe usw. haben, aber es gibt keine darüber hinausgehenden Strukturierungsmöglichkeiten. In diesem Vortrag geht es nicht um Rasterdaten.

Vektordaten bestehen aus Kartenobjekten in strukturierter Form. Die einzelnen Objekte können also über die Darstellung hinausgehende Bedeutung haben, und man kann ihre Beziehungen zueinander modellieren, z. B. “Objekt A enthält Objekt B”.

Im Folgenden geht es ausschließlich um Vektordaten.

Geografische Objekte (Kartenobjekte) können sein:

Geografische Dateiformate können enthalten:

Auch die Zeichenkodierung spielt eine Rolle. Wenn die falsche Kodierung zum Einlesen verwendet wird, können Umlaute und Sonderzeichen falsch dargestellt werden.

Austauschformate für geografische Daten

Um Daten zwischen verschiedenen Systemen übertragen zu können, wie z. B. für Downloads, wurden verschiedene Dateiformate definiert.

“ESRI Shapefile”, .shp

Dies ist ein De-Facto-Standard. Die .shp-Datei ist das eigentliche Shapefile, aber meistens bekommt man ein Zip-Archiv mit dem Shapefile und einigen anderen Dateien, z. B. .proj für die Projektion, .dbf für die Daten im DBase-Format usw.

Ein Shapefile kann nur eine Art von Objekten (Punkt oder Linie oder Fläche) enthalten.

Die Zeichenkodierung (die für Textattribute wichtig ist) ist leider nicht im Format enthalten, muß also separat angegeben werden (oder man kommt durch Ausprobieren darauf).

OpenStreetMap, .osm

Ein XML-basiertes Format vom OpenStreetMap-Projekt. Die Projektion ist grundsätzlich WGS 84, die Kodierung standardmäßig UTF-8, und ist wie bei XML üblich zwingend anzugeben.

OSM-Dateien können alle Arten von Elementen enthalten. Attribute sind als “Tags” gespeichert.

GPX, KML

Weitere XML-basierte Formate für spezielle Anwendungen.

Comma separated values, CSV

Auch dieses Austauschformat ist recht beliebt. Der Vorteil ist die Einfachheit: die Geokoordinaten sind einfach nur zwei normale Spalten, und für die Erstellung reicht ein Editor oder ein Tabellenkalkulationsprogramm. Der Nachteil ist, daß weder die Projektion, noch die Bedeutung der einzelnen Spalten (welche enthalten die Geodaten?), noch die Zeichenkodierung im Format selbst definiert werden können, sie sind daher bei der Datenweitergabe unbedingt anzugeben.

Konvertierung zwischen Datenformaten

Open-Source-Werkzeuge:

OGR: Bibliothek und Befehlszeilenwerkzeuge für die Konvertierung zwischen praktisch allen Formaten.

GPSBabel: Konvertierungswerkzeug hauptsächlich für die Formate von GPS-Loggern.

In diesem Projekt werden diese Konverter nicht benötigt.

Weiter: OpenStreetMap