Datenaustausch

Wozu denn?

Wünschen wir uns nicht, dass wir bei unseren Forschungen oft auf andere Forscher stoßen, mit denen wir uns austauschen können? Aber sehr oft verwenden die ein anderes der vielen Genealogie-Programme als wir.

Außerdem ist GenJ zwar ein prima Programm, aber …

  • Es gibt kein Programm, das alles so gut kann, wie ich möchte. Immer gibt es Spezialisten, die irgend etwas besonders gut können.
  • Es wird einen Nachfolger von GEDCOM geben, zu dem ich (oder meine Nachfolger) dann wahrscheinlich wechseln möchte.
  • Mein Forscherehrgeiz wächst vielleicht und ich möchte viel intensivere Unterstützung des Forschungsprozesses.
  • Jedes Programm veraltet irgendwann einmal. Neue Technologien bringen neue Programme hervor.

GEDCOM – und trotzdem Probleme?

Obwohl GEDCOM entwickelt wurde um den Datenaustausch zwischen Genealogie-Programmen zu erleichtern, gibt es doch häufig Probleme dabei.

Das heimtückischste Problem ist:
Der exportierende Familienforscher bemerkt nicht, dass seine Daten korrumpiert oder gar unvollständig ausgegeben wurden und der importierende Familienforscher merkt es genauso wenig.

Dies ist ein Problem bei Anwendungen mit eigener Datenbank, die daraus in das GEDCOM-Format exportieren. GenJ jedoch speichert die Information nur im GEDCOM-Format ab und muss sie daher weder beim Einlesen, noch beim Speichern »übersetzen«.

Die Hauptursachen

Die Hauptursachen sind (etwa in dieser Reihenfolge):

  • Benutzer verwenden Kennzeichen falsch.
  • Anwendungen sind nicht auf dem aktuellen Stand des Standards.
  • Der Standard wurde von den Entwicklern fehlinterpretiert.
  • Der Standard ist unvollständig oder entspricht nicht den heutigen Bedürfnissen.
  • Der Standard ist nicht eindeutig.

Einige Beispiele

Der Standard erlaubt Benutzerdefinierte Kennzeichen (_<ABCDE>). Diese sind per Definition für andere Anwendungen nicht verständlich.

Die folgende Liste zeigt einige weitere Problembereiche für den Datenaustausch.

Anwendungen sind nicht völlig standard-konform und korrumpieren:

  • die Rangfolge von mehreren Personennamen
  • die Reihenfolge von Geschwistern (besonders bei unbekannten Geburtsdaten)
  • generell die Rangfolge mehrfacher gleicher Kennzeichen in einem Kontext1)
  • unvollständige oder mehrdeutige Datumsangaben
  • Quellen durch Wiederholung (»Ist dies die selbe Familienbibel wie jene?«)
  • das Format von Notizen (z.B. durch veränderte Zeilenumbrüche)
  • die Ortsangaben (Stadt oder Land Oldenburg?)
  • zulässige Kennzeichen, die sie nicht unterstützen (diese landen hoffentlich in Notizen)

Der Standard ist unvollständig und entspricht nicht dem Bedarf:

  • Trauzeugen
  • Planung der Forschungsaufgaben (_TODO)

Der Standard ist unklar:

  • Namenskonventionen für Personen in verschiedenen Kulturkreisen
  • Rufnamen
  • BAPM und CHR
  • Richtung der Assoziation (ASSO)

Wie kann ich diese Probleme vermeiden?

Die folgenden Ratschläge reduzieren die Austauschprobleme:

  • Keine Benutzerdefinierten oder programmspezifischen Kennzeichen verwenden, siehe Anwendungstipps zu GEDCOM
  • Informationen in einer Notiz zu speichern, die voraussichtlich nie in einem Programm ausgewertet werden, sei es für eine Statistik, zum Sortieren o.ä.
  • Möglichst wenig ausgefallene Kennzeichen benutzen, also nicht alle Möglichkeiten von GEDCOM ausreizen; im Zweifelsfall in Notizen ablegen
  • Ortsangaben mit vollständiger Ortehierarchie oder Koordinaten, siehe Ortsangaben
  • Vor dem Austausch Plausibilitätsprüfung machen, siehe Anwendungstipps zu GenJ
  • Generell: Anwendungstipps zu GEDCOM beachten

Weitere Schlüsselwörter: Datenmigration, Portabilität

1) hier: alle direkt untergeordneten Eigenschaften eines Objekts oder einer Eigenschaft
de/manual/data_exchange.txt · Last modified: 2011/01/05 06:20 by kpschubert
Get GenealogyJ at SourceForge.net. Fast, secure and Free Open Source software downloads Recent changes RSS feed Creative Commons License Driven by DokuWiki