GEDCOM7

Nach mehr als 20 Jahren kam wieder Bewegung in die Entwicklung des Datenaustauschformats für genealogische Daten GEDCOM. Zunächst wurde am 15.11.2019 der Entwurf GEDCOM 5.5.1 (vom 02.10.1999) zum Standard erklärt und am 09.06.2021 eine neue Standardversion mit GEDCOM 7.0 ins Leben gerufen.

Warum eigentlich GEDCOM 7? Worin liegen die Unterschiede zur Vorversion? Das eröffnet doch neue tolle Möglichkeiten? Ist eine Software veraltet, die nicht GEDCOM 7 unterstützt? Warum spielt die GEDCOM Version überhaupt eine Rolle? Diese und weitere Fragen sollen im Folgenden beantwortet werden.

 

„Warum eigentlich GEDCOM7?“

Das GEDCOM Dateiformat wurde von der Kirche Jesu Christi der Heiligen der Letzten Tage (Mormonen) entwickelt. Die letzte Version 5.5 wurde am 11.12.1995 veröffentlicht und ein Entwurf zur Version 5.5.1 wurde am 02.10.1999. Man sah aber anscheinend keine Zukunft in dem reinen textbasierten Dateiformat und entwarf mit der Version 6.0 ein nicht kompatibles Format basierend auf XML. Während die Versionen 5.5 und 5.5.1 immer größere Verbreitung in Genealogieprogrammen fanden, fand die Version 6.0 kaum Anklang. Ahnenblatt ist eines der wenigen Programme, die immerhin GEDCOM 6.0 schreiben können.

Die Mormonen schienen über die Jahre immer mehr das Interesse an dem Thema GEDCOM zu verlieren. So zeigte die Webseite gedcom.org irgendwann keine Inhalte mehr, die Versionen 5.5.1 und 6.0 kamen nicht aus dem Entwurfsstatus hinaus und die GEDCOM-Dokumentationen verschwanden irgendwann komplett von der Webseite familysearch.org.

Im Jahre 2019 hat der niederländische Genealogie-Technikexperte Tamura Jones die frei gewordene Domain gedcom.org registriert und eine neue GEDCOM Version 5.5.5 basierend auf dem 5.5.1 Entwurf veröffentlicht.

Dadurch aufgeschreckt haben die Mormonen wieder das Thema an sich gezogen, in dem die Version 5.5.1 kurz darauf noch 2019 zum Standard erklärt wurde und die Arbeit an einer neuen Version 7.0 begonnen wurde. Die Versionsnummer 6 wurde dabei übersprungen, weil sie bereits für einen geplanten Neuanfang auf XML-Basis verwendet wurde.

Die Version 7.0 entstand dabei nicht im „stillen Kämmerchen“, sondern wurde in Diskussionen mit internationalen Programmentwicklern erarbeitet. Ziel war es Ungenauigkeiten zu beseitigen und neue Anforderungen an genealogische Daten abzudecken. Und dieser Prozess wird stetig weitergeführt – ein Ende ist nicht in Sicht. Informationen zur Entwicklung gibt es auf der neuen Webseite gedcom.io.

 

Einschub: Zwei entscheidende Grundprinzipien von GEDCOM

Neben dem einfachen textbasierten Dateiformat (lässt sich mit jedem Texteditor einsehen) haben zwei Grundprinzipien entscheidend zum Durchbruch von GEDCOM beigetragen.

Erweiterbarkeit: Neben einem festen Satz von GEDCOM-Schlüsselwörtern für Ereignisse und andere Daten, hat man vorgesehen, dass eigene Schlüsselwörter beginnend mit einem Unterstrich verwendet werden dürfen.

Dieses Verfahren hat aber entscheidende Nachteile. Jeder Programmentwickler kann eigene GEDCOM-Schlüsselwörter „erfinden“, aber mangels Absprache unter ihnen kommen womöglich unterschiedliche Schlüsselwörter für ähnliche Daten zum Einsatz. Verwendete Schlüsselwörter, die ein Programm nicht kennt, kann es auch nicht interpretieren. Solche Daten gehen dann zumeist verloren.

Wie macht es Ahnenblatt?

Ahnenblatt verwendet auch eigene GEDCOM-Schlüsselwörter. Ansonsten wären u.a. Orts- und Aufgabenverwaltung, Ruf- und Ehenamen, Taufpaten/Trauzeugen und gleichgeschlechtliche Partnerschaften nicht im GEDCOM-Format abbildbar gewesen.

Ich habe mich dabei immer an anderen Genealogieprogrammen orientiert, die solche Funktionen bereits verwenden oder mit anderen (zumeist deutschsprachigen Programmierern) abgesprochen. Zu diesem Zweck bin ich seit mehr als 10 Jahren Teilnehmer an der Mailingliste GEDCOM-L, wo solche GEDCOM-Besonderheiten diskutiert werden.

Lesbarkeit: Das GEDCOM-Dateiformat ist durch seine Zeilennummerierung so aufgebaut, dass unbekannte Daten einfach überlesen werden können. Dadurch scheitert ein GEDCOM-Import nicht an unbekannten GEDCOM-Schlüsselwörtern, sondern kommt immer fehlerfrei zum Ende. Dass eine GEDCOM-Datei abgewiesen wird oder überhaupt nicht interpretiert werden kann, kommt daher so gut wie nie vor. Das importierende Programm liest in der Regel immer alle bekannten Daten ein. Unbekannte Daten werden entweder ignoriert (teilweise gepaart mit einer Meldung an den Anwender in Form eines „GEDCOM-Import-Protokolls“) oder eingelesen und „durchgeschleift“ ohne zur Anzeige zu kommen.

Wie macht es Ahnenblatt?

Ahnenblatt verwirft auch unbekannte GEDCOM-Daten nicht, sondern merkt sich alles, um eine eingelesene GEDCOM-Datei möglich unverändert auch wieder speichern zu können. Sollte der Anwender eine mit Ahnenblatt gespeicherte GEDCOM-Datei wieder mit dem Ursprungsprogramm öffnen, dann gehen keine Daten verloren.

 

„Worin unterscheiden sich GEDCOM 5.5.1 und 7.0?“

Eine komplette Auflistung aller Unterschiede würde zu weit führen. Daher im Folgenden nur eine Auswahl besonderer Änderungen. Die komplette Änderungsliste findet sich hier: https://gedcom.io/changelog/.

    • Es gibt jetzt Strukturen, mit denen dargestellt werden kann, dass ein Ereignis nicht stattgefunden hat bzw. nicht in einem bestimmten Zeitraum.
    • Bilder/Dateien können lokal auf dem Rechner sein, aber auch im Internet.
    • Datumsangaben kann man auch eine Uhrzeit hinzufügen.
    • Notizen dürfen auch Formatierungen (auf Basis eines reduzierten HTML) enthalten.
    • Interne Personenkennzeichen (RIN) werden durch ein neues GEDCOM-Schlüsselwort dargestellt.
    • Jedem Ereignis lassen sich jetzt Personen(-verweise) zuordnen.
    • Jeder (Person-)Datensatz kann zusätzlich zum Änderungszeitpunkt ein Erstellungszeitpunkt haben.
    • Die Geschlechtsangabe wurde um „divers“ ergänzt.
    • Jeder Datumsangabe kann man um ein „Sortierdatum“ ergänzen.
    • Datumsangaben als Freitext, werden mit separatem Schlüsselwort gespeichert.
    • Als Zeichencodierung ist nur noch UTF-8 erlaubt.
    • Verwendete @ Zeichen in Texten werden nicht mehr gedoppelt.
    • Man kann zu Bildern jetzt auch Positionen eines Bildausschnitts festlegen.
    • Zeilenlängen sind jetzt unbegrenzt, daher entfällt die Trennung mit CONC.
    • Alle Quellen und Dateien/Bilder müssen intern als Verweise dargestellt werden.
    • Man kann Verweise zu nichtexistierenden Datensätzen einfügen (@VOID@).
    • Neues Dateiformat .gdz, welches in gezippter Form eine GEDCOM 7 Datei und alle enthaltenen Dateien/Bilder enthält.

Dadurch, dass einige bisherigen GEDCOM-Schlüsselwörter entfallen sind oder anders interpretiert werden, ist GEDCOM 5.5.1 nicht kompatibel zu GEDCOM 7. Man hat mit GEDCOM 7 nicht nur Ergänzungen vorgenommen, sondern auch Schlüsselwörter in Ihrer Nutzung geändert oder umbenannt.

Ein Genealogieprogramm, das eine GEDCOM 7 Datei öffnet und sie intern noch wie eine GEDCOM 5.5.1 Datei behandelt, wird einen Teil der Daten nicht mehr finden – so z.B. Bilder und Datum-Freitexte (z.B. „1x.04.1865“).

Oder das Programm bringt Fehlermeldungen, weil die GEDCOM 7 Datei zu lange Zeilen enthält oder weil @VOID@ Verweise ins Leere nicht erwartet wurden.

Wie macht es Ahnenblatt?

Ahnenblatt prüft beim Öffnen einer GEDCOM-Datei die Versionsnummer und lehnt diese ab, wenn Sie eine Version größer gleich 7.0 trägt. Aktuell sind noch zu wenig GEDCOM 7 Dateien im Umlauf, weil auch noch nicht viele Genealogieprogramme den neuen Standard (schreibend) unterstützen. Dass Genealogieprogramme nur noch gemäß GEDCOM 7 speichern und einen 5.5.1 Export komplett aufgeben, ist auch noch nicht absehbar.

Dieses ist als Sofortmaßnahme zu verstehen. Das heißt nicht, dass der GEDCOM 7 Standard nie umgesetzt wird. Dieses bedarf allerdings einer genauen und aufwändigen programmtechnischen Vorbereitung.

 

„Das eröffnet doch neue tolle Möglichkeiten!“

Man muss da unterscheiden: nicht der GEDCOM-Standard gibt die Möglichkeiten einer Software vor – es sind nur Vorgaben für eine vereinheitlichte Darstellung im GEDCOM-Dateiformat. Durch die Erweiterbarkeit des GEDCOM-Formats waren viele der Neuerungen auch ohne GEDCOM 7 möglich.

Orts- und Aufgabenverwaltung sind auch weiterhin in GEDCOM 7 nicht vorgesehen, bleiben aber weiterhin in Ahnenblatt enthalten.

Daten, für die das importierende Programm keine Eingabefelder besitzt, kommen auch weiterhin nicht zur Anzeige bzw. können editiert werden. Eine Umsetzung eines GEDCOM 7 Im- und Export bedeutet also nicht zwangsläufig eine Erweiterung der Eingabemöglichkeiten.

Wie macht es Ahnenblatt?

Ahnenblatt hat auch bislang nicht den GEDCOM-Sprachumfang komplett im Programm umgesetzt. So kann man z.B. bei Ereignissen oder Quellen keine „Behörde“ und bei Ereignissen kein „Alter“ hinterlegen. Und auch „Aufbewahrungsorte“ für Quellen gibt es in Ahnenblatt nicht.

Solche Dinge können irgendwann mal (bei Bedarf) kommen – sind aber unabhängig davon, was der GEDCOM-Standard vorsieht.

 

„Besteht die Gefahr einer Vermischung der Standards?“

Das sehe ich durchaus als reelle Gefahr, dass eine GEDCOM-Datei sowohl Sprachelemente von 5.5.1 und auch 7 beinhaltet.

Man stelle sich eine Software vor, die eine GEDCOM 7 Datei importiert ohne auf die Versionsnummer zu prüfen und importiert diese wie eine 5.5.1 Datei. Nach ein paar Änderungen wird die Datei dann wieder gespeichert.

Ältere Versionen von Ahnenblatt würden auch unbekannte GEDCOM-Schlüsselwörter übernehmen (also vom GEDCOM 7 Standard) und diese mit der Versionsnummer 5.5.1 abspeichern.

Selbst wenn unbekannte GEDCOM-Schlüsselwörter beim Import ausgefiltert werden, sind Dateinamen gemäß GEDCOM 7 Konventionen gespeichert und von alten Programmen in der Regel nicht auffindbar.

Auch sollte man sich keine Illusionen machen: aktuelle GEDCOM 7 Implementierungen müssen nicht fehlerfrei sein. Vielleicht wird versehentlich oder aus Unwissenheit doch noch GEDCOM 5.5.1 in bestimmten Fällen verwendet. Die Implementierungen von GEDCOM 5.5.1 Routinen hatten 20 Jahre Zeit um den heutigen Reifegrad zu erreichen. Probleme im GEDCOM 7 Datenaustausch bemerkt man erst, wenn unterschiedliche Programme beteiligt sind. Das kommt aktuell noch zu selten vor.

Wie macht es Ahnenblatt?

Gegen die Nutzung alter Ahnenblatt-Versionen, kann ich nichts machen. Gerade die kostenlose 2er Version von Ahnenblatt wird von Anwendern nur selten aktualisiert.

Zumindest die aktuellen Versionen von Ahnenblatt prüfen auf die GEDCOM-Versionsnummer und verweigern gegebenenfalls den Import.

Erst wenn Ahnenblatt in der Lage ist GEDCOM 7 korrekt zu interpretieren, wird das Öffnen von GEDCOM 7 Dateien möglich sein.

 

„Ist eine Software veraltet, die nicht GEDCOM 7 unterstützt?“

GEDCOM ist erst einmal nur ein Dateiaustauschformat zwischen unterschiedlichen Genealogieprogrammen. Entscheidend ist dabei immer, dass auch wirklich ausnahmslos alle Daten im GEDCOM Format gespeichert werden und eine Software nicht einen Teil unterschlägt. Auch eine standardkonforme Nutzung von GEDCOM ist wichtig – was selbst bei 5.5.1 aktuell nicht immer gegeben ist.

Momentan kann ich mir nicht vorstellen, dass eine Genealogiesoftware einen vorhandenen GEDCOM 5.5.1 Ex- und Import komplett zugunsten des GEDCOM 7 Standards aufgibt. Zu groß sind die Unterschiede und zu viele „Altprogramme“ sind noch im Einsatz (man denke nur an das 20 Jahre alte PAF).

Bis eine Software als veraltet gilt, die GEDCOM 7 nicht unterstützt, ist aus meiner Sicht noch ein langer Weg. Dazu halten sich noch zu viele Genealogieprogrammhersteller (vor allem im Ausland) sehr bedeckt.

Wie macht es Ahnenblatt?

Wenn ich an die Entwicklung von Ahnenblatt in Richtung GEDCOM 7 denke, dann hat eine Import-Funktion den Vorrang. Erst danach wäre eine entsprechende Export-Funktion sinnvoll. Den GEDCOM 5.5.1 Standard würde ich dabei sicherlich nicht aufgeben. Eine konkrete Zeitplanung gibt es aber noch nicht.

 

„Warum spielt die GEDCOM Version überhaupt eine Rolle?“

Das liegt leider daran, dass die GEDCOM Standards 5.5.1 und 7 gravierende Kompatibilitätsunterschiede aufweisen. Die GEDCOM-Datei lässt sich daher nicht verlustfrei interpretieren, ohne die GEDCOM Version zu kennen.

Das ist eigentlich schade, wo doch das GEDCOM-Dateiformat vorsieht Zeilen mit unbekannten Daten zu ignorieren. Aber vielleicht sind die Änderungen zu komplex. Einige der Änderungen (Umbenennungen/Streichung von Schlüsselwörtern, Neuinterpretationen) halte ich für unnötig. Hier hätte man behutsamer vorgehen können.

Da fragt man sich schon, wie es andere Dateiformate schaffen über die Jahre stets kompatibel zu bleiben. Mit Versionsnummern von Dateiformaten wird man als Anwender nie belästigt.

Wenn dann doch mal eine Version zur Vorversion nicht mehr kompatibel ist, dann ändert man die Dateierweiterung. Word-Dokumente änderten die Dateierweiterung von .doc zu .docx und JPEG-2000-Dateien bekamen statt .jpg die Endung .jp2 oder .j2k. Vielleicht wäre analog die Einführung einer eigenen Dateiendung für GEDCOM 7 (z.B. .ged7) eine bessere Wahl gewesen.

Wie macht es Ahnenblatt?

Das Ahnenblatt-eigene Dateiformat .ahn ist auf- als auch abwärtskompatibel. Mit neuen Ahnenblatt-Versionen lassen sich daher alte Ahnenblatt-Dateien öffnen und sogar mit alten Programmversionen neueste Ahnenblatt-Dateien. Im letzteren Fall bekommt man allerdings eine Meldung, dass ein Teil der Daten verloren gehen könnte.

 

Internetlinks:
gedcom.io – FamilySearch GEDCOM – genealogical data exchange

Ahnenblatt Website
Neuerungen Version 4