Seite 1 von 2

.AHN-Dateien zusammenführen

Verfasst: 01.01.2009, 15:02
von Jan_HJT
Hallo Leute,

ich weiss, das Problem wurde schon füher beschrieben, aber die Threads machen mich noch nicht so richtig schlauer.

Das möchte ich erreichen:

Ich möchte unterschiedliche .AHN-Dateien zusammenführen. Ich habe Ahnenblatt auf dem Recher meines Vaters und dem meines Schwiegervaters installiert. Meine Frau und ich haben außerdem noch eine eigene Installation auf unserem Rechner. Es existieren also 3 Installationen. Die 3 dazugehörigen AHN-Dateien, die mal mit einer gemeinsamen Basis von 96 Personen startete, haben sich mittlerweile recht unterschiedlich entwickelt. Mein Schwiegervater war besonders fleißig und hat nun 320 Personen in seiner Datenbank.

Klar, dass es nun mal an der Zeit wird. diese Versionen zu einer zu verschmelzen. Doch das gestaltet sch schwieriger, als erwartet...

Das habe ich bisher ausprobiert:

Zunächst habe ich zu Testzwecken die Ahnendatei meines Schwiegervaters mal kopiert und mir die Kopie auf den Desktop gelegt. Sie heisst dort "HOI1.Ahn". Dann habe ich eine weitere Kopie - "HOI2.Ahn" - erstellt und in dieser meinem Schwiegervater ein weiteres Kind mit dem Namen "Test" gegeben. "HOI1" und "HOI2" unterscheiden sich also nur um dieses eine Kind "Test".

Nun hab ich "HOI1" geöffnet, es werden 320 Personen gefunden. Ich wähle "Datei" > "Hinzufügen" und wähle "HOI2" mit 321 Personen. Die Frage, ob doppelte Personen zusammengeführt werden sollen, bestätige ich mit "Ja". Ein Warnhinweis folgt: "Unvollständige Verbindungen gefunden! Das Ergebnis beim Personen zusammenführen ist besser, wenn keine unvollständigen Personen Vorhanden sind. Soll daher jetzt die Plausibilitätsprüfung aufgerufen werden?" Ich entscheide mich für "Ja"***. 324 Probleme werden gefunden: Entweder sind die Personen "doppelt vorhanden" oder die "Verbindungen sind nicht vollständig". Die Möglichkeiten "Speichern", "Optionen" und "Abbrechen" bringen mich nicht weiter. Also wähle ich "OK". Aber auch das ist eine Sackgasse, denn das Programm springt einfach zur ersten Person in der Fehlerliste und bricht dann das Zusammenführen der Personen ab (?).

*** Im zweiten Anlauf wähle ich "Nein". Das scheint zu klappen. Mir werden in einer Liste 290 Personen angezeigt, die doppelt vorhanden sind. Das sind zwar nicht alle Personen der Datenbank, aber immerhin ein Anfang. Ich überlege noch, ob ich per "Hinzufügen" die übrigen manuell eingeben soll, aber selbst wenn ich scharf nachdenke, fallen mir nicht alle 30 Personen ein, die hier eigentlich noch fehlen. Ich wähle also "Start". Bilanz: 290 Personen zusammengeführt, 31 (mit dem "Test"-Kind) nicht. Ich speichere das Ergebnis erst ab, damit ich die fehlenden 30 später wiederfinde und und wähle dann "OK".

Nun lasse ich die Plausibilitätsprüfung durchlaufen: "Kind Fiona hat bereits andere Eltern", "Es fehlt Verweis auf Kind Ursula". Beim Öffnen der Problemfälle zeigt sich dann zum Beispiel, dass die Urgroß-Tante zwei mal den selben Mann geheiratet hat; mit dem einen Gustav hat sie allerdings nur 2 Kinder, mit dem anderen dagegen 3... usw.

Und jetz...?
Ich bin froh, das dass jetzt nur ein Test war. Eigentlich hätte ja nur die eine Person, das "Test"-Kind nämlich, in der zusammengefügten Ahnendatei eingefügt sein sollen. Hier in diesem Testfall konnte ich zwar die durcheinandergewürfelten Familienverhältnisse wieder ordnen, aber ich will mir gar nicht vorstellen was auf mich zukommt, wenn ich mal die "echten" .AHN-Dateien zusammenfügen muss...

Und jetzt? Habt Ihr eine Idee, was ich falsch gemacht hab oder besser machen könnte?

Danke schon mal im Voraus,

Gruss, Jan ;-)

Verfasst: 01.01.2009, 15:40
von Hugo
Guten Tag Jan
Herzlich Willkommen im Ahnenblattportal

Das allerwichtigste hast Du schon befolgt
Erstelle Dir vorm zusammenführen meherer Dateien immer erstmal Sicherheitskopien :!:
aller ahn oder ged Dateien

Jan hat geschrieben:Ein Warnhinweis folgt: "Unvollständige Verbindungen gefunden! Das Ergebnis beim Personen zusammenführen ist besser, wenn keine unvollständigen Personen Vorhanden sind. Soll daher jetzt die Plausibilitätsprüfung aufgerufen werden?
Das bringt mich ins grübeln :blink2:
Mit einer Datei ist da was nicht in Ordnung :!:

Prüfe jede der 3 Dateien bitte einzelnd durch, ob da irgendwelche Plausi-Meldungen kommen
Lasse auch bitte die Funktion "Daten angleichen" mit der Option "Geschwisterverweise neu erstellen" durchlaufen
Bei der Gelegenheit kannst Du auch gleich die Namensschreibwaisen für Vor und Geburtsnamen bei "Eltern/Geschwister/Partner/Kinder" in allen Dateien auf den gleichen Stand bringen

Führe diese Prüfungen/Anpassungen bitte mal durch und probiere das verschmelzen dann erst nur mit Deiner und nur einer der beiden neuen durch

Danach melde Dich bitte erneut und teile uns die dann eventuell noch enstehenden Probleme mit

Gruß Hugo

Verfasst: 01.01.2009, 15:40
von lauterverwandte
Hallo Jan,
da du alle 3 Dateien gespeichert hast, kann dir eigentlich nichts passieren.
Öffne mal die größte Datei zuerst und speichere dann direkt unter einem neuen Namen, damit deine Ursprungsdatei nicht geändert wird.
Füge die zweite Datei hinzu.
Und wenn es dann Probleme gibt, meld dich nochmal.
Möglicherweise sind von den drei "Mitarbeitern" auch im ursprünglichen Personenstamm von 96 Personen Änderungen vorgenommen worden.
Wenn hier z.B. ein Vorname oder ein Geburtsdatum geändert wurde, kann AB das nicht mehr als doppelte Person erkennen.

Problem besteht leider weiter...

Verfasst: 01.01.2009, 16:55
von Jan_HJT
Hallo Hugo und lauterverwandte,

Danke erstmal für Eure Antworten! :-)

Ehrlich gesagt hab ich mich noch gar nicht an die 3 "echten" Ahn-Dateien herangetraut, sondern experimentiere immer noch mit den beiden Kopien den größten Datenbank, also mit HOI1 und HOI2 (Orginal heißt einfach HOI.Ahn). Die beiden unterscheiden sich ja wirklich nur um das eine "Test"-Kind (s.o.), ansonsten sind die zwei Testdateien wirklich absolut identisch.

Trotzdem hab ich die Tipps von Euch befolgt und zunächst die Plausi durchlaufen lassen. Tatsächlich war hier ein Problem zu finden, meine Tante hat sich selbst als Schwester... :-D Auch die Funktion "Datein angleichen" hab ich wie von Hugo beschrieben durchlaufen lassen.

Leider besteht das Problem aber weiterhin. Ahnenblatt "erkennt" einfach nicht alle doppelten Personen. Ich kann sie dann zwar manuell über "Hinzufügen..." einpflegen, aber das ist echt mühsam und die Fehlerquote dürfte auch recht hoch sein... :-(

Gruss, Jan

Re: Problem besteht leider weiter...

Verfasst: 01.01.2009, 17:28
von Hugo
Guten Tag Jan
Jan hat geschrieben:Tatsächlich war hier ein Problem zu finden, meine Tante hat sich selbst als Schwester... :-D Auch die Funktion "Datein angleichen" hab ich wie von Hugo beschrieben durchlaufen lassen.
Durch den Durchlauf von "Datein angleichen" und der eingeschalteten Option "Geschwisterverweise neu erstellen" müßte sich eigentlich der Schwesternverweis auf sich selbst bei Deiner Tante repapiert haben
Jan hat geschrieben:Leider besteht das Problem aber weiterhin. Ahnenblatt "erkennt" einfach nicht alle doppelten Personen.
Wie jedes andere Programm auch, kann Ahnenblatt sie nur als doppelt erkennen, wenn die Namen identisch geschrieben sind und mind ein vollständiges Datum (TT.MM.JJJJ) gleich ist
Jan hat geschrieben:Ich kann sie dann zwar manuell über "Hinzufügen..." einpflegen, aber das ist echt mühsam und die Fehlerquote dürfte auch recht hoch sein... :(
Nach dem "Zusammenführen" zweier Dateien wird Dir ein Bericht angezeigt
Ferner wird Dir die Möglichkeit angeboten, diesen zu speichern
Speicher ihn bitte ab
Der abgespeicherte Bericht ist wesentlich ausfühlicher als der angezeigte
Die schrittweise Abarbeitung dieses gespeicherten Berichtes erleichtert die Sache schon etwas

PS1: Anhand des Geschwisterverweises auf sich selbst, bin ich mir nicht sicher, ob ihr alle mit der aktuellen Version arbeitet
Falls nicht, solltest Du Updaten

PS2: Wenn Du mit Ahnenblatt "sattelfest" bist, lohnt es sich bei größeren Dateien vorm Zusammenfüggen in einzelne Zweige/Äste aufzusplitten
Dann behält man leichter den Überblick

Gruß Hugo

Der Gedanke kam mir auch...

Verfasst: 01.01.2009, 19:47
von Jan_HJT
Hallo Hugo,

naja, ich hab halt erst die Plausi durchlaufen lassen und das Problem mit meiner Tante "manuel" behoben (hab einfach Ihr zweites Schwestern-Ich gelöscht...). Danach fand die Plausi ja dann auch keine Probleme mehr. Anschließend hab ich dann noch "Dateien angleichen" wie oben beschrieben und anschschließend erneut die Plaus suchen lassen. Das brachte auch keine weiteren Probleme...

Trotzdem wurden nicht alle doppelten Personen übernommen. Die Auswahl, wer als doppelt erkannt wird und wer nicht, erscheint mir ziemlich wahllos. So kam es vor, dass Personen erkannt wurden, von denen gerade mal der Vorname bekannt war (Nachname mit XXX ersetzt), andere mit komplettem Namen und Geburtstag wurden dagegen nicht erkannt. :?: :roll:

Der Gedanke mit dem Splitten der Datenbank kam mir auch schon mal. Meine Schwiegereltern werden ja eh ihre eigenen Ahnen weiterverfolgen und die Daten meiner Eltern gar nicht dafür benötigen. Der Vorteil wäre dann, dass das Programm beim Zusammenführen der Dateien nur die "gemeinsame Endstrecke" - nämlich meine Frau, Kinder und mich in Einklang bringen müsste, es sei denn, wir hätten in grauer Vorzeit die gleichen Ahnen... :D Aber wie geht das mit dem Splitten? Ich bin leider nicht so firm mit Programm.

Danke und Gruss, Jan

PS: Wir benutzen übrigens die gleiche Version (2.56)

Re: Der Gedanke kam mir auch...

Verfasst: 01.01.2009, 20:16
von Hugo
Guten Tag Jan
Jan hat geschrieben:andere mit komplettem Namen und Geburtstag wurden dagegen nicht erkannt. :?: :roll:
Sind die Namen wirklich identisch geschrieben?

Und sind die Datumsangaben auch wirklich gleich?
Nicht das bei A1 steht 01Punkt01Punkt2009 und bei A2 01Komma01Punkt2009
ist übrigens ein gern gemachter Fehler (Tastatur verlockt ja auch dazu)

Laß mal mit der Funkzion "Suchen" und der Option "Trefferliste vorab zeigen" nur in Datumsfeldern nach Komma suchen
Jan hat geschrieben:Aber wie geht das mit dem Splitten?
Tut mir leid Jan, das schaff ich heute nicht mehr Dir zu erklären :(
Da um 5:00 der Wecker klingelte, bin ich jetzt zu :zzz:

Gruß Hugo

Verfasst: 01.01.2009, 20:39
von Torquatus
Hallo Jan,
So kam es vor, dass Personen erkannt wurden, von denen gerade mal der Vorname bekannt war (Nachname mit XXX ersetzt), andere mit komplettem Namen und Geburtstag wurden dagegen nicht erkannt.
das kommt dann vor, wenn die Eltern-, Kinder- oder Geschwister-Daten identisch sind.

Es macht wenig Sinn zwei (fast) identische Dateien zusammenzuführen, da dabei (fast) immer die von Dir geschilderten Probleme auftreten. Die Doubletten einer Person ohne ein identisches "komplettes" Datum und ohne Eltern können und sollen nicht zusammengeführt werden. Wenn Daten fehlen, woran das Programm erkennen kann, dass zwei Daten für einen Karl Müller, *1896 +1943 zu ein und derselben Person gehören, dann darf es die auch nicht verschmelzen.

Ich bin überzeugt, dass ein Test mit Kopien den echten Daten erfreulichere Ergebnisse bringt

Verfasst: 01.01.2009, 20:51
von Marcus
Torquatus hat geschrieben:
Ich bin überzeugt, dass ein Test mit Kopien den echten Daten erfreulichere Ergebnisse bringt
Aber auch hier dann unbedingt vorher alle Plausi-Probleme bereinigen!
Marcus

Verfasst: 01.01.2009, 22:48
von Jan_HJT
Hallo Hugo, Torquatus und Marcus
Sind die Namen wirklich identisch geschrieben?
Ja, das sind sie ganz sicher. Die beiden Test-Dateien sind ja -bis auf das eine "Test"-Kind (s.o.)- absolut identische Kopien der echten Datenbank meines Schwiegervaters.[qoute]Es macht wenig Sinn zwei (fast) identische Dateien zusammenzuführen, da dabei (fast) immer die von Dir geschilderten Probleme auftreten.[/quote]Ich glaube auch, dass hier das Problem liegt. Das Programm kann wirklich nicht einfach davon ausgehen, dass ein zweimal vorhandener Karl Müller ein und dieselbe Person ist. Aber leider weiß man ja oft nicht alle Daten zu einer Person: "Die Emma war meine Tante in Karlsruhe, aber wie die mit Mädchennamen hieß oder wann die geboren ist, dass weiss ich auch net..." Das sind ja schon eher die Informationen, mit denen man sich (zunächst) begnügen muss. :?

Sinnvoller wäre es schon, wenn die unterschiedlichen .Ahn-Dateien möglichst wenig Doubletten enthalten. Dann muss man im Zweifelsfall nämlich nicht 30 "übersehene" Personen nachbearbeiten müssen, sondern nur 3.

Also werd ich die Ahn-Dateien wohl splitten müssen, damit jeder Famileinzweig seine eigene bekommt. Ich hab schon mal mit Bearbeiten > "Gruppe löschen" experimentiert. Ziel war es, einzelne Familienzweige komplett zu entfernen. Leider hat das nicht so geklappt, wie ich das wollte.
Tut mir leid Jan, das schaff ich heute nicht mehr Dir zu erklären
Kein Problem! Ich kann warten. Wenn ich die Datenbanken komplett neu machen muss, kostet mich das sicher mehr Zeit... :book: :wink:

Gruss, Jan :thx:

PS: Vielleicht eine Idee für Dirk: Jede neu angelegte Person bekommt beim Erstellen eine Art "Unique-ID" (vielleicht mittels md5sum), die im Hash neben dem Namen auch noch Erstellungsdatum und -Uhrzeit aufnimmt. Beispiel: md5 ("Heinrich+Müller+01012009+2241")=095642220ad321c6452b6d00a7a8c3e6 - so könnten echte Doubletten leicht identifiziert werden, auch wenn man nicht besonders viele Informationen zu einer Person hat... 8)

Verfasst: 01.01.2009, 23:02
von Jürgen T.
Hallo Jan_HJT,
Jan_HJT hat geschrieben: PS: Vielleicht eine Idee für Dirk: Jede neu angelegte Person bekommt beim Erstellen eine Art "Unique-ID" (vielleicht mittels md5sum), die im Hash neben dem Namen auch noch Erstellungsdatum und -Uhrzeit aufnimmt. Beispiel: md5 ("Heinrich+Müller+01012009+2241")=095642220ad321c6452b6d00a7a8c3e6 - so könnten echte Doubletten leicht identifiziert werden, auch wenn man nicht besonders viele Informationen zu einer Person hat... 8)
Bist Du sicher, dass das eine Lösung des Problems wäre?

Wenn Du diesen Heinrich Müller erfasst, ist in der UID Dein Erfassungstag mit Uhrzeit hinterlegt.
Wenn jemand anderes den gleichen Heinrich Müller erfasst, ist dessen Erfassungstag und Uhrzeit in der UID hinterlegt.

Beim Zusammenführen der beiden Dateien würde dieser Heinrich Müller doch dann auch nicht als Doublette erkannt werden - oder habe ich da ein Verständnisproblem?

Verfasst: 01.01.2009, 23:24
von Jan_HJT
Hallo Jürgen,

ja, da liegt eine Verständnisproblem vor. Es geht in diesem Fall wirklich um die echten Doubletten, also zwei absolut identische Datensätze. Wenn ich einen Heinrich Müller um 22:40h eingebe, und Du einen um 23:21, dann sind sie ja nicht wirklich identisch. Sollte es sich trotzdem um die selbe Person handeln, kann man die Personen ja immer noch auf die Art zusammenführen, die das Programm im Moment vorsieht (Name, Geburttag, Familienverhältnisse, etc).

Gruss, Jan

Verfasst: 01.01.2009, 23:58
von Jürgen T.
Hallo Jan_HJT,

danke für's Erklären.

Verfasst: 02.01.2009, 00:14
von Jan_HJT
Hallo Jürgen,

kein Problem... ;) ich wart dann mal auf Hugo und wie das mit dem Splitten geht.

Gute N8, Jan