Seite 1 von 1

Ahnendateien vergleichen

Verfasst: 17.01.2012, 15:07
von kefranz
Hallo,
gibt es eine Möglichkeit 2 fast gleiche Ahnendateien auf Übereinstimmung bzw, nicht übereinstimmende Daten zu vergleichen?
Beim Zusammenführen werden zuviele Fehler angezeigt, weil schon kleine Unterschiede wie z.B. um 1853 und ca. 1853 schon nicht als gleich behandelt werden. Es folgt Fehlermeldung Datum oder beim Zusammen führen werden beide Daten so "um 1853; ca 1853" übernommen.
Also müßten nach der Zusammenführung alle 1689 Namen geprüft werden.

Wer weiß Rat

Gruß
Kurt

Verfasst: 17.01.2012, 15:13
von Torquatus
Hallo Kurt,

ich kenne keine Möglichkeit, um zwei AB-Dateien abzugleichen.

Ich würde an Deiner Stelle die Dateien vor dem Zusammenführen mittels "Suchen und Ersetzen" zueinander anpassen und würde z.B. "ca." ersetzen durch "um" (wie es Dir halt gefällt) usw.

Mach Dir aber vorher Sicherungen Deiner Dateien :oops:

Viel Erfolg :)

Verfasst: 18.01.2012, 09:47
von kefranz
Guten Morgen Torquatus,
danke für die schnelle Antwort.
Suchen und ersetzen habe ich auch schon vollzogen, aber es bleiben zu viele Doppeldaten wie:
Bastian; Sebstian usw.
und damnn kommen Meldungen wie:
Johann hat schon andere Eltern Bastian...
Johann hat schon andere Eltern Sebastian... usw

Wenn die Ahnen Dateien von zwei verschiedenen Autoren kommt, sind 100 und mehr Fehler zu bearbeiten und dann weiß ich noch immer nicht wo und wieviel Doppeldaten in der Form "Bastian; Sebstian" in der neuen Datei sind.
Es müßte eine Möglichkeit geben die einzelnen Satensätze zu vergleichen.
Gruß Kurt

Verfasst: 18.01.2012, 10:47
von Torquatus
Hallo Kurt
kefranz hat geschrieben:[...] aber es bleiben zu viele Doppeldaten wie:
Bastian; Sebstian usw.
und damnn kommen Meldungen wie:
Johann hat schon andere Eltern Bastian...
Johann hat schon andere Eltern Sebastian... usw

Wenn die Ahnen Dateien von zwei verschiedenen Autoren kommt, sind 100 und mehr Fehler zu bearbeiten und dann weiß ich noch immer nicht wo und wieviel Doppeldaten in der Form "Bastian; Sebstian" in der neuen Datei sind.
Ich würde anhand dieser Fehlermeldungen die Ausgangsdateien so lange anpassen, bis keine Fehler mehr gefunden werden, so dass AB lediglich Doppelte zusammenlegen muss. :) Anhand der ausgedruckten Liste "noch zu prüfen" (siehe unten) kommt man doch recht schnell zum Ziel.
Es müßte eine Möglichkeit geben die einzelnen Satensätze zu vergleichen.
Ein solches Programm stelle ich mir nicht so trivial vor, wie es zunächst aussieht. Was sollte man denn vergleichen, gewiss nicht den 1. Datensatz der Datei A mit dem 1. der Datei B, usw. Die nächste Möglichkeit wäre, die Dateien nach Namen(1)/Vornamen(2)/Geburtsdaten(3) zu sortieren und dann, ja was dann vergleichen? 1+2+3 (da würde der Bastian nicht identisch sein mit dem Sebastian), oder 1+2 (dto.)oder 1+3 (evtl., wenn in beiden Dateien das selbe Datum vorhanden)? Wenn man so vorginge, dann würden ebenfalls sehr viele Interaktionen zwischen Programm und Mensch stattfinden müssen. Letzlich entstünde mit einem solchen Programm dann wohl zumindest der gleiche Aufwand wie beim AB-Zusammenführen, das ich immer noch für den besseren Weg halte :oops:

Es gibt zwar Programme, die die Inhalte von 2 Dateien inhaltlich vergleichen, aber damit kommt man nicht wirklich weiter, weil die Personen ja nur Teil einer AB-Datei sind. Anhand der vielen Unterschiede (berechtigte und unberechtigte), die angezeigt werden, sucht man sich den Wolf.

Eine andere Möglichkeit wäre, beide Dateien im CSV-Format auszugeben und beide Dateien (mit Kennzeichnung 1 + 2) in einer CSV-Datei zusammenzuführen. Dann diese Gesamtdatei sortieren nach "Name/Vorname/Geburtsdatum/Kennzeichnung" und manuell bearbeiten und dabei entweder gegenseitig anpassen (und dann in AB Zusammenführung) oder Doubletten entfernen (und dann Ergebnis in AB einlesen). Aber wie gesagt, ich würde die AB-Zusammenführung bevorzugen, weil damit die 100%-Doubletten schon zusammengeführt werden und nur noch die Problemfälle bearbeitet werden müssten.

Viel Erfolg :)

Verfasst: 18.01.2012, 10:55
von Gast
Dann werde ich wohl mit den vorhandenen Möglichkeiten abeiten müssen und hoffe, dass ich irgendwann fertig bin :(
Gruß Kurt