Ahnendateien vergleichen

Gesperrt
kefranz

Ahnendateien vergleichen

Beitrag von kefranz »

Hallo,
gibt es eine Möglichkeit 2 fast gleiche Ahnendateien auf Übereinstimmung bzw, nicht übereinstimmende Daten zu vergleichen?
Beim Zusammenführen werden zuviele Fehler angezeigt, weil schon kleine Unterschiede wie z.B. um 1853 und ca. 1853 schon nicht als gleich behandelt werden. Es folgt Fehlermeldung Datum oder beim Zusammen führen werden beide Daten so "um 1853; ca 1853" übernommen.
Also müßten nach der Zusammenführung alle 1689 Namen geprüft werden.

Wer weiß Rat

Gruß
Kurt
Benutzeravatar
Torquatus
Beiträge: 3698
Registriert: 19.01.2006, 22:19
Wohnort: Mannheim

Beitrag von Torquatus »

Hallo Kurt,

ich kenne keine Möglichkeit, um zwei AB-Dateien abzugleichen.

Ich würde an Deiner Stelle die Dateien vor dem Zusammenführen mittels "Suchen und Ersetzen" zueinander anpassen und würde z.B. "ca." ersetzen durch "um" (wie es Dir halt gefällt) usw.

Mach Dir aber vorher Sicherungen Deiner Dateien :oops:

Viel Erfolg :)
Gruß, Torquatus

C.c. - Übrigens stelle ich den Antrag, dass Ahnenblatt das beste aller Ahnenprogramme werden muss - frei nach Cato
kefranz

Beitrag von kefranz »

Guten Morgen Torquatus,
danke für die schnelle Antwort.
Suchen und ersetzen habe ich auch schon vollzogen, aber es bleiben zu viele Doppeldaten wie:
Bastian; Sebstian usw.
und damnn kommen Meldungen wie:
Johann hat schon andere Eltern Bastian...
Johann hat schon andere Eltern Sebastian... usw

Wenn die Ahnen Dateien von zwei verschiedenen Autoren kommt, sind 100 und mehr Fehler zu bearbeiten und dann weiß ich noch immer nicht wo und wieviel Doppeldaten in der Form "Bastian; Sebstian" in der neuen Datei sind.
Es müßte eine Möglichkeit geben die einzelnen Satensätze zu vergleichen.
Gruß Kurt
Benutzeravatar
Torquatus
Beiträge: 3698
Registriert: 19.01.2006, 22:19
Wohnort: Mannheim

Beitrag von Torquatus »

Hallo Kurt
kefranz hat geschrieben:[...] aber es bleiben zu viele Doppeldaten wie:
Bastian; Sebstian usw.
und damnn kommen Meldungen wie:
Johann hat schon andere Eltern Bastian...
Johann hat schon andere Eltern Sebastian... usw

Wenn die Ahnen Dateien von zwei verschiedenen Autoren kommt, sind 100 und mehr Fehler zu bearbeiten und dann weiß ich noch immer nicht wo und wieviel Doppeldaten in der Form "Bastian; Sebstian" in der neuen Datei sind.
Ich würde anhand dieser Fehlermeldungen die Ausgangsdateien so lange anpassen, bis keine Fehler mehr gefunden werden, so dass AB lediglich Doppelte zusammenlegen muss. :) Anhand der ausgedruckten Liste "noch zu prüfen" (siehe unten) kommt man doch recht schnell zum Ziel.
Es müßte eine Möglichkeit geben die einzelnen Satensätze zu vergleichen.
Ein solches Programm stelle ich mir nicht so trivial vor, wie es zunächst aussieht. Was sollte man denn vergleichen, gewiss nicht den 1. Datensatz der Datei A mit dem 1. der Datei B, usw. Die nächste Möglichkeit wäre, die Dateien nach Namen(1)/Vornamen(2)/Geburtsdaten(3) zu sortieren und dann, ja was dann vergleichen? 1+2+3 (da würde der Bastian nicht identisch sein mit dem Sebastian), oder 1+2 (dto.)oder 1+3 (evtl., wenn in beiden Dateien das selbe Datum vorhanden)? Wenn man so vorginge, dann würden ebenfalls sehr viele Interaktionen zwischen Programm und Mensch stattfinden müssen. Letzlich entstünde mit einem solchen Programm dann wohl zumindest der gleiche Aufwand wie beim AB-Zusammenführen, das ich immer noch für den besseren Weg halte :oops:

Es gibt zwar Programme, die die Inhalte von 2 Dateien inhaltlich vergleichen, aber damit kommt man nicht wirklich weiter, weil die Personen ja nur Teil einer AB-Datei sind. Anhand der vielen Unterschiede (berechtigte und unberechtigte), die angezeigt werden, sucht man sich den Wolf.

Eine andere Möglichkeit wäre, beide Dateien im CSV-Format auszugeben und beide Dateien (mit Kennzeichnung 1 + 2) in einer CSV-Datei zusammenzuführen. Dann diese Gesamtdatei sortieren nach "Name/Vorname/Geburtsdatum/Kennzeichnung" und manuell bearbeiten und dabei entweder gegenseitig anpassen (und dann in AB Zusammenführung) oder Doubletten entfernen (und dann Ergebnis in AB einlesen). Aber wie gesagt, ich würde die AB-Zusammenführung bevorzugen, weil damit die 100%-Doubletten schon zusammengeführt werden und nur noch die Problemfälle bearbeitet werden müssten.

Viel Erfolg :)
Du hast keine ausreichende Berechtigung, um die Dateianhänge dieses Beitrags anzusehen.
Gruß, Torquatus

C.c. - Übrigens stelle ich den Antrag, dass Ahnenblatt das beste aller Ahnenprogramme werden muss - frei nach Cato
Gast

Beitrag von Gast »

Dann werde ich wohl mit den vorhandenen Möglichkeiten abeiten müssen und hoffe, dass ich irgendwann fertig bin :(
Gruß Kurt
Gesperrt