326, 329, 330: In zwei Dateien erfasst
Verfasst: 18.01.2007, 11:24
Hallo,
ja, ich weiß, es gibt Fehler die dürften einem alten Hasen eigentlich nicht passieren Aber Murphy hat schon Recht: "Wenn etwas schief gehen kann, dann geht es schief."
Ich schildere hier meinen Fehlerl deshalb, weil ich einerseits gerne hätte, dass Ihr für mich mitdenkt, aber andererseits auch, weil es anderen helfen könnte, wenn sie in eine ähnliche Situation geraten.
Zunächst zum Fehler:
Ich hatte bei den Mormonen Daten mehrerer Familien gefunden und habe diese als Gedcom-Dateien heruntergeladen. Um diese Daten mit der Funktion "Hinzufügen" in meine "Daten.ahn"-Datei zu übernehmen, habe ich sie in *.ahn-Dateien umgewandelt (wäre das notwendig gewesen?).
Weil ich noch nie "hinzugefügt" hatte, habe ich vorsichtshalber eine Kopie meiner Ahndatei unter dem Namen "Prüfen.ahn" abgespeichert. Und jetzt ist das passiert, was auch in dem meisten anderen Programmen, aber eben nicht in allen, passiert: Das Programm arbeitete mit der Datei Prüfen.ahn weiter. Leider arbeite ich tagtäglich mit einem Grafik-Programm, das anders reagiert und nach dem Abspeichern unter anderem Namen trotzdem mit der ursprünglichen Datei weiterarbeitet. Langer Rede kurzer Sinn: Ich war unbewusst im Glauben, dass ich an meiner Daten.ahn arbeite und habe noch jede Menge Daten "hinzugefügt" und erfasst. Irgendwann habe ich die Sitzung beendet. Soweit so gut.
Da ich AB mit einer Verknüpfung auf die "Daten.ahn" starte, ist die nächsten AB-Sitzung zwangsläufig mit der "alten "Daten.ahn" gestartet und mit diesem Stand habe ich weitergearbeitet. Da ich an einer anderen Ecke arbeitete, ist mir auch nichts aufgefallen. Irgenwann hat mich zwar unterbewusst die verringerte Personenzahl irritiert, aber ich dachte, da hätte ich falsche Zahlen im Kopf gehabt.
Erst nach einigen Tagen (mit viel Datenerfassung) filr mir auf, dass da Daten fehlen, die ich doch längst erfasst hatte. Ursache: siehe oben.
Nun zur Fehlerbereinigung:
1) Hinzufügen
Ich habe die größere Datei "Daten.ahn" geladen und die kleinere "Prüfen.ahn" mit "Hinzufügen" ergänzt.
2) Personen zusammführen
Mittels "Personen zusammenführen" habe ich die Identischen entfernt. Den Teil des Protokolls, der die "Nicht-Zusammengeführten" und die "Noch-zu-Prüfenden" enthält, habe ich ausgedruckt. Die Nicht-Zusammengführten sind die Personen, die in beiden Dateien "einzeln" waren, während die "Noch-zu-Prüfenden" Doppelte waren, die "ungleiche" Inhalte hatten.
3) Nachbearbeitung "Nicht-Zusammengeführte"
Bei diesen habe ich all die gelöscht, die aus meiner Erinnerung heraus gelöscht werden müssen, dabei habe ich die Ursprungsdateien zu Hilfe genommen. (Von Vorteil wäre gewesen, wenn hier im Protokoll gestanden hätte, aus welcher Datei die Personen kamen.)
4) Nachbearbeitung der "Noch-zu-Prüfenden"
Da der Unterschied zwischen den Daten protokolliert wurde, war die Bereinigung recht einfach. Komfortabel ist auch, dass der Zustand der Felder sowohl alt als auch neu im Datensatz (getrennt durch " ; " = Leerstelle, Semikolon, Leerstelle) gespeichert wird. Daher findet man diese Datensätze auch später noch mit der Funktion "Personen zusammenführen/Start" im Verzeichnis "noch zu prüfen" . Nach einem Klick auf den Button "Prüfen" kann man dann alle "zu Prüfenden" abklappern; dabei ist es von Vorteil, wenn man die Liste der "zu Prüfenden" zu Hand hat, denn nicht bei allen "zu Prüfenden" erkennt man die Ursache im Editier-Fenster auf Anhieb.
Diese Funktion kann man sich aber zunutze machen, um selbst "zu Prüfende" zu erzeugen. Voraussetzung ist, dass man die Zeichenfolge "Leerstelle, Semikolon, Leerstelle" stimmt; außerdem müssen vor und hinter dieser Zeichenfolge Zeichen sein. Solange Personen mit dieser Zeichenfolge, etc. vorhanden sind, kann man diese wie zuvor geschildert mit "Personen zusammnführen" finden und durch "Prüfen" abarbeiten. Das kann ganz sinnvoll sein.
Die Funtionen "Hinzufügen" und "Personen zusammenführen" eignen sich also auch dazu, "Unpaarige" in zwei oder mehreren Dateien zu ermitteln. Für den, der's braucht, eine gute Hilfe!
Fragen
Weiß jemand, wie die Doppelten erkannt werden? Werden dabei auch die Beziehungen berücksichtigt? Es wäre fatal, wenn dabei nur der Dateninhalt verglichen würde.
Hat meine Fehlerbereinigung evtl. noch weitere Schwachpunkte oder meint Ihr, dass das zum richtigen Ergebnis geführt hat?
Gruß, Walter
NS. Zunächst habe ich die Datenerfassung eingestellt
Spätere Ergänzungen sind in grüner Schrift.
ja, ich weiß, es gibt Fehler die dürften einem alten Hasen eigentlich nicht passieren Aber Murphy hat schon Recht: "Wenn etwas schief gehen kann, dann geht es schief."
Ich schildere hier meinen Fehlerl deshalb, weil ich einerseits gerne hätte, dass Ihr für mich mitdenkt, aber andererseits auch, weil es anderen helfen könnte, wenn sie in eine ähnliche Situation geraten.
Zunächst zum Fehler:
Ich hatte bei den Mormonen Daten mehrerer Familien gefunden und habe diese als Gedcom-Dateien heruntergeladen. Um diese Daten mit der Funktion "Hinzufügen" in meine "Daten.ahn"-Datei zu übernehmen, habe ich sie in *.ahn-Dateien umgewandelt (wäre das notwendig gewesen?).
Weil ich noch nie "hinzugefügt" hatte, habe ich vorsichtshalber eine Kopie meiner Ahndatei unter dem Namen "Prüfen.ahn" abgespeichert. Und jetzt ist das passiert, was auch in dem meisten anderen Programmen, aber eben nicht in allen, passiert: Das Programm arbeitete mit der Datei Prüfen.ahn weiter. Leider arbeite ich tagtäglich mit einem Grafik-Programm, das anders reagiert und nach dem Abspeichern unter anderem Namen trotzdem mit der ursprünglichen Datei weiterarbeitet. Langer Rede kurzer Sinn: Ich war unbewusst im Glauben, dass ich an meiner Daten.ahn arbeite und habe noch jede Menge Daten "hinzugefügt" und erfasst. Irgendwann habe ich die Sitzung beendet. Soweit so gut.
Da ich AB mit einer Verknüpfung auf die "Daten.ahn" starte, ist die nächsten AB-Sitzung zwangsläufig mit der "alten "Daten.ahn" gestartet und mit diesem Stand habe ich weitergearbeitet. Da ich an einer anderen Ecke arbeitete, ist mir auch nichts aufgefallen. Irgenwann hat mich zwar unterbewusst die verringerte Personenzahl irritiert, aber ich dachte, da hätte ich falsche Zahlen im Kopf gehabt.
Erst nach einigen Tagen (mit viel Datenerfassung) filr mir auf, dass da Daten fehlen, die ich doch längst erfasst hatte. Ursache: siehe oben.
Nun zur Fehlerbereinigung:
1) Hinzufügen
Ich habe die größere Datei "Daten.ahn" geladen und die kleinere "Prüfen.ahn" mit "Hinzufügen" ergänzt.
2) Personen zusammführen
Mittels "Personen zusammenführen" habe ich die Identischen entfernt. Den Teil des Protokolls, der die "Nicht-Zusammengeführten" und die "Noch-zu-Prüfenden" enthält, habe ich ausgedruckt. Die Nicht-Zusammengführten sind die Personen, die in beiden Dateien "einzeln" waren, während die "Noch-zu-Prüfenden" Doppelte waren, die "ungleiche" Inhalte hatten.
3) Nachbearbeitung "Nicht-Zusammengeführte"
Bei diesen habe ich all die gelöscht, die aus meiner Erinnerung heraus gelöscht werden müssen, dabei habe ich die Ursprungsdateien zu Hilfe genommen. (Von Vorteil wäre gewesen, wenn hier im Protokoll gestanden hätte, aus welcher Datei die Personen kamen.)
4) Nachbearbeitung der "Noch-zu-Prüfenden"
Da der Unterschied zwischen den Daten protokolliert wurde, war die Bereinigung recht einfach. Komfortabel ist auch, dass der Zustand der Felder sowohl alt als auch neu im Datensatz (getrennt durch " ; " = Leerstelle, Semikolon, Leerstelle) gespeichert wird. Daher findet man diese Datensätze auch später noch mit der Funktion "Personen zusammenführen/Start" im Verzeichnis "noch zu prüfen" . Nach einem Klick auf den Button "Prüfen" kann man dann alle "zu Prüfenden" abklappern; dabei ist es von Vorteil, wenn man die Liste der "zu Prüfenden" zu Hand hat, denn nicht bei allen "zu Prüfenden" erkennt man die Ursache im Editier-Fenster auf Anhieb.
Diese Funktion kann man sich aber zunutze machen, um selbst "zu Prüfende" zu erzeugen. Voraussetzung ist, dass man die Zeichenfolge "Leerstelle, Semikolon, Leerstelle" stimmt; außerdem müssen vor und hinter dieser Zeichenfolge Zeichen sein. Solange Personen mit dieser Zeichenfolge, etc. vorhanden sind, kann man diese wie zuvor geschildert mit "Personen zusammnführen" finden und durch "Prüfen" abarbeiten. Das kann ganz sinnvoll sein.
Die Funtionen "Hinzufügen" und "Personen zusammenführen" eignen sich also auch dazu, "Unpaarige" in zwei oder mehreren Dateien zu ermitteln. Für den, der's braucht, eine gute Hilfe!
Fragen
Weiß jemand, wie die Doppelten erkannt werden? Werden dabei auch die Beziehungen berücksichtigt? Es wäre fatal, wenn dabei nur der Dateninhalt verglichen würde.
Hat meine Fehlerbereinigung evtl. noch weitere Schwachpunkte oder meint Ihr, dass das zum richtigen Ergebnis geführt hat?
Gruß, Walter
NS. Zunächst habe ich die Datenerfassung eingestellt
Spätere Ergänzungen sind in grüner Schrift.