Einlesen von GEDCOM Dateien

Benutzeravatar
Fridolin
Beiträge: 3796
Registriert: 04.01.2017, 18:32
Wohnort: Regio Rhein-Neckar
Hat sich bedankt: 37 Mal
Danksagung erhalten: 32 Mal

Beitrag von Fridolin »

Ach so - wir bewegen uns noch immer im Archiv. Kein Wunder, dass man da die Posts nicht editieren kann...
Aktuell Win11-64 pro 23H2, Ahnenblatt 3.60 - Daten via NAS, Programm lokal

Empfehlung: Alle relevanten Handbücher lesen :book:
(es gibt das Benutzerhandbuch und mehrere Themen-Specials!)
Benutzeravatar
bjew
Beiträge: 4136
Registriert: 19.01.2006, 19:31
Wohnort: südlicher geht's immer

Beitrag von bjew »

Hi, lohnt es sich, über die Datumsgesichte sich den Kopf zu zerbrechen?
Original war da 24.01.2017 00:17, später 01:17 und jetzt 23.01.2017.
Ich weiss es noch, da ich beim Abspeichern stutzig wurde - kann doch nicht sein

Ich habe meine Einstellung zwischenzeitlich geändert (+1) .... und der Rest ist m.E. egal
Bleibt gesund, Gruß
bjew (Bernhard) ------ derzeit fast nicht aktiv
System: Win10 auf Laptop mit i7 --- Ahnenblatt 2.74 (als Backup), 2.99[p] u. V3.56
Benutzeravatar
Fridolin
Beiträge: 3796
Registriert: 04.01.2017, 18:32
Wohnort: Regio Rhein-Neckar
Hat sich bedankt: 37 Mal
Danksagung erhalten: 32 Mal

Beitrag von Fridolin »

Ach so - wir sind ja immer noch im Archiv. Alles klar.
Aktuell Win11-64 pro 23H2, Ahnenblatt 3.60 - Daten via NAS, Programm lokal

Empfehlung: Alle relevanten Handbücher lesen :book:
(es gibt das Benutzerhandbuch und mehrere Themen-Specials!)
Benutzeravatar
Fridolin
Beiträge: 3796
Registriert: 04.01.2017, 18:32
Wohnort: Regio Rhein-Neckar
Hat sich bedankt: 37 Mal
Danksagung erhalten: 32 Mal

Beitrag von Fridolin »

Jetzt wird es aber echt peinlich - und alles bleibt stehen. Das ist wirklich unangenehm, im Archiv ein Gespräch fortzuführen. Ich lass es sein. Zur Sache habe ich ja sowieso gesagt, was ich zu sagen hatte.
Aktuell Win11-64 pro 23H2, Ahnenblatt 3.60 - Daten via NAS, Programm lokal

Empfehlung: Alle relevanten Handbücher lesen :book:
(es gibt das Benutzerhandbuch und mehrere Themen-Specials!)
Benutzeravatar
bjew
Beiträge: 4136
Registriert: 19.01.2006, 19:31
Wohnort: südlicher geht's immer

Beitrag von bjew »

peinlich, peinlich ...... ist es nicht
Bleibt gesund, Gruß
bjew (Bernhard) ------ derzeit fast nicht aktiv
System: Win10 auf Laptop mit i7 --- Ahnenblatt 2.74 (als Backup), 2.99[p] u. V3.56
Seelentag
Beiträge: 5
Registriert: 23.01.2017, 23:04

Beitrag von Seelentag »

Hallo Allerseits,

da bin ich ja baff, was für eine umfangreiche Diskussion ich da angestossen habe :roll: - vielen Dank an Alle.

Zuerst zur Uhrzeit: bei mir wird 23:17 angezeigt - und das ist auch korrekt. Weil ich heute schon wieder um halb-6 raus musste, bin ich ausnahmsweise einmal kurz vor Mitternacht ins Bett.

Mein Programm is Ahnenforscher - allerdings mit einer recht alten Version (wofür ich meine Gründe habe) ... evtl. ist bei einer neueren Version eine Auswahl möglich. Hier sehe ich aber nicht das Problem.

Es gibt Programme und Gedcom-Datenbanken, die ANSEL nicht akzeptieren. Ich habe also durchaus Übung darin, die Gedcom-Datei entsprechend anzupassen. Ahnenblatt sollte ANSEL aber akzeptieren. Hier die gewünschten Ausschnitte aus der Gedcom-Datei:

Code: Alles auswählen

0 HEAD 
1 SOUR Ahnenforscher
2 VERS 2000
1 DATE 20 JAN 2017
1 SUBM @S1@
1 CHAR ANSEL
1 FILE HALTER-PAUL-TERTULIAN_1903-X_NACHKOMMEN_20170120.GED
1 GEDC 
2 VERS 5.5
2 FORM LINEAGE-LINKED
bzw.

Code: Alles auswählen

1 NAME Ursula Gerda Marie /Pätzold/
Beste Grüsse - Wolf
Zuletzt geändert von Seelentag am 25.01.2017, 09:32, insgesamt 1-mal geändert.
Seelentag
Beiträge: 5
Registriert: 23.01.2017, 23:04

Beitrag von Seelentag »

FZiegler hat geschrieben:Das ist wirklich unangenehm, im Archiv ein Gespräch fortzuführen.
Hmmm ... in diesem Forum bin ich ja neu - aber ich moderiere mehrere Foren zu genealogischen und anderen Themen, ein "Archiv" ist mir noch nicht über den Weg gelaufen - und der Sinn dafür erschliesst sich mir auch nicht. Bei "meinen" Foren lege ich immer grossen Wert darauf, ein bestimmtes Thema möglichst in einem Thread zu diskutieren, nicht eine Frage / Problem parallel mehrfach anzusprechen. Deswegen habe ich mir auch die Mühe gemacht, erst einmal zu suchen, ob meine Problematik schon einmal diskutiert wurde ... aber ich bin ja noch lernfähig ... jetzt bin ich aber wohl lieber :zip:, bevor ich mich noch unbeliebt mache.
Zuletzt geändert von Seelentag am 25.01.2017, 09:29, insgesamt 1-mal geändert.
Seelentag
Beiträge: 5
Registriert: 23.01.2017, 23:04

Beitrag von Seelentag »

So - jetzt habe ich einmal von ANSEL auf ANSI bzw. UTF-8 gewechselt/abgespeichert: Beides wird korrekt eingelesen und dargestellt. Ich kann das Problem also praktisch lösen - das "theoretische" Problem mit ANSEL besteht weiter ... falls sich jemand darum kümmern möchte :D.
Benutzeravatar
Fridolin
Beiträge: 3796
Registriert: 04.01.2017, 18:32
Wohnort: Regio Rhein-Neckar
Hat sich bedankt: 37 Mal
Danksagung erhalten: 32 Mal

Beitrag von Fridolin »

Hallo Wolf,

in dem Code-Schnipsel, der ANSEL sein soll, wird mir der Umlaut korrekt angezeigt - ich hätte ein merkwürdiges Sonderzeichen an der Stelle erwartet. Ist das normal für ANSEL, dass das "ä" an der selben Stelle liegt wie bei ANSI bzw. Windows-1252/"Westlich" (was mir als Zeichensatz hier im Forum angezeigt wird)? Sonst hätte ich nämlich den Verdacht, dass dein Programm 'behauptet' ANSEL zu schreiben, tatsächlich aber ANSI schreibt. Aber ich bin relativ neu in der Ahnerei und hatte mit GEDCOM noch nicht zu tun - also ist mir im ganzen Leben noch kein ANSEL über den Weg gelaufen, denn das ist ja außerhalb von GEDCOM noch nie ein gebräuchlicher Zeichensatz gewesen.

Freut mich aber, dass dein Problem jedenfalls praktisch gelöst ist! Ich denke, Dirk B. wird es zur Kenntnis nehmen.

Das mit dem Archiv ist folgendes: Manche alte Threads sind archiviert - erkennt man an dem Begriff ARCHIV zu Beginn des Themas. Mir wäre das beim ersten Suchen sicherlich auch nicht aufgefallen. Nur schreibe ich manchmal einfach so dahin und muss dann schnell nach dem Abschicken das Ganze noch etwas zurechtrücken - was aber innerhalb der Archive nicht geht. Merkwürdig genug, dass man in einem archivierten Thread überhaupt noch schreiben kann.

Fridolin
Aktuell Win11-64 pro 23H2, Ahnenblatt 3.60 - Daten via NAS, Programm lokal

Empfehlung: Alle relevanten Handbücher lesen :book:
(es gibt das Benutzerhandbuch und mehrere Themen-Specials!)
Seelentag
Beiträge: 5
Registriert: 23.01.2017, 23:04

Beitrag von Seelentag »

Hallo Frodolin,
FZiegler hat geschrieben:Ist das normal für ANSEL, dass das "ä" an der selben Stelle liegt wie bei ANSI bzw. Windows-1252/"Westlich" (was mir als Zeichensatz hier im Forum angezeigt wird)?
das kann ich Dir leider nicht sagen (habe keine passenden Tabellen bei der Hand) - aber ich gehe schon davon aus, dass ein Programmierer, der zum Zeitpunkt als ANSEL von Gedcom noch als Standard vorgeschrieben war, sein Programm in der ersten Version geschrieben hat, das richtg implementiert hat - sonst würde ich Probleme erwartet haben beim Import in andere Programme, die eben ANSEL erwartet haben.

Beste Grüsse - Wolf
Benutzeravatar
Marcus
Administrator
Beiträge: 7410
Registriert: 19.01.2006, 21:55
Danksagung erhalten: 1 Mal

Beitrag von Marcus »

Den Thread habe ich mal aus dem Archiv geholt. Abseits der "Fehlermeldungen" und der "Vorschläge & Wünsche" wird ohnehin selten etwas archiviert. Die Idee dahinter war einmal Dinge die wenig hilfreich waren oder nur eine alte Version betrafen zu 'archivieren', um ein übersichtlicheres Board zu erhalten. Da waren wir aber abseits der genannten Bereiche nie so recht dahinter her. ;)

Zum Zeitproblem: Bjew, das hattest nur du. :mrgreen: kein anderer kann das nachvollziehen, da die angezeigte Zeit jeweils nur dem Nutzer so angezeigt wird, wie er sie im Profil eingestellt hat. Wer also seine Zeitzone auf Australien gestellt hat, dem wird mein Beitrag nun als gegen Mittag erstellt angezeigt. ;)
Bei jedem Umstellen der Zeitzone ändern sich die (angezeigten) Zeiten der Beiträge.
Marcus
Benutzeravatar
Fridolin
Beiträge: 3796
Registriert: 04.01.2017, 18:32
Wohnort: Regio Rhein-Neckar
Hat sich bedankt: 37 Mal
Danksagung erhalten: 32 Mal

Beitrag von Fridolin »

Hallo Wolf,

du hast ja einen Weg gefunden. Aber dass in einem älteren Genealogie-Programm der Zeichensatz korrekt eingetragen ist - dafür würde ich nicht allzu viel verwetten. Angeblich sind die ersten deutschsprachigen Genealogie-Programme jedenfalls durch Auslesen von GEDCOM-Dateien entstanden und nicht durch Lesen des GEDCOM-Standards. Und wenn da keine Sonderzeichen drin waren, weil sie aus Amerika waren?

Ich würd's jedenfalls mal probieren, ob sich die exportierten Umlaute/Sonderzeichen auch dann noch daneben benehmen beim Import in Ahnenblatt, wenn man den Tipp hier ganz unten benutzt und mal einen der anderen Zeichensätze in die GEDCOM-Datei unter "1 CHAR" einträgt. Mein Favorit zum Ausprobieren wäre "Latin1".

Habe ich aus der Dokumentation eines anderen von mir nicht verwendeten Geneaologie-Programms (das Programm wird wohl auch schon nicht mehr weiterentwickelt): http://genj.sourceforge.net/wiki/de/man ... acter_sets :
Inzwischen ist Unicode der Industrie-Standard für konsistentes Kodieren, Darstellen und Verarbeiten von Text und in den meisten Textprogrammen etabliert. Also sollten wir unsere Dateien in diesem Format speichern.

Wenn wir eine Datei für ein anderes Programm speichern, sollten wir uns vergewissern, dass wir einen Zeichensatz wählen, den das andere Programm versteht.
Daher kann GenJ weiterhin speichern als: ANSEL, ANSI, ASCII, LATIN1, UTF-8, UNICODE. Das wählen wir im 'Speichern unter …' Dialog unter 'Kodierung'.

Beim Öffnen einer Datei versucht GenJ sogar Dateien zu interpretieren, die nicht GEDCOM-konform sind. Wird das Format IBMPC entdeckt, wird ISO-8859-1 (Latin1) angenommen.

Wenn Zeichen nicht richtig dargestellt werden, können wir mit einem normalen Texteditor den Wert des Kennzeichens CHAR im Dateikopf auf einen der obigen Werte verändern und es noch einmal versuchen, mit GenJ zu öffnen.
Oder - zweiter Vorschlag mit Angabe der Codepage:

Code: Alles auswählen

  1 CHAR ANSI
  2 VERS 1252
Inzwischen haben sich die deutschsprachigen Programmierer solcher Programme ja auf UTF-8 als Normalfall geeinigt: http://wiki-de.genealogy.net/GEDCOM/CHAR-Tag . Das ist aber nur theoretischer Hintergrund.

Das nur zum Ausprobieren, ob nicht doch dein Programm den Fehler macht.

EDIT: Falls aber dieser Gedankengang korrekt wäre:
Seelentag hat geschrieben: ich gehe schon davon aus, dass ein Programmierer, der zum Zeitpunkt als ANSEL von Gedcom noch als Standard vorgeschrieben war, sein Programm in der ersten Version geschrieben hat, das richtg implementiert hat - sonst würde ich Probleme erwartet haben beim Import in andere Programme, die eben ANSEL erwartet haben.
müsste eben Dirk B. das vielleicht einmal mit einer zurechtgestutzten Version deiner Datei nachstellen, um das Problem zu lösen.

Da die aktuellen Programmierer genealogischer Software und Online-Datenbanken sich sehr stark am vollständigen GEDCOM-Standard orientieren und auch die nächste Version von Ahnenblatt da weitere Fortschritte machen soll, kann ich mir sogar vorstellen, dass in der Zukunft die Probleme beim Austausch zwischen alten, nicht vollständig konformen und aktuellen Programmen eher zunehmen als abnehmen (was man ja sonst gern erwartet) - und nicht mehr so sehr Rücksicht genommen wird auf (ehemals) verbreitete Marotten. Siehe Internet Explorer und seine nicht konforme Interpretation von HTML-Tags in den 2000ern. Das aber ins Blaue hinein...
Aktuell Win11-64 pro 23H2, Ahnenblatt 3.60 - Daten via NAS, Programm lokal

Empfehlung: Alle relevanten Handbücher lesen :book:
(es gibt das Benutzerhandbuch und mehrere Themen-Specials!)
Benutzeravatar
Fridolin
Beiträge: 3796
Registriert: 04.01.2017, 18:32
Wohnort: Regio Rhein-Neckar
Hat sich bedankt: 37 Mal
Danksagung erhalten: 32 Mal

Beitrag von Fridolin »

So, jetzt hab ich nochmal nachgeschaut und den ANSEL-Standard kapiert (er ist innerhalb von GEDCOM anscheinend auch noch um ein paar Zeichen erweitert, u.a. um das 'ß', das es in ANSEL ursprünglich nicht gibt).

Dein
Pätzold
müsste in ANSEL geschrieben in unserem Forum eigentlich so aussehen:
Pèatzold
ANSEL hat nämlich die Besonderheit, dass alle Diakritika (also Umlautzeichen, Akzente,...) als non-spacing Zeichen gesondert vorliegen und dann dem entsprechenden Grundbuchstaben nur aufgesetzt oder untergelegt werden - im Text jeweils vor dem Grundbuchstaben gesetzt. Wenn du, Wolf, beim Einkopieren ins Forum nicht ungewollt eine Umwandlung des Zeichensatzes mitgemacht hast, würde ich meine Behauptung wiederholen, dass dein Programm kein ANSEL schreibt. Warum das bisher nicht aufgefallen ist? Weil das viele andere Programme in der Vergangenheit auch nicht getan haben.

Nur nur die Vermutung von einem, der früher beim Wechsel zwischen Atari-Computer und PC viel zu tun hatte mit dem Umwandeln von Zeichensätzen.
Aktuell Win11-64 pro 23H2, Ahnenblatt 3.60 - Daten via NAS, Programm lokal

Empfehlung: Alle relevanten Handbücher lesen :book:
(es gibt das Benutzerhandbuch und mehrere Themen-Specials!)
Gesperrt