HTML-Entities in Notizen

sollte sich Ahnenblatt nicht wie erwartet verhalten, dann hier melden
Antworten
Benutzeravatar
perndohler
Beiträge: 3
Registriert: 27.02.2024, 14:45
Wohnort: Ostheide

HTML-Entities in Notizen

Beitrag von perndohler »

Es ist schön, dass man die HTML-Codes < p > usw. »korrigieren« kann.

(1) Leider bereinigt das nicht die HTML-Entities wie & aring ; oder & szlig ; Damit sind alle schönen neuen Ausgabemöglichkeiten für meine Datei wertlos.

(2) Man sollte einstellen können, dass die < >-Codes bei Anzeige und Ausgabe ignoriert werden (aber in der GEDCOM erhalten bleiben) und die Entities als deren Auflösung angezeigt werden (aber auch in der GEDCOM erhalten bleiben), und festlegen können, dass das automatisch beim Einlesen aktiviert wird.

Per

BEISPIEL: Carl war Landwirt und besa&szlig; bis 1862 das Rittergut G&ouml;rnitz bei Leipzig, &uuml;bernahm dann das Familiengut der Kesslers, Kleinwirschleben bei Bernburg, und wohnte dann in Bernburg. 1877 zog er nach Leipzig auf das Besitztum seiner Frau, die »Kleine Funkenburg«, einen H&auml;userkomplex, den er verwaltete. Er war ein Freund von gutem Leben und nahm das Sch&ouml;ne und Gute, was ihm geboten wurde, und genoss es in einer gl&uuml;cklichen harmonischen Ehe.
/Per
Benutzeravatar
Fridolin
Beiträge: 3815
Registriert: 04.01.2017, 18:32
Wohnort: Regio Rhein-Neckar
Hat sich bedankt: 37 Mal
Danksagung erhalten: 34 Mal

Re: HTML-Entities in Notizen

Beitrag von Fridolin »

Ich nehme mal an, @DirkB versteht, was du meinst. Mir ist das allerdings nicht so klar: Ich weiß nicht, wie AB sich aktuell verhält und was du stattdessen gern hättest.

Warum HTML-Code in einem Nurtext-Feld einerseits erhalten, andererseits als HTML interpretieren?
Aktuell Win11-64 pro 23H2, Ahnenblatt 3.60 - Daten via NAS, Programm lokal

Empfehlung: Alle relevanten Handbücher lesen :book:
(es gibt das Benutzerhandbuch und mehrere Themen-Specials!)
Martin-D
Beiträge: 169
Registriert: 17.04.2023, 14:49
Hat sich bedankt: 10 Mal
Danksagung erhalten: 31 Mal

Re: HTML-Entities in Notizen

Beitrag von Martin-D »

Hallo Fridolin,

das bezieht sich auf die neue Funktion:
"* NEU: Bearbeiten/Daten korrigieren (= angleichen): HTML-Code aus Notizen entfernen"

Ich verstehe Per so, dass er 1. bemängelt, dass innerhalb Ahnenblatt nicht aller HTML Code entfernt wird und 2. dem Motto folgend, dass Ahnenblatt beim Einlesen nichts wirklich löscht, die HTML-Codes beim Gedcom schreiben wieder drin stehen bleiben sollten.

Gruß
Martin
Ahnenblatt 3.60 und Gramps über NAS DS218+
"Neue Ideen triumphieren nicht, ihre Gegner sterben aus." Max Planck
Benutzeravatar
DirkB
Administrator
Beiträge: 1588
Registriert: 20.01.2006, 20:25
Wohnort: Hamburg
Hat sich bedankt: 14 Mal
Danksagung erhalten: 121 Mal

Re: HTML-Entities in Notizen

Beitrag von DirkB »

Bei der genannten Funktion ging es mir darum vornehmlich Formatierungshinweise (fett, kursiv, unterstrichen, ...), die manche Genealogie-Programme verwenden und in Form von HTML-Kennzeichen einfügen, dann über GEDCOM in Ahnenblatt importiert werden, wieder zu entfernen. Der GEDCOM-Standard sieht solche Formatierungen grundsätzlich nicht vor.

In Ausgaben - gerade in Büchern, wo nahezu alles ausgegeben wird - ist das störend.

Ich habe dabei nicht den Anspruch gehabt, alle nur denkbaren HTML-Zeichen zu entfernen - sondern vorrangig nur die von anderen Programmen eingefügten HTML-Formatierungen.

:?: Daher Fragen an perndohler:
  • Durch welche Software sind diese Sonderzeichen eingefügt worden?
  • Waren die Sonderzeichen bei Ausgaben bislang kein Problem?
- Dirk
Entwickler von Ahnenblatt
Benutzeravatar
perndohler
Beiträge: 3
Registriert: 27.02.2024, 14:45
Wohnort: Ostheide

Re: HTML-Entities in Notizen

Beitrag von perndohler »

Die Tags < > werden korrekt entfernt.
Die Entities – das sind Zeichenfolgen, die in HTML die Zeichen außerhalb des begrenzten ASCII-Zeichenvorrats ersetzen können, beispielsweise in Müller -> M&uuml;ler – bleiben stehen. Wie mein Beispiel zeigte, werden die Notizenausgaben dadurch unbrauchbar.

(1) Mindestens könnte man die (Named) Entities in Unicode-Zeichen umwandeln. Das ist anspruchsvoll, weil es sehr viele gibt, aber unerlässlich, beispielsweise bei sehr vielen osteuropäischen Namen und Orten wie in meinem Fall.
(2) Als »Kür« könnten alle Umwandlungen reversibel sein, d.h. sie würden von Ahnenblatt in Dialogen und Auswertungen, Büchern usw. umgewandelt angezeigt, aber (ggf. als generelle Option?) intern in Ruhe gelassen, damit die GEDCOM-Dateien wieder zurückgespielt werden können nach da, wo sie herkommen.
(3) »Produziert« wurde das HTML von MyHeritage. Dessen lokales Programm Family Tree Builder und auch dessen optional integriertes Druckprogramm The Complete Genealogy Reporter können problemlos damit umgehen (sie filtern alles weg und drucken nur Text). Es ist mir m.W. bei MyHeritage nicht möglich, Kommentare online einzugeben, die nicht mit HTML abgelegt werden, obwohl ich explizit nur reinen Text in die Felder kopiere. In den Notizen stehen bei mir manchmal ganze Lebensgeschichten, die sind mir also wichtig.
(4) Das Problem gab es auch vorher schon bei Ahnenblatt 3, da habe ich es ignoriert und die Auswertungen nicht genutzt, aber ich habe das Upgrade auf 4 gekauft, genau WEIL die neuen Ausgabeoptionen so intensiv beworben/beschrieben wurden,
(5) Auf die Online-Programme einfach zu verzichten, ist aus vielen Gründen keine Option.

Danke für die schnelle Antwort
/Per
/Per
Benutzeravatar
DirkB
Administrator
Beiträge: 1588
Registriert: 20.01.2006, 20:25
Wohnort: Hamburg
Hat sich bedankt: 14 Mal
Danksagung erhalten: 121 Mal

Re: HTML-Entities in Notizen

Beitrag von DirkB »

Hallo Per,

gerade ausprobiert ...
MyHeritage speichert Eingaben in Notizen wohl komplett im HTML-Code und speichert diese dann auch so in GEDCOM-Dateien.
So extrem habe ich das noch nicht erlebt - und ist auch in keinster Weise durch den GEDCOM-Standard abgedeckt. Damit wird (fast) jede weiterverarbeitende Software (von anderen Herstellern) Probleme bekommen.

Eine komplette Umsetzung aller nur denkbaren HTML-Steuerzeichen war nicht vorgesehen. Von daher habe ich erst einmal keine kurzfristige Lösung ...

Vielleicht mal den MyHeritage-Support fragen, wie man diese HTML-Steuerzeichen in GEDCOM-Exports vermeiden kann bzw. welche Empfehlung sie haben, wie man das korrigieren kann.

- Dirk
Entwickler von Ahnenblatt
Benutzeravatar
perndohler
Beiträge: 3
Registriert: 27.02.2024, 14:45
Wohnort: Ostheide

Re: HTML-Entities in Notizen

Beitrag von perndohler »

Nur werden die GANZ BESTIMMT nicht so ein offenes Ohr haben wie du. Die Großen hören nicht auf die Kleinen. Tja, das war es dann wohl leider mit dem schönen neuen Ahnenblatt 4. Sicher gibt es für die Konversion irgendwo eine einbindbare Prozedur, die das macht, oder man gibt in eine HTML-Engine aus, aber ich sehe natürlich ein, dass das bei dem Verkaufspreis und bei dem umfangreichen Entwicklerteam ;-) eher nicht realistisch ist. Dass ich aber meine in Jahren eingeübten Verfahrensweisen und einen Baum mit einer fünfstelligen Anzahl Personen komplett umziehe, dafür bin ich wiederum leider zuwenige :-(
/Per
/Per
Benutzeravatar
Fridolin
Beiträge: 3815
Registriert: 04.01.2017, 18:32
Wohnort: Regio Rhein-Neckar
Hat sich bedankt: 37 Mal
Danksagung erhalten: 34 Mal

Re: HTML-Entities in Notizen

Beitrag von Fridolin »

Na ja: Wozu gibt es Standards? Groß oder klein - ein Fortschritt ist das nicht, wenn die Kommentare nicht vernünftig in andere Programme übernommen werden können.

Ich nenne sowas eine Knebel-Applikation: Ein vermeintliches Programm-Feature, das dich auf ewig an den einen Anbieter bindet. Ich habe vor zwanzig Jahren mein Lehrgeld in dieser Hinsicht bezahlt...
Aktuell Win11-64 pro 23H2, Ahnenblatt 3.60 - Daten via NAS, Programm lokal

Empfehlung: Alle relevanten Handbücher lesen :book:
(es gibt das Benutzerhandbuch und mehrere Themen-Specials!)
Benutzeravatar
Fridolin
Beiträge: 3815
Registriert: 04.01.2017, 18:32
Wohnort: Regio Rhein-Neckar
Hat sich bedankt: 37 Mal
Danksagung erhalten: 34 Mal

Re: HTML-Entities in Notizen

Beitrag von Fridolin »

In deinem Probetext oben gibt es übrigens nur Entity Names, keine Entity Numbers. Das wäre dann eine Liste von ungefähr 200 Begriffen, die umgewandelt werden müssen - alle mit Und-Zeichen beginnend und Semikolon endend. Klingt für mich eigentlich so, als ob das mit einer Tabelle (wäre ich bereit zu liefern) und begrenztem Programmieraufwand implementierbar wäre, dass man das auf Knopfdruck (für ein bestimmtes Feld oder für die ganze Familiendatei) umwandelt.

Ich vermute mal, dass die PlugIn-Schnittstelle nicht dazu geeignet wäre, ein entsprechendes Tool zu programmieren - aber so sicher bin ich mir da nicht: @DirkB - taugt die PlugIn-Schnittstelle dazu, Daten nicht nur zu manipulieren, sondern anschließend auch wieder verlustfrei ins Programm einzulesen? Mein letzter Wissensstand war 'nein'.
Aktuell Win11-64 pro 23H2, Ahnenblatt 3.60 - Daten via NAS, Programm lokal

Empfehlung: Alle relevanten Handbücher lesen :book:
(es gibt das Benutzerhandbuch und mehrere Themen-Specials!)
Benutzeravatar
DirkB
Administrator
Beiträge: 1588
Registriert: 20.01.2006, 20:25
Wohnort: Hamburg
Hat sich bedankt: 14 Mal
Danksagung erhalten: 121 Mal

Re: HTML-Entities in Notizen

Beitrag von DirkB »

Fridolin hat geschrieben: 03.03.2024, 16:58 ... taugt die PlugIn-Schnittstelle dazu, Daten nicht nur zu manipulieren, sondern anschließend auch wieder verlustfrei ins Programm einzulesen? Mein letzter Wissensstand war 'nein'.
Die Plugins lesen eine von Ahnenblatt erzeugte Datei (csv oder GEDCOM) und können mit diesen Daten dann beliebiges machen - z.B. Ausgabe wiederum als csv oder GEDCOM, die man dann mit Ahnenblatt öffnen kann.
Direkten Zugriff auf die im Speicher eingelesenen Daten zur Manipulation hat man mit einem Plugin nicht.

Programmtechnisch ist das mit einer Tabelle aller denkbaren HTML-Entities möglich. Das ist sicherlich mal machbar.
Man muss aber auch dazu sagen, dass Ahnenblatt seit 2001 verfügbar ist und mir noch keine solche intensive Nutzung von HTML in Notizfelder gemeldet wurde. Da lasse ich nicht sofort alles stehen und liegen und stürze mich gleich auf dieses Thema. :wink:

Bis dahin Notizen und Quellen in Büchern deaktivieren ...

- Dirk
Entwickler von Ahnenblatt
Antworten