UTF-8 Ausgabe

Carino

UTF-8 Ausgabe

Beitrag von Carino »

Hallo,

ich brauche eine Export Datei für PhpGedView die in UTF-8 kodiert ist. Die aus dem Ahnenblatt sind wohl ISO und hab schon versucht sie zu kodieren, aber geht irgendwie nicht. gibts ne einstellung die UTF-8 ged Dateien erzeugt? Danke für jeden Tip!

Carino
Benutzeravatar
Marcus
Administrator
Beiträge: 7410
Registriert: 19.01.2006, 21:55
Danksagung erhalten: 1 Mal

Beitrag von Marcus »

Ohne mich da wirklich auszukennen, sage ich mal dass das nicht geht. Sollte ich dummes Zeug reden, hat mich spätestens heute Abend jemand korrigiert ;)
Marcus

phpGedview arbeitet doch aber auch problemlos mit anderen Daten?
Carino

Beitrag von Carino »

Mit welchen Daten denn? Es geht ja um die Codierung. Ich kann da eine ged datei importieren, sonst habe nich nichts gefunden.

bei anderen problemen konnte ich mit Notepad ++ ansi format nach utf-8 formatieren nur hier gings irgendwie nicht. hab jetzt alles aus iso belassen....
Benutzeravatar
Hugo
Administrator
Beiträge: 6956
Registriert: 19.01.2006, 19:33
Wohnort: Hamburg

Beitrag von Hugo »

Guten Tag Carino
Mit Gedbas PhpGedView kenne ich mich nicht aus
Aber wieso versteht Gedbas PhpGedView kein ANSII-westlich
Der ist doch in allen UTF8 Codes gleich

Deshalb schieß ich mal ins blaue
Schau Dir mal mit einem Edtior die Gedcom-Datei von Ahnenblatt an
Im Kopf der Datei stehen folgende Zeilen
1 CHAR ANSI
2 VERS 1252

Diese müßtest Du auf den entsprechenden umcodieren
Allerdings kann ich Dir nicht sagen, welchen der 65.000 verschiedenen UTF8 Codes Du verwenden mußt
98.000 gibt es weltweit insgesamt, möglich sind allerdings auf dem PC mit Windows nur 65.000

Gruß Hugo
Zuletzt geändert von Hugo am 15.07.2007, 14:14, insgesamt 2-mal geändert.
Das Gestern ist Geschichte
Das Morgen ist ein Rätsel
Das Heute ist ein Geschenk
Carino

Beitrag von Carino »

hey das hab ich noch gar nicht gesehen vor lauter Maschinencode :)
Schau mir das später mal an und bedanke mich recht herzlich bei dir!
Carino
Benutzeravatar
Hugo
Administrator
Beiträge: 6956
Registriert: 19.01.2006, 19:33
Wohnort: Hamburg

Beitrag von Hugo »

Guten Tag Carino
Da ich, wie schon erwähnt, keine Ahnnung von Gedbas PhpGedView habe, hätte ich eine Bitte an Dich
Vielleicht bekommst Du ja raus, warum Gedbas nicht mit einer ANSII Gedcomdatei funktionieren will

Was machen denn sonst eigentlich Benutzer von Win98 :?:
Win98 und älter kann gar kein UTF-8

Gruß Hugo
Das Gestern ist Geschichte
Das Morgen ist ein Rätsel
Das Heute ist ein Geschenk
Benutzeravatar
bjew
Beiträge: 4136
Registriert: 19.01.2006, 19:31
Wohnort: südlicher geht's immer

Beitrag von bjew »

Hallo,

du kannst die Gedcom-Datei mit dem Editor öffnen und in verschiedenen Formaten wieder speichern: ANSI / Unicode / Unicode Big Endian / UTF-8

Evtl. dann noch das oben genannte Tag ändern
Bleibt gesund, Gruß
bjew (Bernhard) ------ derzeit fast nicht aktiv
System: Win10 auf Laptop mit i7 --- Ahnenblatt 2.74 (als Backup), 2.99[p] u. V3.56
Benutzeravatar
Marcus
Administrator
Beiträge: 7410
Registriert: 19.01.2006, 21:55
Danksagung erhalten: 1 Mal

Re: UTF-8 Ausgabe

Beitrag von Marcus »

Carino hat geschrieben:
ich brauche eine Export Datei für PhpGedView die in UTF-8 kodiert ist.
Mich würde ja noch interessieren warum die UTF-8 kodiert sein müssen? Ist das eine Vorgabe von phpGedview oder möchtest Du etwas bestimmtes damit machen?
Marcus
Benutzeravatar
Torquatus
Beiträge: 3698
Registriert: 19.01.2006, 22:19
Wohnort: Mannheim

Beitrag von Torquatus »

Hallo Marcus,
Mich würde ja noch interessieren warum die UTF-8 kodiert sein müssen?
ich vermute mal, dass nur dadurch gewährleistet ist, dass alle Schriftzeichen auch überall - und nicht nur im Ursprungsland - richtig dargestellt werden.

Hugo scheint zu UTF fit zu sein. Hallo Hugo, sag mal was dazu :wink:
Gruß, Torquatus

C.c. - Übrigens stelle ich den Antrag, dass Ahnenblatt das beste aller Ahnenprogramme werden muss - frei nach Cato
Benutzeravatar
Hugo
Administrator
Beiträge: 6956
Registriert: 19.01.2006, 19:33
Wohnort: Hamburg

Beitrag von Hugo »

Guten Tag
Torquatus hat geschrieben:Hallo Hugo, sag mal was dazu :wink:
Na, dann wollen wir mal ganz unten anfangen :wink:

Weltweit über alle landesspeziefischen Betriebssystemen mit ihren unterschiedlichen Zeichensätzen ist nur der ASCII-Code genormt
1 bis 0, Aa bis Zz, ! " # $ % & ' ( ) * + , - . / : ; < = > ? @ [ \ ] ^ _ ` { | } ~

Bei den erweiterten ANSI-Code (Zeichen über ALT Zahl) beginnen schon die ersten Unterschiede
z.B. Ää, Öö, Üü, ß sind landesspeziefisch
oder siehe Thema Hatcheks im westlichen ANSI und im mitteleuropäischen Zeichensatz

Darüber sind die Unicode-Zeichen untergebracht
Weltweit gibt es insgesamt ca. 98.000
Ein Windows PC kann aber nur 65.000 verwalten ( UTF-8 )
Somit gibt es Unterschiede zwischen den Zeichensätzen
Dieses Problem kennt ihr alle, wenn ihr mal in Google gesucht habt und nur noch merkwürdige Zeichen angezeigt bekamt

Außerdem läuft Unicode nicht auf allen Betriebssystemen
z.B. Win 98 kennt nur bis ANSI
ebenso ältere Mac Rechner

Wer es aber genau wissen will, brauch sich auf seinem Betriebssystem nur mal die kompletten Zeichensätze Arial, Times New Roman und Courier New etwas genauer anschauen und diese vergleichen
Wer damit fertig ist und immer noch nicht aufgibt sollte das gleiche mal mit einen amerikanischen Windows anschauen :D

Gruß Hugo
Das Gestern ist Geschichte
Das Morgen ist ein Rätsel
Das Heute ist ein Geschenk
Benutzeravatar
Hugo
Administrator
Beiträge: 6956
Registriert: 19.01.2006, 19:33
Wohnort: Hamburg

Beitrag von Hugo »

Guten Tag
Nachdem ich mich heute noch ein wenig mehr in Unicode und die davon abgespeckten Versionen reingelesen habe (nicht im Internet) nun die Fortsetzung
Ältere Betriebssysteme (Win98/NT und älter) wurden von mir dabei außer acht gelassen

Es gibt diverse UTF-Codes, die aber alle nur einen "abgespeckten" Unicode-Zeichensatz enthalten
Der auf einen Computer derzeit gebräuchlichste ist UTF-8
Er bietet schon eine ziemlich große Wahrscheinlichkeit, das alle Buchstaben und Zeichen richtig auf den PC-Systemen der Welt dargestellt werden

Wie aber schon erwähnt, er bietet nur eine Wahrscheinlichkeit
Deshalb wird auch aktiv an dem Nachfolger UTF-16 gearbeitet, welches demnächst zum Standart werden soll
Ob der sich allerdings in der Windows-Welt durchsetzt, ist hier die Frage

Es gibt aber kaum Ahnenprogramme, die UTF-8 unterstützen
Ahnenblatt ist leider nicht dabei :(
Deshalb bleibt leider das Problem für uns mit den osteuropäischen Sonderzeichen :(

Gruß Hugo
Das Gestern ist Geschichte
Das Morgen ist ein Rätsel
Das Heute ist ein Geschenk
Benutzeravatar
Marcus
Administrator
Beiträge: 7410
Registriert: 19.01.2006, 21:55
Danksagung erhalten: 1 Mal

Codierung für phpGedView

Beitrag von Marcus »

Torquatus hat geschrieben:
Mich würde ja noch interessieren warum die UTF-8 kodiert sein müssen?
ich vermute mal, dass nur dadurch gewährleistet ist, dass alle Schriftzeichen auch überall - und nicht nur im Ursprungsland - richtig dargestellt werden.
So habs jetzt einfach selbst probiert :) phpGedView scheint sich UTF-8 codierte Daten zu "wünschen", arbeitet aber auch völlig problemlos mit den gedcom-Dateien von Ahnenblatt zusammen (ANSI-codiert). Beim Import in phpGedview kann man diese automatisch nach UTF-8 konvertieren lassen :D Wenn man der Software dann noch erzählt, dass man nun auch UTF-8 Daten hat (das kann es sich nicht merken, dass es die gerade konvertiert hat :roll: ), dann werden die auch schön dargestellt :)
Marcus
Benutzeravatar
bmhm
Beiträge: 14
Registriert: 23.04.2006, 22:00

Beitrag von bmhm »

Hugo hat geschrieben:Es gibt aber kaum Ahnenprogramme, die UTF-8 unterstützen
Ahnenblatt ist leider nicht dabei :(
Deshalb bleibt leider das Problem für uns mit den osteuropäischen Sonderzeichen :(
Hallo Hugo!

In welcher Programmiersprache ist denn AB geschrieben? In C (mit Dialekten) usw sollte es eigentlich kein Problem sein, eine Option dafür einzubauen. Delphi hab ich lange nicht mehr benutzt, aber da gabs auch irgendwo komponenten für...

Wie dem auch sei, bislang bin ich erst bei ~1820 angelangt bei meinen Ahnen, als diese schon in Deutschland lebten. Wenn ich französische Zeichen brauche (wie in garçon) mecker ich schon ;)
Wer sich auf seinen Lohrbeeren ausruht, trägt sie an der falschen Stelle!
Benutzeravatar
Marcus
Administrator
Beiträge: 7410
Registriert: 19.01.2006, 21:55
Danksagung erhalten: 1 Mal

Beitrag von Marcus »

Ahnenblatt ist in C programmiert, aber das "kein Problem" ist halt doch eins ;) Wenn das hopplahopp mit einem Copy&Paste ginge, hätte Dirk das schon geändert. Von solchen Umstellungen ist dann oft doch mehr betroffen als man meint - nichtsdestotrotz wird es wohl irgendwann kommen. Die Französischen Sonderzeichen sind mit unserem Zeichensatz doch gut vereinbar?! Dafür müsste es nicht geändert werden. Die osteuropäischen und Skandinavischen Schreibweisen machen da schon mehr Probleme.
Marcus
Gesperrt