UTF-8 Ausgabe

Carino · Beitrag von **Carino** » 14.07.2007, 22:35

Hallo,

ich brauche eine Export Datei für PhpGedView die in UTF-8 kodiert ist. Die aus dem Ahnenblatt sind wohl ISO und hab schon versucht sie zu kodieren, aber geht irgendwie nicht. gibts ne einstellung die UTF-8 ged Dateien erzeugt? Danke für jeden Tip!

Carino

Marcus · Beitrag von **Marcus** » 15.07.2007, 01:44

Ohne mich da wirklich auszukennen, sage ich mal dass das nicht geht. Sollte ich dummes Zeug reden, hat mich spätestens heute Abend jemand korrigiert

Marcus

phpGedview arbeitet doch aber auch problemlos mit anderen Daten?

Carino · Beitrag von **Carino** » 15.07.2007, 01:55

Mit welchen Daten denn? Es geht ja um die Codierung. Ich kann da eine ged datei importieren, sonst habe nich nichts gefunden.

bei anderen problemen konnte ich mit Notepad ++ ansi format nach utf-8 formatieren nur hier gings irgendwie nicht. hab jetzt alles aus iso belassen....

Hugo · Beitrag von **Hugo** » 15.07.2007, 11:32

Guten Tag Carino
Mit ~~Gedbas~~ PhpGedView kenne ich mich nicht aus
Aber wieso versteht ~~Gedbas~~ PhpGedView kein ANSII-westlich
Der ist doch in allen UTF8 Codes gleich

Deshalb schieß ich mal ins blaue
Schau Dir mal mit einem Edtior die Gedcom-Datei von Ahnenblatt an
Im Kopf der Datei stehen folgende Zeilen
1 CHAR ANSI
2 VERS 1252

Diese müßtest Du auf den entsprechenden umcodieren
Allerdings kann ich Dir nicht sagen, welchen der 65.000 verschiedenen UTF8 Codes Du verwenden mußt
98.000 gibt es weltweit insgesamt, möglich sind allerdings auf dem PC mit Windows nur 65.000

Gruß Hugo

Carino · Beitrag von **Carino** » 15.07.2007, 11:38

hey das hab ich noch gar nicht gesehen vor lauter Maschinencode

Schau mir das später mal an und bedanke mich recht herzlich bei dir!
Carino

Hugo · Beitrag von **Hugo** » 15.07.2007, 12:04

Guten Tag Carino
Da ich, wie schon erwähnt, keine Ahnnung von ~~Gedbas~~ PhpGedView habe, hätte ich eine Bitte an Dich
Vielleicht bekommst Du ja raus, warum Gedbas nicht mit einer ANSII Gedcomdatei funktionieren will

Was machen denn sonst eigentlich Benutzer von Win98

Win98 und älter kann gar kein UTF-8

Gruß Hugo

bjew · Beitrag von **bjew** » 16.07.2007, 09:40

Hallo,

du kannst die Gedcom-Datei mit dem Editor öffnen und in verschiedenen Formaten wieder speichern: ANSI / Unicode / Unicode Big Endian / UTF-8

Evtl. dann noch das oben genannte Tag ändern

Marcus · Beitrag von **Marcus** » 16.07.2007, 16:39

Carino hat geschrieben:
ich brauche eine Export Datei für PhpGedView die in UTF-8 kodiert ist.

Mich würde ja noch interessieren warum die UTF-8 kodiert sein müssen? Ist das eine Vorgabe von phpGedview oder möchtest Du etwas bestimmtes damit machen?
Marcus

Torquatus · Beitrag von **Torquatus** » 16.07.2007, 21:05

Hallo Marcus,

Mich würde ja noch interessieren warum die UTF-8 kodiert sein müssen?

ich vermute mal, dass nur dadurch gewährleistet ist, dass alle Schriftzeichen auch überall - und nicht nur im Ursprungsland - richtig dargestellt werden.

Hugo scheint zu UTF fit zu sein. Hallo Hugo, sag mal was dazu

Hugo · Beitrag von **Hugo** » 16.07.2007, 21:51

Guten Tag

Torquatus hat geschrieben:Hallo Hugo, sag mal was dazu

Na, dann wollen wir mal ganz unten anfangen

Weltweit über alle landesspeziefischen Betriebssystemen mit ihren unterschiedlichen Zeichensätzen ist nur der ASCII-Code genormt
1 bis 0, Aa bis Zz, ! " # $ % & ' ( ) * + , - . / : ; < = > ? @ [ \ ] ^ _ ` { | } ~

Bei den erweiterten ANSI-Code (Zeichen über ALT Zahl) beginnen schon die ersten Unterschiede
z.B. Ää, Öö, Üü, ß sind landesspeziefisch
oder siehe Thema Hatcheks im westlichen ANSI und im mitteleuropäischen Zeichensatz

Darüber sind die Unicode-Zeichen untergebracht
Weltweit gibt es insgesamt ca. 98.000
Ein Windows PC kann aber nur 65.000 verwalten ( UTF-8 )
Somit gibt es Unterschiede zwischen den Zeichensätzen
Dieses Problem kennt ihr alle, wenn ihr mal in Google gesucht habt und nur noch merkwürdige Zeichen angezeigt bekamt

Außerdem läuft Unicode nicht auf allen Betriebssystemen
z.B. Win 98 kennt nur bis ANSI
ebenso ältere Mac Rechner

Wer es aber genau wissen will, brauch sich auf seinem Betriebssystem nur mal die kompletten Zeichensätze Arial, Times New Roman und Courier New etwas genauer anschauen und diese vergleichen
Wer damit fertig ist und immer noch nicht aufgibt sollte das gleiche mal mit einen amerikanischen Windows anschauen

Gruß Hugo

Hugo · Beitrag von **Hugo** » 17.07.2007, 16:14

Guten Tag
Nachdem ich mich heute noch ein wenig mehr in Unicode und die davon abgespeckten Versionen reingelesen habe (nicht im Internet) nun die Fortsetzung
Ältere Betriebssysteme (Win98/NT und älter) wurden von mir dabei außer acht gelassen

Es gibt diverse UTF-Codes, die aber alle nur einen "abgespeckten" Unicode-Zeichensatz enthalten
Der auf einen Computer derzeit gebräuchlichste ist UTF-8
Er bietet schon eine ziemlich große Wahrscheinlichkeit, das alle Buchstaben und Zeichen richtig auf den PC-Systemen der Welt dargestellt werden

Wie aber schon erwähnt, er bietet nur eine Wahrscheinlichkeit
Deshalb wird auch aktiv an dem Nachfolger UTF-16 gearbeitet, welches demnächst zum Standart werden soll
Ob der sich allerdings in der Windows-Welt durchsetzt, ist hier die Frage

Es gibt aber kaum Ahnenprogramme, die UTF-8 unterstützen
Ahnenblatt ist leider nicht dabei

Deshalb bleibt leider das Problem für uns mit den osteuropäischen Sonderzeichen

Gruß Hugo

Marcus · Beitrag von **Marcus** » 01.08.2007, 22:46

Torquatus hat geschrieben:
Mich würde ja noch interessieren warum die UTF-8 kodiert sein müssen?
ich vermute mal, dass nur dadurch gewährleistet ist, dass alle Schriftzeichen auch überall - und nicht nur im Ursprungsland - richtig dargestellt werden.

So habs jetzt einfach selbst probiert

phpGedView scheint sich UTF-8 codierte Daten zu "wünschen", arbeitet aber auch völlig problemlos mit den gedcom-Dateien von Ahnenblatt zusammen (ANSI-codiert). Beim Import in phpGedview kann man diese automatisch nach UTF-8 konvertieren lassen

Wenn man der Software dann noch erzählt, dass man nun auch UTF-8 Daten hat (das kann es sich nicht merken, dass es die gerade konvertiert hat

), dann werden die auch schön dargestellt

Marcus

bmhm · Beitrag von **bmhm** » 05.10.2007, 20:43

Hugo hat geschrieben:Es gibt aber kaum Ahnenprogramme, die UTF-8 unterstützen
Ahnenblatt ist leider nicht dabei
Deshalb bleibt leider das Problem für uns mit den osteuropäischen Sonderzeichen

Hallo Hugo!

In welcher Programmiersprache ist denn AB geschrieben? In C (mit Dialekten) usw sollte es eigentlich kein Problem sein, eine Option dafür einzubauen. Delphi hab ich lange nicht mehr benutzt, aber da gabs auch irgendwo komponenten für...

Wie dem auch sei, bislang bin ich erst bei ~1820 angelangt bei meinen Ahnen, als diese schon in Deutschland lebten. Wenn ich französische Zeichen brauche (wie in garçon) mecker ich schon

Marcus · Beitrag von **Marcus** » 06.10.2007, 15:18

Ahnenblatt ist in C programmiert, aber das "kein Problem" ist halt doch eins

Wenn das hopplahopp mit einem Copy&Paste ginge, hätte Dirk das schon geändert. Von solchen Umstellungen ist dann oft doch mehr betroffen als man meint - nichtsdestotrotz wird es wohl irgendwann kommen. Die Französischen Sonderzeichen sind mit unserem Zeichensatz doch gut vereinbar?! Dafür müsste es nicht geändert werden. Die osteuropäischen und Skandinavischen Schreibweisen machen da schon mehr Probleme.
Marcus

Ahnenblattportal

UTF-8 Ausgabe

UTF-8 Ausgabe

Re: UTF-8 Ausgabe

Codierung für phpGedView