Ahnenblattportal Forum Index
 •Portal  •Imprint  •Forum  •Search  •Profile  •Log in to check your private messages  •Log in   •Register  

 Uploads to download

Post new topicReply to topic
Author Message
SirJohn






Joined: 02 Apr 2013
Posts: 24
Topics: 1


blank.gif

PostPosted: 02.04.2013, 16:34    Uploads to download  Reply with quoteBack to top

Moin zusammen,

an wen wende ich mich bzw. wie stelle ich es an, wenn ich einen Download zur Verfügung stellen möchte (kein Plugin)?

Liebe Grüße,

John

OfflineView user's profileSend private message    
Guest












PostPosted: 02.04.2013, 18:09    Re: Uploads to download  Reply with quoteBack to top

Hallo John,
« SirJohn » wrote:
Moin zusammen,

an wen wende ich mich bzw. wie stelle ich es an, wenn ich einen Download zur Verfügung stellen möchte (kein Plugin)?

Liebe Grüße,

John

füge die entsprechende Datei einfach als Attachment zur Deinem Forumsbeitrag hinzu.

Online    
Marcus
Administrator



Gender:
Age: 45
Joined: 19 Jan 2006
Posts: 7440
Topics: 227


belize.gif

PostPosted: 02.04.2013, 20:09    (No subject)  Reply with quoteBack to top

Das kommt drauf an, was Du zur Verfügung stellen möchtest. Generell geht es so wie vom Gast beschrieben, was z.B. sinnvoll bei Bildern, Hintergründen, Rahmen etc. sein kann.
Im Downloadbereich gibt verschiedene Sektionen in die man Dateien hochladen und beschreiben kann. Dort kommen die meisten Zusätze zu Ahnenblatt hin, wenn sie dann "fertig" sind - oft haben die Nutzer hier nach der Vorstellung noch Änderungswünsche, die die Autoren/Ersteller gerne umsetzten.
Dort müssen die Uploads allerdings noch von einem Moderator geprüft & freigeschaltet werden. Zur "Vorstellung" eignet sich also meist das Forum besser.
Marcus

_________________
Fragen und Antworten rund um Ahnenblatt (Knowledge Base)

OfflineView user's profilePersonal Gallery (1)Send private messageSend e-mail    
SirJohn






Joined: 02 Apr 2013
Posts: 24
Topics: 1


blank.gif

PostPosted: 03.04.2013, 08:43    (No subject)  Reply with quoteBack to top

Hallo :-)

Herzlichen Dank für die prompte Antwort. Das Ganze hat nur sekundär was mit Ahnenblatt zu tun, gehört also entweder in "Allgemeines" oder "Hilfsmittel" wenn es so etwas geben sollte.

Ich habe aus einer Kombination von tesseract, gimagereader und entsprechenden Traingingsdateien einen prima funktionierenden freeware-OCR Reader zusammengebastelt der Deutschfraktur ziemlich gut erkennen kann. Ich dachte, das könnten hier einige vielleicht brauchen, und ich kann so mein kleines "Dankeschön" an Autor und Community hinterlassen.
Anbei eine unbearbeitete / unkorrigierte Arbeitsprobe Der Kombi nach dem ersten Einlesen. Wie ersichtlich gibts es ein paar Fehler die manuell nachgearbeitet werden müssten, aber grundsätzlich ist das Ergebnis wohl ganz annehmbar... (vor allem wenn die einzige Alternative auch nicht besser arbeitet und ~2.000-8.000€ kostet *gg*)

Der pixel Hinweis beim "Filename" hat mich glauben lassen, hier wären nur Bilder erlaubt, aber ich habe grad gesehen, dass ich das Paket problemlos einstellen können sollte (hat ca. 30MB). Selbiges folgt dann baldmöglichst...

Liebe Grüße,

John



gimagereader.png
 Description:

Download
 Filename:  gimagereader.png
 Filesize:  160.51 KB
 Downloaded:  312 Time(s)


OfflineView user's profileSend private message    
Marcus
Administrator



Gender:
Age: 45
Joined: 19 Jan 2006
Posts: 7440
Topics: 227


belize.gif

PostPosted: 03.04.2013, 14:16    (No subject)  Reply with quoteBack to top

Evtl. reicht es ja, wenn Du die Links zu den Softwarepaketen und die Trainingsdateien bereitstellst? Dazu dann eine Beschreibung wie was zu verknüpfen ist.
Dann hätte man bei Softwareaktualisierungen hier trotzdem immer das aktuelle "Paket" und auch unter anderen Systemen könnte man dann die Software leicht nutzen. Nebenbei spart man sich noch die Apache- und die GNU-Lizenz.
Oder hast Du gar alles in ein Installationsskript verpackt? Dann wäre der Komfortgewinn natürlich ein anderer.
Marcus

PS Dein Uploadlimit habe ich mal auf 50 MB hochgesetzt.

_________________
Fragen und Antworten rund um Ahnenblatt (Knowledge Base)

OfflineView user's profilePersonal Gallery (1)Send private messageSend e-mail    
SirJohn






Joined: 02 Apr 2013
Posts: 24
Topics: 1


blank.gif

PostPosted: 03.04.2013, 16:28    (No subject)  Reply with quoteBack to top

Hi Marcus,

herzlichen Dank für die Anpassung.

So etwas ähnliches wie ein Installskript, schon, ja.

Ich hab ein wenig herumgefrickelt, und unter anderem eben die Fraktur-Schriftarten und ein deutsches Wörterbuch eingebunden. Zudem habe ich ein Batchscript drum herumgestellt, dass aus dem kompletten Paket ein portables Programm macht.

Ich habe eine kleine readme dazugepackt, die die Anpassungen auflistet:
Quote:

Was wurde für die portable Version (ab-)geändert?

Es wurden folgende Dateien hinzugefügt:

$GIMAGEREADER_DIR\Readme_Portable_Version.txt
-> Diese Datei

$GIMAGEREADER_DIR\tesseract
-> beinhaltet die portable Version von Tesseract-OCR

$GIMAGEREADER_DIR\tesseract\tessadata
-> beinhaltet eine neuere Version von deu.traineddata
-> beinhaltet die originale Version von deu-frak.traineddata
-> beinhaltet eine User-Version von Deutsch Fraktur namens deu-f.traineddata.
Hiermit werden je nach verwendeter Schriftart bessere Ergebnisse erzielt.

$GIMAGEREADER_DIR\bin\paths.cfg
-> Pfade zu tesseract und tessdata wurden relativ angegeben um Laufwerksunabhängig zu arbeiten
-> tesseract-ocr muss als Unterverzeichnis im Verzeichnis $GIMAGEREADER_DIR liegen
-> Deutsch Fraktur wurde als bevorzugte Sprache eingerichtet (normaler default = de_DE)

$GIMAGEREADER_DIR\bin\gimagereader.cmd
-> Kopiert $GIMAGEREADER_DIR\bin\paths.cfg nach %APPDATA%\gimagereader
-> Führt gimagereader aus und wartet auf Beendigung
-> Löscht Verzeichnis %APPDATA%\gimagereader wieder
-> Löscht Datei recently-used.xbel aus %TEMP%\..\Application Data bzw. %LOCALAPPDATA%

$GIMAGEREADER_DIR\gimagereader.lnk
-> Startet die bin\gimagereader.cmd minimiert

$GIMAGEREADER_DIR\share\myspell\dicts
-> enthält nun das deutsche Wörterbuch (Quelle: openoffice.org)


Das Batchscript arbeitet wie folgt:

@md "%appdata%\gimagereader"
@copy paths.cfg "%appdata%\gimagereader\paths.cfg"
@start /WAIT gimagereader.exe
del "%TEMP%\..\Application Data\recently-used.xbel" /F
del "%TEMP%\..\Anwendungsdaten\recently-used.xbel" /F
del "%LOCALAPPDATA%\recently-used.xbel" /F
del "%TEMP%\..\Application Data\gtk-2.0\gtkfilechooser.ini" /F
del "%TEMP%\..\Anwendungsdaten\gtk-2.0\gtkfilechooser.ini" /F
del "%LOCALAPPDATA%\gtk-2.0\gtkfilechooser.ini" /F
del "%appdata%\gimagereader\paths.cfg" /F
rd "%appdata%\gimagereader" /s /q
reg delete HKEY_CURRENT_USER\Software\Microsoft\Windows\ShellNoRoam\MUICache /v "%CD%\gimagereader.cmd" /f
reg delete HKEY_CURRENT_USER\Software\Microsoft\Windows\ShellNoRoam\MUICache /v "%CD%\gimagereader.exe" /f


Hinzu kommt, dass die beiden Hauptkomponenten eher langsam weiter entwickelt werden: Letztes Update von tesseract ist von 10.2012, das vorletzte von 10.2011 - gImagereader ist sogar seit 08.2011 unverändert, so dass eine häufiger Pflegebedarf wohl nicht droht.

Aber wenns Euch lieber ist, kann ich gern versuchen, eine Anleitung zu schreiben, was wie wo ineinander geschachtelt werden sollte. Lass mir dafür nur bitte etwas Zeit.

Euer Board, eure Entscheidung - ich kanns auch gern bei mir auf den Server legen, wenn Ihr keinen zusätzlichen Balast wollt...

---

Ich habe jetzt nochmal alle Versionen auf Vordermann gebracht und alle Dateien in ihren neuesten Versionen eingepflegt und getestet. Tutti-Kompletti sinds somit ~36MB. Läuft mindestens auf Win XP SP3 und Windows 7 SP1 aber vermutlich auch auf allen anderen halbwegs aktuellen Windows Systemen.

Ich häng das Monster jetzt erstmal an - schauts Euch an, lasst mich wissen, ob es tut was es soll, und wo Ihr stolpert. Wünsche und Vorschläge gerne an mich :-)

Known Issues:
Beide deutschen Frakturschriftarten heißen gleich. Aber die Reihenfolge bleibt unverändert - ihr müsst es Euch also mit "die Obere" und "die Untere" merken. Alle Versuche eine der beiden SChriften umzubenennen brachten mehr Probleme als Lösungen, sorry. Für die Interessierten: die Obere ist die Custom/User Version, die Untere die offizielle/originale Trainingsdatei.
-----

Liebe Grüße,

John


DATEIEN AUS DEM NETZ BITTE IMMER AUF VIREN SCANNEN!



gimagereader302091.zip
 Description:
Tesseract OCR Fraktur Portable 302091

Download
 Filename:  gimagereader302091.zip
 Filesize:  36.11 MB
 Downloaded:  280 Time(s)


OfflineView user's profileSend private message    
Marcus
Administrator



Gender:
Age: 45
Joined: 19 Jan 2006
Posts: 7440
Topics: 227


belize.gif

PostPosted: 03.04.2013, 17:02    (No subject)  Reply with quoteBack to top

Mit Skript ist es als Paket wohl sinnvoller. Dachte auch das der GimageReager als Beta-Version dann doch öfter Updates erfährt. wink
Die Schriftarten und das Wörterbuch sind auch Open-Source-Software bzw. dürfen von Dir bzw. uns hier weitervertrieben werden?

Dann lassen wir das hier mal so stehen und ein paar Leute testen und nutzen. Später werden wir es dann sinnvollerweise wohl im Downloadbereich, mit Hinweise auf diesen Thread, unterbringen.
Vielen Dank!
Marcus

_________________
Fragen und Antworten rund um Ahnenblatt (Knowledge Base)

OfflineView user's profilePersonal Gallery (1)Send private messageSend e-mail    
SirJohn






Joined: 02 Apr 2013
Posts: 24
Topics: 1


blank.gif

PostPosted: 03.04.2013, 17:07    (No subject)  Reply with quoteBack to top

Lizenzfrei verfügbar ist das alles und die Nutzung und konstenlose Weiterverbreitung ist natürlich erlaubt , ja: ob das OpenOffice Wörterbuch tatsächlich auch Open-Source ist oder GNU/GPL und closed-source, weiß ich aus dem Stehgreif im Moment aber nicht.

Die verwendendeten Quellen der einzelnen Module habe ich aber auch im readme hinterlegt:

Tesseract 3.02 -> http://code.google.com/p/tesseract-ocr/
gImageReader 0.9.1 -> http://sourceforge.net/projects/gimagereader/
Custom Fraktur -> https://github.com/paalberti/tesseract-dan-fraktur/tree/master/deu-frak
Wörterbuch Deutsch -> http://extensions.services.openoffice.org/project/dict-de_DE_frami

John

Edit:
grad nochmal geschaut: auch das Wörterbuch ist open-source. :-)

OfflineView user's profileSend private message    
Marcus
Administrator



Gender:
Age: 45
Joined: 19 Jan 2006
Posts: 7440
Topics: 227


belize.gif

PostPosted: 03.04.2013, 17:38    (No subject)  Reply with quoteBack to top

Fein Smile wenn jemand Schriften hier hochlädt läuft es mir erst einmal eiskalt den Rücken runter ... wink aber hier passt ja dann alles.
Marcus

_________________
Fragen und Antworten rund um Ahnenblatt (Knowledge Base)

OfflineView user's profilePersonal Gallery (1)Send private messageSend e-mail    
Torquatus




Gender:
Age: 74
Joined: 19 Jan 2006
Posts: 3801
Topics: 232
Location: Mannheim


germany.gif

PostPosted: 05.04.2013, 11:31    (No subject)  Reply with quoteBack to top

Ich habe das mal getestet.

Warum schaffe ich es nicht, normale Bilddateien zu bearbeiten?

Und warum lassen sich die meisten PDF-Dateien ebenfalls nicht bearbeiten?

Und bei den paar PDF-Dateien, die ich umwandeln konnte, war das Ergebnis so, dass man mit der Korrektur der fehlerhaften "Erkennungen" einen riesigen Aufwand hätte.

Da lasse ich die Originale doch lieber so, wie sie sind, zumal ich selbst sie ja lesen kann. Es kam mir aber auch bisher gar nicht in den Sinn, dass es Leute geben könnte, die solche gedruckten Texte nicht lesen könnten.

Wofür also das Ganze? Embarassed

_________________
Gruß, Torquatus

C.c. - Übrigens stelle ich den Antrag, dass Ahnenblatt das beste aller Ahnenprogramme werden muss - frei nach Cato

OfflineView user's profilePersonal Gallery (2)Send private messageSend e-mail    
SirJohn






Joined: 02 Apr 2013
Posts: 24
Topics: 1


blank.gif

PostPosted: 07.04.2013, 16:02    (No subject)  Reply with quoteBack to top

Hi Torquatus,

danke, dass Du dir die Zeit für eine Rückmeldung genommen hast.

Deine Frage nach dem Warum hast Du dir teilweise ja schon selbst beantwortet: z.B. weil die Anzahl der Menschen die die alte Schrift lesen können stetig fällt. Aber dennoch lässt sich über Sinn und Nutzen von OCR Programmen generell sicher trefflich streiten, da selbige immer nur so gut sein können, wie die Vorlage genormt ist. Soll heißen handgeschriebene Briefe, am besten noch in Sütterlin, sollte man gar nicht erst versuchen, während man gedruckte / genormte Bücher in Fraktur mit diesem Programm prima einlesen können sollte.

Ob der Einsatz überhaupt Sinn macht hängt dabei natürlich vom Material des einzelnen Users ab. Ich scanne beispielsweise alte gedruckte Frakturtexte und setze diese neu in lateinischer Schrift, so dass meine minderjährigen Nichten die Inhalte auch mal lesen können. Zum Überleben notwendig für den durschschnittlichen Ahnenforscher wird dieses Programm deshalb aber sicher nicht.

Warum deine Vorlagen so schlechte bzw. gar keine Ergebnisse bringen ist aus der Ferne schlecht zu beurteilen. Aber wenn Du magst und der Inhalt nicht privater Natur ist, kannst Du mir gerne eines der nicht lesbaren Bilder bzw. ein pdf mit schlechten Ergebinssen zukommen lassen, und ich schau mal, ob ich das vielleicht besser hinkriege.

Liebe Grüße,

John

OfflineView user's profileSend private message    
Display posts from previous:      
Post new topicReply to topic


 Jump to:   




Show permissions


Board Security

Powered by Orion based on phpBB © 2001, 2002 phpBB Group
CBACK Orion Style based on FI Theme
All times are GMT + 2 Hours



[ Page generation time: 0.1338s (PHP: 78% - SQL: 22%) | SQL queries: 43 | GZIP enabled | Debug on ]