Ahnenblattportal Forum Index
 •Portal  •Imprint  •Forum  •Search  •Profile  •Log in to check your private messages  •Log in   •Register  

 PDF-Dateien nach Suchbegriffen auslesen

Post new topicReply to topic
Author Message
Gerhardus 1




Gender:
Age: 64
Joined: 10 Jan 2014
Posts: 219
Topics: 54
Location: 22145 Hamburg


germany.gif

PostPosted: 23.08.2014, 19:39    PDF-Dateien nach Suchbegriffen auslesen  Reply with quoteBack to top

Liebe Mitstreiter,
heute komme ich mit einem Problem auf Sie zu, welches mich seit Monaten nicht mehr losläßt:
Wenn ich ein Buch im PDF-Format (z.B. bei Google-Books) gefunden habe, dann möchte ich dieses Buch gerne auf meinem PC haben und dort nach meinen Suchbegriffen durchstöbern. Trotzdem, dass ich viele Stunden mit der Suche nach einem solchen Programm, und installieren und deinstallieren des Programms verbracht habe, habe ich nichts gefunden, um diese PDF-Datei auszulesen.

Meine Frage: Gibt es jemanden unter uns, der ein solches Programm kennt und vielleicht sogar benutzt? Oder gibt es eine andere Möglichkeit, ein PDF-Buch nach eigenen Wünschen mit Suchbegriffen durchzustöbern?

_________________
Gruß

Gerhardus1 (Gerhard)

OfflineView user's profileSend private message    
bjew
Super Moderator



Gender:
Age: 68
Joined: 19 Jan 2006
Posts: 2371
Topics: 85
Location: nun im Münchener Westen


germany.gif

PostPosted: 23.08.2014, 20:08    (No subject)  Reply with quoteBack to top

Hallo,
grundsätzlich sollte es mit jedem PDF-Reader gehen - ABER!
Es kommt darauf an, wie die Seiten aufgebaut sind, als Text oder als Grafik. Im ungünstigsten Fall müsste da mit Schrifterkennung drüber gegangen werden.

_________________
Gruß
bjew (Bernhard)

System: Win10 auf Laptop mit i7 --- Ahnenblatt 2.74 u 2.95a

OfflineView user's profilePersonal Gallery (2)Send private messageYahoo MessengerSkype Name    
Marcus
Administrator



Gender:
Age: 46
Joined: 19 Jan 2006
Posts: 7459
Topics: 227


belize.gif

PostPosted: 23.08.2014, 22:59    (No subject)  Reply with quoteBack to top

Es geht hier wohl nur um "Grafiken / Scans" innerhalb einer pdf-Datei. Ansonsten kann man sie ja direkt problemlos durchsuchen.
Dann braucht man wohl eine OCR-Software. Bei normaler Schrift sind diese recht leistungsfähig, bei alten Frakturschriften, Sütterlin oder ähnlichem, gibt es aber wohl nur wenige kostenpflichtige Programme die einem weiterhelfen? Soweit jedenfalls meine Erinnerung an eine ähnliche Diskussion. Confused
Marcus

_________________
Fragen und Antworten rund um Ahnenblatt (Knowledge Base)

OfflineView user's profilePersonal Gallery (1)Send private messageSend e-mail    
bjew
Super Moderator



Gender:
Age: 68
Joined: 19 Jan 2006
Posts: 2371
Topics: 85
Location: nun im Münchener Westen


germany.gif

PostPosted: 24.08.2014, 11:19    (No subject)  Reply with quoteBack to top

Vielleicht solltest dich einfach mit dem Buch begnügen und die Suchfunktion innerhalb Google-Books nutzen?
Sollte es sich um Frakturschriften handeln, wirst du keine "billige" leistungsfähige Software finden.

_________________
Gruß
bjew (Bernhard)

System: Win10 auf Laptop mit i7 --- Ahnenblatt 2.74 u 2.95a

OfflineView user's profilePersonal Gallery (2)Send private messageYahoo MessengerSkype Name    
Gerhardus 1




Gender:
Age: 64
Joined: 10 Jan 2014
Posts: 219
Topics: 54
Location: 22145 Hamburg


germany.gif

PostPosted: 25.08.2014, 18:19    (No subject)  Reply with quoteBack to top

Liebe Mitstreiter,

vielen Dank für Eure Nachrichten. Leider sind es wirklich alles Bilder, die zu PDF gewandelt wurden.
Ich bin gespannt, ob ich ein Prg. finde, die diese Dateien auslesen kann. Auf jeden Fall melde ich mich nochmals dazu, wenn ich etwas gefunden habe.

Gruß

Gerhardus1

_________________
Gruß

Gerhardus1 (Gerhard)

OfflineView user's profileSend private message    
Marcus
Administrator



Gender:
Age: 46
Joined: 19 Jan 2006
Posts: 7459
Topics: 227


belize.gif

PostPosted: 25.08.2014, 20:43    (No subject)  Reply with quoteBack to top

Hallo Gerhard,

ich wusste doch, dass wir das "erst" diskutiert hatten. Und siehe da, die Frage damals stammte auch von Dir. wink
Ich fürchte viel Neues hat sich auf dem Gebiet nicht ergeben ...
http://www.ahnenblattportal.de/viewtopic.php?p=43104#43104
Marcus

_________________
Fragen und Antworten rund um Ahnenblatt (Knowledge Base)

OfflineView user's profilePersonal Gallery (1)Send private messageSend e-mail    
Gerhardus 1




Gender:
Age: 64
Joined: 10 Jan 2014
Posts: 219
Topics: 54
Location: 22145 Hamburg


germany.gif

PostPosted: 26.08.2014, 09:48    (No subject)  Reply with quoteBack to top

Hallo Marcus,

ich habe sehr viele interessante Nachrichten über die Bayern und die Frankenliste erhalten. Sobald ich etwas brauchbares darunter finde, werde ich berichten.

_________________
Gruß

Gerhardus1 (Gerhard)

OfflineView user's profileSend private message    
UngerMa




Gender:
Age: 67
Joined: 18 Jan 2009
Posts: 116
Topics: 15
Location: Glauchau


germany.gif

PostPosted: 26.08.2014, 10:53    (No subject)  Reply with quoteBack to top

Hallo Gerhardus,

das Problem mit dem Auslesen lässt sich prinzipiell lösen.

Ich habe einen Test mit einem einfachen Digitalfoto (960 x 1280 Pixel bzw. 1,4 MP) durchgeführt. Das Bild enthält ca. 40 Textzeilen, also fast wie eine A4-Seite, allerdings ein relativ guter Druck. Dargestellt ist eine Tafel an einem Denkmal, aufgrund der Position leicht verzerrt aufgenommen (schräg von unten).

1. Bild geöffnet (in diesem Fall mit XnView, Irfanview geht ebenso)
2. als PDF gedruckt (PDFCreator)
3. PDF-Datei mit Adobe Acrobat Professional geöffnet
4. Dokument - OCR-Texterkennung - Text mit OCR erkennen

Jetzt liegt eine durchsuchbare PDF vor, die auch gespeichert werden kann.
Mit dem AcrobatReader X gehts aber nicht, weil offenbar keine OCR integriert ist. Da wird eine Konvertierung z.B. in Word vorgeschlagen, das scheint aber kostenpflichtig zu sein. Neuere (gekaufte) Software habe ich nicht!

Wenn Du aber Textseiten mit Handschrift oder Fraktur hast wirds kompliziert oder unmöglich.

Gruß
Manfred

OfflineView user's profileSend private message    
Gerhardus 1




Gender:
Age: 64
Joined: 10 Jan 2014
Posts: 219
Topics: 54
Location: 22145 Hamburg


germany.gif

PostPosted: 26.08.2014, 18:10    (No subject)  Reply with quoteBack to top

Hallo Manfred,
vielen Dank für Deinen Test einschl. Ergebnis. Das Problem - wie Du selbst schreibst - wird sein, dass früher viele Bücher in Sütterlin oder in Fraktur geschrieben wurden. Ich habe nun 8 verschiedene OCR-Prg. zusammen. Mal sehen vielleicht schaffe ich es zeitlich mich am Wochenende hinzusetzen und die Prg. zu testen. Danach werde ich von meinen Tests berichten.

Gruß

Gerhardus1

_________________
Gruß

Gerhardus1 (Gerhard)

OfflineView user's profileSend private message    
Display posts from previous:      
Post new topicReply to topic


 Jump to:   




Show permissions


Board Security

Powered by Orion based on phpBB © 2001, 2002 phpBB Group
CBACK Orion Style based on FI Theme
All times are GMT + 1 Hour



[ Page generation time: 0.0843s (PHP: 83% - SQL: 17%) | SQL queries: 38 | GZIP enabled | Debug on ]