Beitrags-Archiv für die Kategory 'Technik'

Durchsuchbare PDF vom Scanner in Linux

Sonntag, 4. Juli 2010 19:30

Wie erstellt man ein durchsuchbares PDF von einem Papierdokument unter Linux. Dieser Frage bin ich mal nachgegangen. Unter Windows ist die Sache recht einfach, wenn man eine Lizenz von Acrobat hat. Aber wie ist es unter Linux? Ein einfaches PDF-Dokument vom Scanner zu bekommen ist kein Problem, mit beispielsweise

scanimage --resolution 300 --mode Gray> bild.pnm

wird der Scanner angewiesen, ein Graustufenbild mit 300 dpi zu produzieren. Anschließend könnte man es mit convert sofort in eine pdf-Datei umwandeln. Leider kann der Inhalt dieser Datei aber dann nicht durchsucht werden, weder kann man also im Dokument suchen, noch alle Dateien auf der Festplatte nach dem Inhalt indexieren. Für den Text benötigt man ein OCR-Tool. Ich habe mich zum Testen für cuneiform entschieden, einfach weil es vor 3 Tagen zum 1.0.0-Release wurde, es gibt aber auch ein paar andere. Man konvertiert pnm-Bild ins bmp-Format und verfüttert es an cuneiform um eine hOCR-Datei zu bekommen, etwa:

convert bild.pnm bild.bmp; cuneiform -l ger -f hocr -o bild.html bild.bmp

mit “-l ger” signalisiert man, dass die Sprache Deutsch ist. Die hOCR-Datei, was im Grunde eine html-Datei ist, kann man dann an das Tool hocr2pdf von ExactCode schicken. Für Ubuntu existiert ein Paket exactImage, beim Fedora musste ich es den SVN-Sourcen kompilieren. Auf der o.g. Seite findet man auch den Beispielaufruf, in diesem Fall wäre es:

hocr2pdf -i bild.bmp -o bild.pdf < bild.html

Fertig! bild.pdf ist nun eine Datei, in der das Bild im Vordergrund ist (sieht also exakt so aus, wie das Original) und der Text ist im Hintergrund, so dass man Suchen und Kopieren kann. Man kann nun ein Script schreiben, der die besagten Aktionen nacheinander ausführt.

Die Frontend-Liebhaber können auch ein Blick auf gscan2pdf werfen, das kann das wohl auch, ich fand aber gerade die Kommandozeilen-Variante ganz interessant und habe es daher nicht ausprobiert.

Thema: Technik | Kommentare (0) | Autor:

Wunder der chinesischen Ingenieurkunst

Montag, 14. Dezember 2009 20:53

Mir wurde hier ein Acer Extensa 2300 gebracht, Fehlerbeschreibung: "Geht nicht, mach’ mal heile". Also, was hat der Patient? Das Drucken auf den On-Button bewirkte keine Reaktion, aber so richtig keine… Null. Hmm, Netzteil? Aber die Ladeleuchte leuchtet, wenn man das Teil anschließt. Es gibt auch die 19V raus… Naja, das hat man ja schon aus Scrubs gelernt: Explorative surgery! Dum-di-dum, ich schneid’ den Burschen auf.

Gleich nach dem Aufmachen ist mir folgende hoch präzise Technik aufgefallen: die Hardware-Tasten (Ein/Aus, Internet, Email, etc.) sitzen auf einer extra Platine, die auf der Hauptplatine aufgesteckt ist. Die ganze Angelegenheit kam mir schon etwas wackelig vor, also beschloss ich das genauer anzugucken. Und Bingo, die Platine steckte nicht richtig. Also vernünftig aufgesteckt und siehe da, das Notebook läuft wieder. Wie neu.

Wer macht denn Tasten, auf denen ständig rumgedruckt wird, auf eine aufsteckbare Platine? Da ist es doch nur noch eine Frage der Zeit, wann sie rausspringt. Selbst wenn man das noch so präzise fertigten würde, hallo? Da druckt der User ständig rum…

Naja, Alex ist glücklich, ich hab wieder was gelernt und einen Erfolgserlebnis gab’s auch noch umsonst dazu. Cool.

Thema: Technik | Kommentare (0) | Autor:

Interesse am KL-RS232-Interface?

Dienstag, 19. Mai 2009 14:52

Ich hab mir ja mal von OBD2-Shop.eu einen Bausatz für ein serielles KL-Interface gekauft und zusammengelötet. Hat im Golf III auch super funktioniert. Motor-Steuergerät-Fehlercodes auslesen, Drehzahl/Temperatur/Einspritzzeit und was weiß ich, was noch alles möglich ist… Nun ist der Golf verkauft und ich hab keine Verwendung für das Kabel. Hat jemand Interesse? Sagen wir mal so 15 €?

Eine Beschreibung des Projekts gibt es hier: http://www.blafusel.de/obd/obd2_kw-interf-b.html

Eine Liste mit getesteten Fahrzeugen: http://www.blafusel.de/obd/obd2_scanned.php Dort in der Spalte Interface nach “RS232 KL blafusel.de” gucken.

Na und ein Bild noch:

RS232 KL blafusel.de

Thema: Technik | Kommentare (3) | Autor:

ATU? Nein, Danke!

Freitag, 17. April 2009 17:49

Ich wusste ja irgendwie, dass es Qualitätsunterschiede zwischen den KFZ-Werkstätten gibt. Aber sowas… Ich hatte ja schon mal so meine Erfahrung mit ATU, ihr erinnert euch an die Geschichte mit der AU-Plakette? Naja, nun mit dem Micra und den neuen Felgen.

Ich dachte mir ja, Reifen auf neue Felge aufziehen und an das Auto dran schrauben, was kann da wohl einfacher sein? Viel falsch machen kann man da nicht. Nun die Jungs von der Schnell-Werkstatt haben es dennoch geschafft. Den Wagen konnte man ab ca. 80 kmh nicht mehr fahren, das war ein einziger riesiger Vibrationsalarm… Also zurück, reklamieren, genau, die neue Räder waren falsch Augewuchtet, 25 Gramm zu viel auf einer Seite.

Schätzt mal, was sagten die ATU’ler? “Entschuldigung”? “Darf nicht passieren”? “Gutschein”? Pustekuchen! Es hieß nur “Probieren Sie es jetzt, jetzt müsste es eigentlich gehen. Sonst kommen Sie wieder”. Maaaannnn, nie wieder! Echt! Da sollte mir meine Sicherheit doch ein wenig mehr wert sein…

Thema: Technik | Kommentare (0) | Autor:

Träume müssen unerreichbar bleiben…

Mittwoch, 8. April 2009 18:21

9c75_27sonst sind das keine Träume, sondern Pläne. Ein “Traum” von mir ist nun wahr geworden, ich bin nun ein stolzer Jaguar-Fahrer! Es ist ein X-Type 2.0D von 2004, aber es ist ein Jaguar. Cool. Und wie es sich für eine Raubkatze gehört, saugeile Ausstattung. Leder, Navi, Klimaautomatik, Tempomat, Telefon und und und… Ja, einfach geil.

Thema: Technik | Kommentare (0) | Autor:

Meine neue Kamera…

Dienstag, 10. März 2009 11:22

Uhh habe ich lange nichts mehr geschrieben… Aber nun habe ich was, womit ich etwas angeben kann: meine neue Canon EOS 1000d! Wurde mir von Maria zum Geburtstag geschenkt! Danke an dieser Stelle auch nochmal!

canon1000d.jpg Das Bild links ist natürlich noch mit der alten Nikon gemacht worden. Hmm, soll ich hier nochmal die Daten der Kamera aufführen? Ich glaube nicht, jeder kann wohl Google bedienen. Ich kann nur sagen, die macht saugute Bilder, ist super schnell und dabei immernoch relativ leicht. Leider konnte ich die Kamera bis jetzt nur bei Parties einsetzen, die Fotos möchte ich hier nicht veröffentlichen. Aber ich versuche mal demnächst interessate Bilder fürs Blog zu schießen.

Thema: Technik | Kommentare (0) | Autor:

Audio 3D

Mittwoch, 22. Oktober 2008 15:49

Sowas habe ich noch nicht gehört, das müsst ihr euch auf jeden Fall anhören! Hier in desem Beitrag ist ein Link auf Barbershop.mp3. Runterladen, Kopfhörer auf und hören. Es ist sehr wichtig, dass ihr das mit den Kopfhörern macht. Ganz normale 08/15 Kopfhörer vom MP3-Player reichen vollkommen, müssen keine 5.1-Super-Puper-High-Tech sein. Ich schwöre euch, ihr werdet sehr überraschat sein! Aber auf jeden Fall zu Ende hören! Sehr cool!

Thema: Technik | Kommentare (0) | Autor:

Spendenaufruf…

Sonntag, 19. Oktober 2008 15:42

Die Sache ist die: auf diesem Server werkelt im Moment nur eine ältere 120Gb Festplatte. Platz reicht vollkommen aus, Geschwindigkeit auch. Allerdings wäre ein Ausfall der Platte fatal. Ein Sicherung würde da auch nicht viel nutzen, denn die Sicherung muss ja irgendwohin aufgespielt werden.

Hiermit also der Spendenaufruf: ich möchte einen RAID1 oder 5 auf dem Server haben. Hierzu benötige ich zumindest eine weitere 120er Platte. Besser aber zwei oder drei neuere Festplatten, egal wie groß.
Ich nehme die Spende gern auch direkt in Form von HDDs an. Und auf Wunsch bedanke ich mich beim Spender gerne mit Werbeplatz!

Thema: Allgemein, Technik | Kommentare (0) | Autor:

Angriff der Clonen-Pinguins…

Sonntag, 12. Oktober 2008 11:02

So, vielleicht wird das einer der wenigen hilfreichen Artikeln in meinem Blog. Die Aufgabenstellung war relativ einfach: Klonen von einem laufenden Linux-System auf einen anderen PC. Das original-PC darf nicht ausgeschaltet oder neu gestartet werden. Warum? Ist ja egal warum.

Zum Testen habe ich die Aufgabenstellung etwas modifiziert: Klonen von einem entfernten laufenden System (diesen Server) auf eine virtuelle Maschine. So, dd und andere Image- oder Clone-Tools fallen ja flach, da man den Server nicht von einer Live-CD neu booten kann. Ich bin dann folgendermaßen vorgegangen:

  1. Neue virtuelle Maschine anlegen.
    Dafür habe ich das VirtualBox von Sun genommen. Es war also gleichzeitig ein Test dieser virtuellen Umgebung. Es macht auf den ersten Blick ganz guten Eindruck, frei, klein, aber schnell und funktioniert super!
    [...]

Thema: Technik | Kommentare (0) | Autor:

Diese lästige Lizenz-Abfrage…

Dienstag, 9. September 2008 15:40

Jeder kennt sie, diese blöden Lizenzbestimmungen, die man vor dem Installieren von jedem Programm akzeptieren muss. Aber keiner liest es, richtig? He-he, und wer hat Google Chrom am 2. September runtergeladen und installiert? Das enthielt nämlich folgende Absätze in den Bestimmungen: [Zitat von http://gizmodo.com]

11. Content license from you

11.1 You retain copyright and any other rights you already hold in Content which you submit, post or display on or through, the Services. By submitting, posting or displaying the content you give Google a perpetual, irrevocable, worldwide, royalty-free, and non-exclusive license to reproduce, adapt, modify, translate, publish, publicly perform, publicly display and distribute any Content which you submit, post or display on or through, the Services. This license is for the sole purpose of enabling Google to display, distribute and promote the Services and may be revoked for certain Services as defined in the Additional Terms of those Services.

11.2 You agree that this license includes a right for Google to make such Content available to other companies, organizations or individuals with whom Google has relationships for the provision of syndicated services, and to use such Content in connection with the provision of those services.

11.3 You understand that Google, in performing the required technical steps to provide the Services to our users, may (a) transmit or distribute your Content over various public networks and in various media; and (b) make such changes to your Content as are necessary to conform and adapt that Content to the technical requirements of connecting networks, devices, services or media. You agree that this license shall permit Google to take these actions.

11.4 You confirm and warrant to Google that you have all the rights, power and authority necessary to grant the above license.

Cool, ne? Alles, was man über Chrome erstellt (ja, ja, auch die private eMails über Webmail) kann und vor allem darf Google weiterverwenden.

Naja, es hat sich recht schnell herausgestellt, dass es angeblich ein Copy/Paste-Fehler von Google war und der Absatz wurde so umgeändert:

11. Content license from you

11.1 You retain copyright and any other rights you already hold in Content which you submit, post or display on or through, the Services.

Naja, ist ja grad mal noch gutgegangen… Bei mir bleibt eigentlich nur eine Frage übrig, warum steht in der neuen EULA “August 15, 2008″ als Datum? :-O

Thema: Technik | Kommentare (0) | Autor: