Das Papierlose Büro Zuhause

Das papierlose Büro Zuhause – wir haben es realisiert. Die automatisierte OCR Lösung OCRmyPDF ist kostenlos und es werden keine externen Dienste wie Google oder Evernote benötigt. Das Ganze geht sogar mit mehreren Usern. Und auch sehr schön: kein Rechner muss für die initiale Ablage laufen.

Im Video seht ihr unsere Lösung mit einer kleinen Installationsanleitung. Falls ihr keine Lust habt, das Video zu schauen, könnt ihr im Folgenden auch nachlesen, wie es geht.

Installation

Für die Installation des gezeigten Prozesses am Mac bitte dieser Anleitung folgen. Bitte beachtet dies ist nur eine Anregung und nach Belieben und Gusto erweiterbar bzw. veränderbar. Habt bitte Verständnis, wenn wir nicht jede Detailfrage beantworten können.

Solltet ihr Interesse an einem Windows-Pendant für das papierlose Büro zuhause haben, lasst uns Kommentare da, bei genug Nachfragen werden wir das Thema eventuell auch für Windows umsetzen.

Ziel ist es am Ende, eine PDF-Datei in einen Ordner zu legen und diese wird automatisch im Hintergrund in ein durchsuchbares PDF umgewandelt.

Dies erfordert drei Schritte, welche im Folgenden beschrieben sind: 1. Homebrew Installation

Homebrew ist eine Art Paketverwaltung, ein „AppStore“ auf Terminalebene, diese ermöglicht es uns OCRmyPDF zu installieren, welches durchsuchbare PDF-Dateien erstellen kann. Die Installation ist denkbar einfach, wie auf der Homepage https://brew.sh/index_de.html beschrieben, einfach folgenden Befehl im Terminal ausführen:

/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/ install)"

Das Terminal selber findet Ihr in den Programmen oder über das Launchpad > Andere > Terminal. 
 Weitere Informationen über Homebrew findet ihr auf der oben genannten Homepage.

2. OCRmyPDF

Das OCRmyPDF Paket ist in der Lage, PDF-Dokumente durchsuchbar zu machen und diese um eine (markierbare) Textebene zu ergänzen. Dies ist notwendig, um das Dokument später suchen zu können. Das Paket selbst beinhaltet verschiedene weitere Pakete wie z.B. „Tesseract“, welches die eigentliche Texterkennung durchführt, aber nur Bilddateien verarbeiten kann und deshalb nicht alleinig ausreicht.

Für die Installation folgt bitte den Installationsanleitungen auf der Seite https://github.com/jbarlow83/ OCRmyPDF . Generell sollte es mit wenigen Befehlen machbar sein. Unsere Anleitung enthält die Befehle von der genannten Website.

Sofern Homebrew korrekt installiert wurde, kann nun Folgendes im Terminal eingegeben werden:

brew tap jbarlow83/ocrmypdf

Und danach:

brew install ocrmypdf

Eine weitere Doku findet Ihr hier: https://ocrmypdf.readthedocs.io/en/latest/installation.html
Bei der oben beschriebenen Methode wird Deutsch, entgegen der Doku, nicht als Sprache mitinstalliert. Hier empfehlen wir die Deinstallation von tesseract und erneute Installation mit allen Sprachen, dies sollte einfach wie folgt gehen:

brew uninstall tesseract && brew install tesseract --with-all-languages

3. Ordneraktion

Die Ordneraktion sorgt dafür, dass nach Eintreffen der gescannten Datei, im Ordner das Dokument automatisch vom OCRmyPDF verarbeitet wird. Die Ordneraktion erfordert ein Apple-Script, welches ihr unten findet. Kopiert euch das Script und speichert es in euren Dokumenten oder auf dem Schreibtisch ab. Den Dateinamen könnt ihr frei wählen, die Endung muss „.scpt“ sein. Am Besten, ihr verwendet hierfür den Script-Editor im Launchpad > Andere > Script-Editor.

Nun müsst ihr das Script in einen bestimmten Ordner kopieren:

Macintosh HD/Library/Scripts/Folder Action Scripts/

Hierfür sind Admin Rechte notwendig.

Das Script sieht wie folgt aus und startet für jede neue Datei das Programm OCRmyPDF.
Es ersetztt die PDF-Dateien mit den neu erstellten durchsuchbaren PDF-Dateien, ist sehr rudimentär und ohne Logging.

Skript Download:

https://goo.gl/4pvuzQ

on adding folder items to thisFolder after receiving addedItems
     repeat with MyFile in addedItems
           tell application "Finder"
                set NameOfFile to (name of (info for MyFile))
                set Ordner to (name of (info for thisFolder))
                set theFolderPath to POSIX path of thisFolder
                set o to "OCR"
           end tell
       set com to "PATH=/usr/local/bin:$PATH; ocrmypdf -l deu" & " " & theFolderPath & NameOfFile & " " & theFolderPath & NameOfFile
do shell script com
end repeat
end adding folder items to

Im letzten Schritt muss noch die Ordneraktion aktiviert werden. Dazu wählen wir den gewünschten Ordner und machen einen Rechtsklick, unter Dienste finden wir den Punkt „Ordneraktionen konfigurieren …“ Hier wählen wir jetzt unser Script aus.

Ordneraktion

Das wars, nun sollte automatisch, sobald eine Datei im Order ankommt, ein
durchsuchbares PDF erstellt werden. Das laufende Script wird durch ein sich drehendes Zahnrad in der Menüleiste oben im Finder dargestellt.

4. Bonus

Ihr könnt euch jetzt auch elegant einen Dienst einrichten, welcher, einfach per Rechtsklick auf ein PDF, das OCRmyPDF für die Datei ausführt und es durch ein durchsuchbares PDF ersetzt.

Dienst - Das papierlose Büro zuhause

Einfach mit dem Automator einen neuen Dienst erstellen und das Ganze wie folgt aufsetzen und dabei das folgende Script verwenden

on run {input, parameters} set output to {}
     set sp to item 1 of input as string      set fp to POSIX path of sp 
set com to "PATH=/usr/local/bin:$PATH; ocrmypdf -l deu" & " " & quoted form of fp & " " & quoted form of fp
     do shell script com      display dialog "conversion done"      return output 
end run

Nun einfach per Rechtsklick auf ein PDF (bei uns OCR abhängig vom Dateinamen des Dienstes) auswählen und los geht es.

Dienst - Das papierlose Büro zuhause

P.S.: Ihr solltet mit mindestens 300dpi scannen, um brauchbare OCR Ergebnisse zu erhalten. Wir hoffen das papierlose Büro zuhause verschafft euch auch soviel Erleichterung wie uns, viel Spass beim Shreddern!

Weitere Themen:

Alles geschreddert? Papierschnipsel auf dem Boden? Lass einen Saugroboter für euch die Arbeit machen! Hier unser Test.

Saugroboter Vergleich

Unser Equipment *:

* Die Links sind Affiliate-Links. Kauft ihr die Produkte über den Link, ändert sich der Preis für euch nicht, jedoch bekommen wir etwas Unterstützung, das wäre ein toller Support für unseren Kanal. Vielen Dank!