<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>instant-thinking.de &#187; scansnap</title>
	<atom:link href="http://instant-thinking.de/tag/scansnap/feed/" rel="self" type="application/rss+xml" />
	<link>http://instant-thinking.de</link>
	<description>Just enough to get you started and leave you confused</description>
	<lastBuildDate>Thu, 26 Jan 2012 15:02:31 +0000</lastBuildDate>
	<language>de</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>Dokumententitel setzen in DevonThink Pro Office</title>
		<link>http://instant-thinking.de/2011/04/13/dokumententitel-setzen-in-devonthink-pro-office/</link>
		<comments>http://instant-thinking.de/2011/04/13/dokumententitel-setzen-in-devonthink-pro-office/#comments</comments>
		<pubDate>Wed, 13 Apr 2011 10:27:24 +0000</pubDate>
		<dc:creator>der Dennis</dc:creator>
				<category><![CDATA[]]></category>
		<category><![CDATA[devonthink]]></category>
		<category><![CDATA[gtd]]></category>
		<category><![CDATA[ocr]]></category>
		<category><![CDATA[scansnap]]></category>

		<guid isPermaLink="false">http://instant-thinking.de/?p=3037</guid>
		<description><![CDATA[In meinem Post &#252;ber mein papierloses B&#252;ro mit ScanSnap und DevonThink erz&#228;hlte ich davon, dass ich die Titel der Dokumente per Copy &#38; Paste setze und es da wenig Potential f&#252;r Optimierungen gibt. Das war, mit Verlaub, weit gefehlt. Eine h&#228;ufig funktionierende Optimierung ist nur ein Kontextmen&#252; weit weg. Markiert man n&#228;mlich die Betreffzeile eines [...]]]></description>
			<content:encoded><![CDATA[<p>In meinem <a href="http://instant-thinking.de/2011/03/12/papierkram-zettelwirtschaft-zu-pdf-management/" class="liinternal">Post &#252;ber mein papierloses B&#252;ro mit ScanSnap und DevonThink</a> erz&#228;hlte ich davon, dass ich die Titel der Dokumente per <em>Copy &amp; Paste</em> setze und es da wenig Potential f&#252;r Optimierungen gibt.</p>

<p>Das war, mit Verlaub, weit gefehlt. Eine h&#228;ufig funktionierende Optimierung ist nur ein Kontextmen&#252; weit weg. Markiert man n&#228;mlich die Betreffzeile eines gescannten Dokuments, kann man eben diesen Text<sup><a href="http://instant-thinking.de/2011/04/13/dokumententitel-setzen-in-devonthink-pro-office/#footnote_0_3037" id="identifier_0_3037" class="footnote-link footnote-identifier-link" title="OCR sei Dank">1</a></sup> <em>als Name &#252;bernehmen</em>.</p>

<p><a href="http://instant-thinking.de/wp-content/uploads/2011/04/devonthink_titel_erstellen.jpg" rel="lightbox" class="liimagelink"><img src="http://instant-thinking.de/wp-content/uploads/2011/04/devonthink_titel_erstellen.jpg" alt="" title="devonthink_titel_erstellen" width="400" class="center" /></a></p>

<p>Bumm, Zack, Return, schon ist die Betreffzeile als Titel des Dokuments gesetzt.</p>

<p><a href="http://instant-thinking.de/wp-content/uploads/2011/04/devonthink_titel_erstellt.jpg" rel="lightbox" class="liimagelink"><img src="http://instant-thinking.de/wp-content/uploads/2011/04/devonthink_titel_erstellt.jpg" alt="" title="devonthink_titel_erstellt" width="400" class="center" /></a></p>

<p>Wann immer die Betreffzeile, oder sonst ein Teil des Dokuments, also als Titel passt, spart man sich ein paar Tastenanschl&#228;ge. Und die Masse machts dann wirklich lohnend.</p>
<ol class="footnotes"><li id="footnote_0_3037" class="footnote">OCR sei Dank</li></ol>]]></content:encoded>
			<wfw:commentRss>http://instant-thinking.de/2011/04/13/dokumententitel-setzen-in-devonthink-pro-office/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Papierkram – Zettelwirtschaft zu PDF-Management</title>
		<link>http://instant-thinking.de/2011/03/12/papierkram-zettelwirtschaft-zu-pdf-management/</link>
		<comments>http://instant-thinking.de/2011/03/12/papierkram-zettelwirtschaft-zu-pdf-management/#comments</comments>
		<pubDate>Sat, 12 Mar 2011 19:53:39 +0000</pubDate>
		<dc:creator>der Dennis</dc:creator>
				<category><![CDATA[]]></category>
		<category><![CDATA[devonthink]]></category>
		<category><![CDATA[geek]]></category>
		<category><![CDATA[gtd]]></category>
		<category><![CDATA[mac]]></category>
		<category><![CDATA[osx]]></category>
		<category><![CDATA[paper]]></category>
		<category><![CDATA[paperless]]></category>
		<category><![CDATA[papier]]></category>
		<category><![CDATA[papierlos]]></category>
		<category><![CDATA[scanner]]></category>
		<category><![CDATA[scansnap]]></category>

		<guid isPermaLink="false">http://instant-thinking.de/?p=2962</guid>
		<description><![CDATA[Ein Arbeitszimmer in ein Kinderzimmer zu verwandeln ist ein durchaus ambitioniertes Projekt, das aus diversen, nicht weniger ambitionierten, Unterprojekten besteht. Wie bereits im Eingangspost dieser kleinen Serie gesagt wude, geht es im Gro&#223;en und Ganzen darum, Kram anderswo zu verstauen, respektive das Zeug los zu werden. In diesem Post geht es heute um beide Aspekte. [...]]]></description>
			<content:encoded><![CDATA[<p>Ein Arbeitszimmer in ein Kinderzimmer zu verwandeln ist ein <em>durchaus</em> ambitioniertes Projekt, das aus diversen, nicht weniger ambitionierten, Unterprojekten besteht. Wie bereits im <a href="http://instant-thinking.de/2010/08/08/storage-oder-wohin-mit-dem-ganzen-kram/" class="liinternal">Eingangspost</a> dieser kleinen Serie gesagt wude, geht es im Gro&#223;en und Ganzen darum, <em>Kram</em> anderswo zu verstauen, respektive das Zeug los zu werden.</p>

<p><a href="http://www.flickr.com/photos/der_dennis/5520562706/" title="Aktenordner by der_dennis, on Flickr" class="liimagelink"><img src="http://farm6.static.flickr.com/5018/5520562706_7818549c67.jpg" width="200" alt="Aktenordner" class="left"/></a></p>

<p>In diesem Post geht es heute um beide Aspekte. Die n&#252;tzlichen Informationen, die auf dem Papier gespeichert sind, werden digitalisiert und platzsparend<sup><a href="http://instant-thinking.de/2011/03/12/papierkram-zettelwirtschaft-zu-pdf-management/#footnote_0_2962" id="identifier_0_2962" class="footnote-link footnote-identifier-link" title="Platzsparend im Sinne von physikalischem Platz in Schr&auml;nken und auf Regalen">1</a></sup> auf einer Festplatte gespeichert. Sobald das geschehen ist<sup><a href="http://instant-thinking.de/2011/03/12/papierkram-zettelwirtschaft-zu-pdf-management/#footnote_1_2962" id="identifier_1_2962" class="footnote-link footnote-identifier-link" title="Und ein erstes Backup existiert&hellip;">2</a></sup> kann das urspr&#252;ngliche Medium, n&#228;mlich genau das Blatt Papier, entsorgt werden. Bei <em>einem</em> Blatt Papier ist der Raumgewinn im physikalischen Storage nicht sonderlich hoch, wenn es aber um die gesammelten Papiere zweier erwachsener Menschen in Akten-Ordnern, Schnellheftern und Kartons geht, so ist durchaus eine erkleckliche Platzeinsparung m&#246;glich<sup><a href="http://instant-thinking.de/2011/03/12/papierkram-zettelwirtschaft-zu-pdf-management/#footnote_2_2962" id="identifier_2_2962" class="footnote-link footnote-identifier-link" title="Das gilt geradezu doppelt, wenn einer der beiden Menschen (ich) zum Aufheben von quasi jedem Zettel neigt und sich den Kram seit 1994 nicht mehr angesehen hat&hellip;">3</a></sup>.</p>

<p>Und darum geht es ja letzlich.</p>

<p>An dieser Stelle m&#246;chte ich diesen Post kurz unterbrechen, um die einzelnen Arbeiten vorzustellen, die weiter unten in einiger L&#228;nge aufgef&#252;hrt werden:</p>

<ul>
<li>Jedes Papierdokument aus dem alten Papierarchiv und jedes k&#252;nftig eintrudelnde St&#252;ck Papier wird durch einen <a href="http://www.fujitsu.com/emea/products/de/scansnap/for-mac/" class="liexternal">Fujitsu ScanSnap S1500M</a> gezogen und in ein PDF umgewandelt.</li>
<li>Diese PDFs landen automatisch in einem Eingangsordner von <a href="http://www.devon-technologies.com/products/devonthink/" class="liexternal">DevonThink Pro Office</a> und werden dort <a href="http://de.wikipedia.org/wiki/Texterkennung" rel="nofollow" class="liwikipedia">OCR</a>t sowie anschliessend volltextindiziert.</li>
<li>Danach werden die Dokumente manuell betitelt und bedatet<sup><a href="http://instant-thinking.de/2011/03/12/papierkram-zettelwirtschaft-zu-pdf-management/#footnote_3_2962" id="identifier_3_2962" class="footnote-link footnote-identifier-link" title="Ein gutes St&uuml;ck Arbeit&hellip;">4</a></sup>.</li>
<li>Zum Schluss werden die Dokumente halbautomatisch sortiert.</li>
<li>Die Dokumenten-Datenbank wird automatisch und fortlaufend lokal<sup><a href="http://instant-thinking.de/2011/03/12/papierkram-zettelwirtschaft-zu-pdf-management/#footnote_4_2962" id="identifier_4_2962" class="footnote-link footnote-identifier-link" title="TimeMachine">5</a></sup> und offsite<sup><a href="http://instant-thinking.de/2011/03/12/papierkram-zettelwirtschaft-zu-pdf-management/#footnote_5_2962" id="identifier_5_2962" class="footnote-link footnote-identifier-link" title="Amazon S3">6</a></sup> gesichert. </li>
<li>Sobald ein Papier-Dokument mindestens zwei mal in digitaler Form existiert<sup><a href="http://instant-thinking.de/2011/03/12/papierkram-zettelwirtschaft-zu-pdf-management/#footnote_6_2962" id="identifier_6_2962" class="footnote-link footnote-identifier-link" title="Also ein Backup erstellt wurde">7</a></sup> kann es entsorgt werden. </li>
</ul>

<p>Als Ergebnis der ganzen Geschichte liegen s&#228;mtliche Dokumente als volltextindizierte PDFs ordentlich sortiert in einer redundant gesicherten Datenbank. Das gesamte neue Papierarchiv besteht nun aus einem einzigen Ordner der nur noch die Dokumente enth&#228;lt, die wirklich unbedingt im Original ben&#246;tigt werden.</p>

<p>Der ganze Weg hin zu dieser L&#246;sung findet sich nach dem Klick&#8230;</p>

<p><strong>Auswahl der Komponenten</strong></p>

<p>Alle Papierdokumente die digital gespeichert werden sollen, m&#252;ssen nat&#252;rlich auch erst einmal digital erfasst werden. Zu diesem Zweck wird im Prinzip nur ein Scanner nebst passender Software ben&#246;tigt. Ich habe trotzdem eine <em>lange</em> Zeit<sup><a href="http://instant-thinking.de/2011/03/12/papierkram-zettelwirtschaft-zu-pdf-management/#footnote_7_2962" id="identifier_7_2962" class="footnote-link footnote-identifier-link" title="Buchst&auml;blich Jahre">8</a></sup>, nach einer f&#252;r mich passenden L&#246;sung gesucht.</p>

<p>Die Kriterien dabei waren:</p>

<ul>
<li><p>Ich will meinen Kram gut wieder finden k&#246;nnen. Manchmal durch browsen in einer Verzeichnisstruktur, manchmal durch eine Volltextsuche. Unterst&#252;tzung f&#252;r Spotlight ist ein Muss, Unterst&#252;tzung f&#252;r Tags und SmartFolders ist ein dickes Plus.</p></li>
<li><p>Ich will die Papierdokumente im Alltag auch tats&#228;chlich digitalisieren und den ganzen Vorgang nicht aufschieben bis die Papierberge wieder auf ungesunde H&#246;hen wachsen. Der gesamte Workflow soll daher so einfach wie m&#246;glich funktionieren und z&#252;gig abzuschlie&#223;en sein.</p></li>
<li><p>Ich will meinen Mac verwenden, die L&#246;sung muss also unter OS X funktionieren. Cross-Platform w&#252;rde ich auch nehmen, ist aber kein Muss.</p></li>
<li><p>Die L&#246;sung soll nicht ausschlie&#223;lich  als Datengrab mit Wiederfind-Funktion dienen. Es sollten auch Dinge wie Notizfunktionen und Status-&#196;nderungen<sup><a href="http://instant-thinking.de/2011/03/12/papierkram-zettelwirtschaft-zu-pdf-management/#footnote_8_2962" id="identifier_8_2962" class="footnote-link footnote-identifier-link" title="etwa, zu bezahlen, bezahlt am, &hellip;">9</a></sup> m&#246;glich sein. Bonuspunkte f&#252;r die M&#246;glichkeit der Wiedervorlage und Erinnerungsfunktion.</p></li>
<li><p>Ich m&#246;chte Dokumente digital teilen k&#246;nnen. Eine Mailfunktion ist ein Muss. Dicke, dicke Bonuspunkte f&#252;r den schmerzfreien Sync zwischen verschiedenen Computern<sup><a href="http://instant-thinking.de/2011/03/12/papierkram-zettelwirtschaft-zu-pdf-management/#footnote_9_2962" id="identifier_9_2962" class="footnote-link footnote-identifier-link" title="think: Shared Dropbox folder f&uuml;r Kathi und mich">10</a></sup> und iDevices. Pluspunkte f&#252;r <code>rsync</code>ibalit&#228;t.</p></li>
<li><p>Die Struktur des Archivs und das verwendete Dateiformat muss zukunftsf&#228;hig<sup><a href="http://instant-thinking.de/2011/03/12/papierkram-zettelwirtschaft-zu-pdf-management/#footnote_10_2962" id="identifier_10_2962" class="footnote-link footnote-identifier-link" title="Eher im Sinne von Jahrzehnten als von Jahren">11</a></sup> sein. Soll heissen: Die Software sollte aktiv entwickelt werden und eine Export-Funktion besitzen. Als Dateiformat will ich PDF und TXT haben. Unterst&#252;tzung f&#252;r andere Formate ist ein Plus.</p></li>
<li><p>Die Dokumente samt der Datenbank und aller eventuell vorhandener Meta-Informationen muss gut zu sichern sein. Ich will sowohl lokal, als auch offsite ein Backup haben. Da hier auch sehr pers&#246;nliche Informationen zu sichern sind, will ich das ganze verschl&#252;sselt haben.</p></li>
<li><p>Ich bin bereit f&#252;r die gute Erf&#252;llung dieser Punkte Geld in die Hand zu nehmen. Es ist mir lieber, einmal Geld f&#252;r ordentliches Material auszugegeben, als mich nacher zu &#228;rgern, erneut f&#252;r eine andere L&#246;sung zu bezahlen und mir den Kopf &#252;ber eine Migration zu zerbrechen.</p></li>
</ul>

<p>So trivial sich die Aufgabe anfangs anh&#246;rt, die gestellten Anforderungen sind durchaus anspruchsvoll zu nennen. Dabei ist zu erw&#228;hnen, dass ich mir w&#228;hrend des Auswahlprozesses zwar einiges an Softwarel&#246;sungen angesehen habe, mich aber sehr schnell f&#252;r einen Scanner entscheiden konnte.</p>

<p>Genauer gesagt hatte ich mich zun&#228;chst im Jahr 2007 aufgrund eines <a href="http://www.43folders.com/2007/11/06/palimpsest-guide-mostly-paperless-life" class="liexternal">Posts von Merlin Mann</a> f&#252;r den Fujitsu ScanSnap S500M entschieden. Letztlich erstanden habe ich aber den Nachfolger namens ScanSnap S1500M.</p>

<p><img src="http://instant-thinking.de/wp-content/uploads/2011/03/fujitsu_scansnap_s1500m.jpg" alt="" title="fujitsu_scansnap_s1500m" width="386" height="278" class="center" /></p>

<p>Dieses Ger&#228;t ist die Wucht in T&#252;ten. Wirklich. Der Scanner ist formsch&#246;n und nimmt zusammengeklappt etwa die Stellfl&#228;che eines DIN A4 Blatts ein. Er verf&#252;gt &#252;ber genau eine Taste die blau leuchtet. Er kann duplex scannen und sogar erkennen, wann das n&#246;tig ist. Er geht unglaublich fix zu Werke. Er kann schief eingelegte Bl&#228;tter automatisch korrigieren und erkennt einzelne Seiten per Ultraschall. In einem Scanvorgang kann man unterschiedlich gro&#223;e Seiten erfassen. Wenn man den Scan-Knopf etwas l&#228;nger dr&#252;ckt, wechselt der Scanner in einen EndlosScan-Modus um &#252;berlange Dokumente<sup><a href="http://instant-thinking.de/2011/03/12/papierkram-zettelwirtschaft-zu-pdf-management/#footnote_11_2962" id="identifier_11_2962" class="footnote-link footnote-identifier-link" title="Ikea-Kassenzettel anyone?">12</a></sup> am St&#252;ck zu erfassen. Farbe und Schwarz-Wei&#223; wird ebenfalls automatisch unterschieden. Er unterst&#252;tzt einen ganzen Haufen an Software-Zielen, von verschiedenen Bildverarbeitungsprogrammen bis hin zum schlichten Verzeichnis im Dateisystem. Ausserdem kann man sich neben den sinnvollen Default-Einstellungen auch noch eigene Scan-Profile erstellen.</p>

<p>Der Scanner ist dagegen nicht geeignet Fotos oder &#228;hnliches zu scannen. Man kann durchaus mal eine Seite aus einem Magazin durchjagen<sup><a href="http://instant-thinking.de/2011/03/12/papierkram-zettelwirtschaft-zu-pdf-management/#footnote_12_2962" id="identifier_12_2962" class="footnote-link footnote-identifier-link" title="Und diese dann im Volltext durchsuchen oder direkt aus dem PDF Copy &amp; Pasten, aber ich greife vorraus&hellip;">13</a></sup>, aber f&#252;r ernsthafte und hochaufl&#246;sende Scans von Bildern greift man besser zu einem ad&#228;quaten Flachbettscanner. Der S1500M ist ein Arbeitspferd f&#252;r die Dokumentenerfassung und macht diesen Job wirklich, wirklich gro&#223;artig.</p>

<p>Es gibt die von mir verwendete Version S1500M in schmuckem wei&#223; und die schwarze Windows-Version namens S1500. Diese unterscheiden sich aber, IIRC, nur in der beigelegten Software. Apropos, ich habe meinen Scanner bei einem eBay-H&#228;ndler gekauft. Dort gab es den Scanner im Angebot ohne den Adobe Acrobat. Da ich diesen f&#252;r meine L&#246;sung eh nicht ben&#246;tigte ist so schnell ein Hunderter in der Anschaffung eingespart. Der Preis lag dann immer noch bei knappen 300 €, aber Qualit&#228;t hat nun mal ihren Preis und ich war ja auch durchaus gewillt, Geld auszugeben wenn der Gegenwert entsprechend attraktiv ist.</p>

<p>F&#252;r weitere Meinungen schaut euch zum Beispiel das Review unter <a href="http://lawyerist.com/review-scansnap-s1500-document-scanner/" class="liexternal">lawyerist.com</a> an. Bestaunt die Bewertungen f&#252;r die <a href="http://www.testfreaks.de/scanner/fujitsu-scansnap-s1500m/" class="liexternal">Mac-Version</a> und die <a href="http://www.testfreaks.de/scanner/fujitsu-scansnap-s1500/" class="liexternal">Windows-Version</a> bei den Testfreaks. Googlet das Ger&#228;t. Und dann, wenn ihr Dokumente scannen wollt kauft euch das Teil. Es geht kaum besser.</p>

<p>Bei der Software habe ich mir einige L&#246;sungen angesehen, bin aber letztlich doch bei <a href="http://www.devon-technologies.com/products/devonthink/" class="liexternal">DevonThink Pro Office</a> gelandet.</p>

<p>Nur ganz kurz zu der Software die nicht das Rennen machte:</p>

<ul>
<li><p>Finder. Ja, das war meine erste Idee. Ist ja eh da, und kostet daher auch nichts extra. Einfach alles direkt im Dateisystem ablegen. Eine einfache Ordnerstruktur die an die bestehende Ordnung in den Papier-Akten angeleht wird und alles wird gut. Mit Spotlight-Kommentaren k&#246;nnte man sich sogar eine Tag-basierende Ordnung neben der Verzeichnisstruktur basteln. Aber das alles w&#228;re mir dann doch zu aufwendig in der Pflege gewesen&#8230;</p></li>
<li><p>Ebenfalls sehr symphatisch war mir <a href="http://www.ironicsoftware.com/yep/index.html" class="liexternal">Yep</a>. Yep hat gegen&#252;ber DevonThink den Vorteil, dass es, wie der Finder, direkt auf Dateisystemebene arbeitet und somit den meisten Usern die Einarbeitung erspart. Durch diese Funktionsweise kann das Backup per TimeMachine auch schlicht nebenbei laufen. Die restlichen Features liessen gegen&#252;ber DevonThink aber doch zu w&#252;nschen &#252;brig. Wer ein leichtgewichtiges Programm sucht, ist hier aber, im Vergleich zum Finder, schon sehr gl&#252;cklich zu machen.</p></li>
<li><p>Bei <a href="http://evernote.com/" class="liexternal">Evernote</a> war mir nicht so richtig wohl dabei, dass alle Dokumente &#252;ber Server des Herstellers gesynct werden. Das ist zwar total cool und macht es sehr einfach die Dokumente auch auf dem iPhone oder einem anderen Computer verf&#252;gbar zu haben, aber es ist mir deutlich lieber, wenn meine vertraulichen Dokumente nicht in irgendeiner Cloud rumgondeln ohne dass ich Einfluss auf ihre Verschl&#252;sselung nehmen kann.</p></li>
<li><p><a href="http://www.barebones.com/products/yojimbo/index.html" class="liexternal">Yojimbo</a> hat zwar alles, was man f&#252;r ein anst&#228;ndiges &#8220;Hier-wird-alles-abgelegt&#8221; System  ben&#246;tigt und strotzt nur so vor Features, aber es ist mir doch zu wenig auf Papier-Dokumente zentriert.</p></li>
</ul>

<p>DevonThink Pro Office bietet mir dagegen wirklich alles, was man sich so f&#252;r eine Dokumentenablage w&#252;nschen kann. Es benutzt zwar ein propriet&#228;res Format f&#252;r seine Datenbank, aber die Sicherung per TimeMachine ist trotzdem kein Problem. Das Programm wird schon viele Jahre weiter entwickelt und verf&#252;gt &#252;ber eine gute Export-Funktion. Die Sortierung funktioniert prim&#228;r &#252;ber eine Ordnerstruktur, bietet aber auch Tags an. Als Extra wird jedem Dokument, das in einem Ordner liegt, der Ordnername als Tag verpasst. Das, so sollte sich noch zeigen, ist <em>sehr</em> praktisch.</p>

<p><a href="http://instant-thinking.de/wp-content/uploads/2011/03/devonthink_screen-1.jpg" rel="lightbox" class="liimagelink"><img src="http://instant-thinking.de/wp-content/uploads/2011/03/devonthink_screen-1.jpg" alt="" title="devonthink_screen-1" width="400" class="center" /></a></p>

<p>Die eine gro&#223;e H&#252;rde die man beim Einsatz von DevonThink hat, ist die Einarbeitung. Gerade weil es voller m&#228;chtiger Features steckt, ist die Bedienung nicht ab Start intuitiv. Es &#228;hnelt vielmehr einer Leinwand, auf die jeder Benutzer sein Bild von seinem Datenbestand projizieren kann und muss. Wenn die Daten einmal in DevonThink gelandet sind und die Struktur durch den Benutzer steht, ist es sehr einfach zu benutzen und &#228;usserst effizient. Das f&#228;ngt bei so Dingen wie der schnellen Vergabe von Tags an, geht weiter &#252;ber die automatische Erkennung von &#228;hnlichen Dokumenten und endet bei der M&#246;glichkeit Dokumente gleichzeitig in mehreren Ordner vorzuhalten noch lange nicht.</p>

<p>Weiterhin bietet DevonThink einen eigenen Webserver an, der den Datenbestand auf jedem OS das einen Browser beherbergt erschlie&#223;bar macht. Seit kurzem bietet der Hersteller auch eine iOS-App an mit der man seine Dokumente auf iPhone oder iPad mitnehmen kann. Dazu ist es auch m&#246;glich, unterwegs PDFs und andere Dokumente zu der Datenbank hinzuzuf&#252;gen<sup><a href="http://instant-thinking.de/2011/03/12/papierkram-zettelwirtschaft-zu-pdf-management/#footnote_13_2962" id="identifier_13_2962" class="footnote-link footnote-identifier-link" title="Auf Wunsch auch mit GPS-Koordinaten&hellip;">14</a></sup> und diese dann auf den Mac zu syncen.</p>

<p>Kurz: Der Preis von 180 US-Dollar ist zwar kein Pappenstil, aber daf&#252;r bekommt man auch ein wirklich professionelles Produkt. Der Hersteller bietet auch noch die g&#252;nstigeren Versionen <em>Professional</em> und <em>Personal</em> an, diese bieten aber weniger Features. Insbesondere fehlen die OCR-Engine und der Webserver&#8230;</p>

<p><strong>Workflow</strong></p>

<p>Nachdem die Komponenten also beschafft sind, geht es nun an den eigentlichen Workflow. Dieser besteht im wesentlichen aus Scannen, Bearbeiten und Backup.</p>

<p><strong>Scannen</strong></p>

<p>Wenn Papierdokumente bei uns daheim ankommen und nicht nach einer sofortigen Bearbeitung verlangen<sup><a href="http://instant-thinking.de/2011/03/12/papierkram-zettelwirtschaft-zu-pdf-management/#footnote_14_2962" id="identifier_14_2962" class="footnote-link footnote-identifier-link" title="In diesem seltenen Fall wird eine handschriftliche erledigt-Notiz auf dem Papier vermerkt">15</a></sup>, landen sie erst einmal in einer formsch&#246;nen IKEA-Ablage. Wenn sich dort ein erklecklicher Stapel gebildet hat, mache ich mich an die Ablage. Das hat schon zu Zeiten des Papier-Archivs gut funktioniert und der Vorgang ist auch f&#252;r das digitale Archiv gut geeignet. Es ist nur wichtig darauf zu achten, dass sich kein Berg bildet der einen vor der Erledigung zur&#252;ckschrecken l&#228;sst. GTD und so&#8230; Der Stapel wird vor dem Scannen kurz in mehrseitige und einseitige Dokumente vorsortiert, das erspart mehrfaches wechseln der Scan-Presets und macht die Sache, wie ich in ein zwei Abs&#228;tzen weiter ausf&#252;hren werde, noch ein bisschen leichter.</p>

<p>Das Scannen selbst ist dank dem ScanSnap wirklich eine Freude. Standardm&#228;&#223;ig stecke ich einfach ein Dokument, das dann auch ruhig aus mehreren Seiten bestehen darf die eventuell beidseitig bedruckt sind, oben in den Scanner, dr&#252;cke den blauen Knopf und warte ein paar Sekunden bis die Bl&#228;tter durchgezogen wurden. Im Anschluss l&#228;uft automatisch die Ablage samt OCR-Erkennung in DevonThink an und die Seiten landen als <em>ein</em> PDF im Eingangsordner. Als Namen tr&#228;gt das PDF einen Datumsstempel mit sekundengenauer Aufl&#246;sung im Format <code>2011_03_11_20_42_52.pdf</code>, die Inhalte sind aber bereits volltextindiziert und durchsuchbar. Hier ist ein Video von einem Scan von 12 alten Gehaltsabrechnungen zum begucken:</p>

<p><object type="application/x-shockwave-flash" width="300" height="400" data="http://www.flickr.com/apps/video/stewart.swf?v=71377" classid="clsid:D27CDB6E-AE6D-11cf-96B8-444553540000"> <param name="flashvars" value="intl_lang=en-us&#038;photo_secret=ef5e10d2aa&#038;photo_id=5519970605"></param> <param name="movie" value="http://www.flickr.com/apps/video/stewart.swf?v=71377"></param> <param name="bgcolor" value="#000000"></param> <param name="allowFullScreen" value="true"></param><embed type="application/x-shockwave-flash" src="http://www.flickr.com/apps/video/stewart.swf?v=71377" bgcolor="#000000" allowfullscreen="true" flashvars="intl_lang=en-us&#038;photo_secret=ef5e10d2aa&#038;photo_id=5519970605" height="400" width="300"></embed></object></p>

<p>W&#228;hrend die OCR-Erkennung l&#228;uft, k&#246;nnen weitere Dokumente gescannt werden, DevonThink baut dann eine Queue auf, die nach und nach abgearbeitet wird.</p>

<p>F&#252;r bestimmte Dokumentarten habe ich eigene Presets erstellt. So sind etwa meine Kontoausz&#252;ge von beiden Seiten bedruckt, aber nur die Vorderseite ist interessant. Hierf&#252;r gibt es ein Preset, das nur die Vorderseiten aller eingelegten Papiere ber&#252;cksichtigt. Dieses Preset, und das relativ kleine Papierformat nat&#252;rlich, beschleunigt das Scannen noch einmal <em>deutlich</em>.</p>

<p>Ausserdem kommt es h&#228;ufig vor, dass ich eine ganze Anzahl an verschiedenen Dokumenten habe, die jeweils nur aus einer Seite Papier bestehen. Dazu gibt es ein Preset, das jede gescannte Seite als einzelnes PDF ablegt. In diesem Falle kann ich, dank der oben erw&#228;hnten Vorsortierrerei, alle einseitigen Dokumente in einem Rutsch scannen lassen.</p>

<p><a href="http://instant-thinking.de/wp-content/uploads/2011/03/Einzelseiten.jpg" rel="lightbox" class="liimagelink"><img src="http://instant-thinking.de/wp-content/uploads/2011/03/Einzelseiten.jpg" alt="" title="Einzelseiten" width="400" class="center" /></a></p>

<p><strong>Bearbeiten</strong></p>

<p>Irgendwann ist dann die OCR-Queue komplett abgearbeitet und die Dokumente liegen mit Datumsstempelnamen und volltextindiziert im Eingangs-Ordner von DevonThink.</p>

<p>Meine Aufgabe ist es nun, den Eingangs-Ordner durchzugehen, jedes Dokument mit einem sprechenden Namen zu versehen und das Erfassungsdatum zu korrigieren. Hier ist dann tats&#228;chlich menschliche Arbeit gefordert, das Potential zur Automatisierung ist eher gering.</p>

<p>F&#252;r den Namen habe ich mir angew&#246;hnt, eine Datei zu markieren, in der erscheinenden Vorschau die, meist vorhandene, Betreffzeile zu markieren<sup><a href="http://instant-thinking.de/2011/03/12/papierkram-zettelwirtschaft-zu-pdf-management/#footnote_15_2962" id="identifier_15_2962" class="footnote-link footnote-identifier-link" title="Ja, mit der Maus, in dem gescannten PDF. Bumm, Zack, Return.">16</a></sup>  und als Name der Datei zu Copy &amp; Pasten. Das Erstellungsdatum ist am schnellsten mit <a href="http://www.theapplepress.com/wp-content/uploads/2010/05/set_date.scpt" class="liexternal">diesem kleinen AppleScript</a> und einem Shortcut zu &#228;ndern.</p>

<p>Das Script wird unter <code>~/Library/Application Support/DEVONthink Pro 2/Scripts/Dates/</code> abgelegt und in den Systemeinstellungen wird ein Extra-Shortcut f&#252;r DevonThink erstellt. Da das Script bei mir schlicht <code>set_date</code> hei&#223;t und das Standardshortcut zum Speichern in DevonThink nicht belegt ist, habe ich mir den Aufruf auf Cmd+S gelegt.</p>

<p><a href="http://instant-thinking.de/wp-content/uploads/2011/03/set_date_shortcut.jpg" rel="lightbox" class="liimagelink"><img src="http://instant-thinking.de/wp-content/uploads/2011/03/set_date_shortcut.jpg" alt="" title="set_date_shortcut" width="400" class="center" /></a></p>

<p>Wenn dann ein oder mehrere Dokumente in DevonThink markiert sind, bringt diese Tastenkombination ein Popup-Fenster auf den Schirm welches die Eingabe eines Datums erwartet. Eingeben, Enter, fertig.</p>

<p>Das macht zwar alles keinen soo gro&#223;en Spa&#223;, aber die entstehende Ordnung ist die Arbeit definitiv wert.</p>

<p>Full Disclosure:
Ich habe <em>immer noch</em> ein Backlog von ca. 400 Dokumenten aus dem alten Archiv auf diese Art und Weise zu verarzten. Die neu hereinkommenden Dokumente werden aber sofort nach dem Scan mit Datum und Titel versehen und sortiert. Um das auch wirklich, wirklich durchzuhalten ist es total wichtig, den Stapel nicht zu hoch wachsen zu lassen&#8230;</p>

<p>Jetzt liegen die Dokumente also mit passenden Namen und korrektem Datum im Eingangsordner. Von dort m&#252;ssen sie aber noch in die f&#252;r sie vorgesehenen Order einsortiert werden. F&#252;r diese Ordner habe ich mich im groben an die themenbezogene Struktur aus dem Papierarchiv (Wohnung, Auto, Telefon, &#8230;) gehalten. Einige Ordnder werden allerdings von ihrem Ursprungsort aus in andere repliziert, gewissermassen eingeblendet. Hier muss man einfach selbst schauen was f&#252;r eine Ordnung man bevorzugt.</p>

<p><a href="http://instant-thinking.de/wp-content/uploads/2011/03/zauberhuticon.jpg" class="liimagelink"><img src="http://instant-thinking.de/wp-content/uploads/2011/03/zauberhuticon.jpg" alt="" title="zauberhuticon" width="361" height="145" class="center" /></a></p>

<p>Das geniale ist, wenn man einmal ein paar<sup><a href="http://instant-thinking.de/2011/03/12/papierkram-zettelwirtschaft-zu-pdf-management/#footnote_16_2962" id="identifier_16_2962" class="footnote-link footnote-identifier-link" title="f&uuml;r gew&ouml;hnlich reichen bereits zwei oder drei">17</a></sup> Dokumente in einem Ordner abgelegt hat, <em>lernt</em> DevonThink, dass dieser Ordner f&#252;r eine bestimmte Art von Dokumenten vorgesehen ist. &#220;ber das Zauberhut-Icon erreicht man f&#252;r die nachfolgenden Dokumente dann eine Liste von Vorschl&#228;gen, wohin dieses neue Dokument am ehesten passen k&#246;nnte.</p>

<p><a href="http://instant-thinking.de/wp-content/uploads/2011/03/automatisch_sortieren.jpg" rel="lightbox" class="liimagelink"><img src="http://instant-thinking.de/wp-content/uploads/2011/03/automatisch_sortieren.jpg" alt="" title="automatisch_sortieren" width="150" class="right" /></a></p>

<p>Das funktioniert <em>sehr</em> gut und um so besser, je feinstreifiger die Ordnerstruktur aufgebaut ist. Als wir etwa den Festnetzanbieter wechselten, war bereits bei der zweiten Rechnung klar, wohin sie geh&#246;rt. Aber auch bei eher allgemeinen Sammelbecken ist die Magie des Programms erstaunlich. Im Ordner &#8220;Wohnung/M&#246;bel&#8221; landen zuverl&#228;ssig Ikea-Kassenzettel und BabyMarkt-Lieferscheine. Wie genau das funktioniert ist mir nicht v&#246;llig klar, aber es macht die Sortierung verbl&#252;ffend einfach.</p>

<p>&#220;ber die gleiche Kombination aus OCR und Statistik kann DevonThink auch &#228;hnliche Dokumente finden und so interessante neue Zusammenh&#228;nge herstellen. Dem heimischen DataMining steht so nichts mehr im Wege und bietet sich auch f&#252;r andere Sammlungen an. Wer etwa sein Quellmaterial f&#252;r eine wissenschaftliche Arbeit erforschen m&#246;chte oder Variationen in einer Rezepte-Sammlung sucht, findet in der DevonThink AI ein m&#228;chtiges Werkzeug.</p>

<p><strong>Backup</strong></p>

<p>Jetzt, wo diese ganzen wunderbaren Informationen gesammelt, aufbereitet, bearbeitet, sortiert und abgelegt wurden, w&#228;re es doch ein <em>Jammer</em> sie wieder zu verlieren. Um diesen Verlust zu vermeiden erstelle ich zwei Sicherheitskopien.</p>

<p>Die eine Kopie wird dabei von dem standardm&#228;&#223;ig laufenden TimeMachine Backup erstellt. Das passiert einmal pro Stunde und die Daten landen auf einer formsch&#246;nen <a href="http://www.apple.com/de/timecapsule/" class="liexternal">TimeCapsule</a>. Damit bin ich f&#252;r den Fall eines Ausfalls der Festplatte in meinem MacBook oder sonstigen Unbillen erst mal ganz gut abgesichert.</p>

<p>Die andere Kopie wird von <a href="http://www.haystacksoftware.com/arq/" class="liexternal">Arq</a> erstellt, lokal verschl&#252;sselt und anschliessend &#252;ber das Internet in der Amazon S3 Cloud, EU-Region, abgelegt. Diese Daten liegen also in einem Rechenzentrum in Dublin und sind dort sicher vor Wohnungsbr&#228;nden oder Diebstahl der kompletten Einrichtung.</p>

<p><a href="http://instant-thinking.de/wp-content/uploads/2011/03/arq.jpg" rel="lightbox" class="liimagelink"><img src="http://instant-thinking.de/wp-content/uploads/2011/03/arq.jpg" alt="" title="arq" width="400" class="center" /></a></p>

<p>Das ganze ist nicht sonderlich teuer<sup><a href="http://instant-thinking.de/2011/03/12/papierkram-zettelwirtschaft-zu-pdf-management/#footnote_17_2962" id="identifier_17_2962" class="footnote-link footnote-identifier-link" title="Meine letzte Monatsrechnung betrug 63 US-Cent">18</a></sup>, man kann in Arq ein maximales Budget konfigurieren und nachdem der erste Schwung Daten up ist, sind die folgenden Backupl&#228;ufe alle inkrementell und sichern nur noch die Daten, die sich seit dem letzten Lauf ge&#228;ndert haben. Das Intervall ist hier ebenfalls st&#252;ndlich.</p>

<p>Von jedem Dokument existieren also drei Kopien: Das Original auf dem MacBook Pro, die lokale Sicherung auf der TimeCapsule und die Offsite Sicherung in Amazon S3. Somit sind die Dokumente nun sicherer aufgehoben, als ihre papiernen Vorg&#228;nger.</p>

<p>Sollte eine Katastrophe eintreten die sowohl die Daten in Essen, als auch die in Dublin gef&#228;hrden, so werde ich vermutlich andere Sorgen als meine Dokumente haben&#8230;</p>

<p><strong>Schlussbetrachtung</strong></p>

<p>Die Digitalisierung von analogen Datenbest&#228;nden ist definitiv mit einem erheblichen Arbeitsaufwand verbunden. Der Auswahlprozess der Werkzeuge ist aufwendig und der Preis der Werkzeuge nicht sonderlich billig. Aber die erzielte Zeitersparnis bei Suchen in Dokumenten ist fantastisch.</p>

<p>Wann habe ich noch mal dieses MacBook gekauft? Was zahle ich doch gleich f&#252;r meine Autoversicherung? Wann l&#228;uft der Mobilfunkvertrag aus? Wie lautet meine SteuerID noch gleich? Zeige mir alle Dokumente mit dem Tag <em>Steuern</em> aus dem Jahr 2010. Bumm, Zack, Return. Da ist die Antwort.</p>

<p>Und so soll das auch sein.</p>
<ol class="footnotes"><li id="footnote_0_2962" class="footnote">Platzsparend im Sinne von physikalischem Platz in Schr&#228;nken und auf Regalen</li><li id="footnote_1_2962" class="footnote">Und ein erstes Backup existiert&#8230;</li><li id="footnote_2_2962" class="footnote">Das gilt geradezu doppelt, wenn einer der beiden Menschen (ich) zum Aufheben von quasi jedem Zettel neigt und sich den Kram seit 1994 nicht mehr angesehen hat&#8230;</li><li id="footnote_3_2962" class="footnote">Ein <em>gutes</em> St&#252;ck Arbeit&#8230;</li><li id="footnote_4_2962" class="footnote">TimeMachine</li><li id="footnote_5_2962" class="footnote">Amazon S3</li><li id="footnote_6_2962" class="footnote">Also ein Backup erstellt wurde</li><li id="footnote_7_2962" class="footnote">Buchst&#228;blich Jahre</li><li id="footnote_8_2962" class="footnote">etwa, <em>zu bezahlen</em>, <em>bezahlt am</em>, &#8230;</li><li id="footnote_9_2962" class="footnote">think: Shared Dropbox folder f&#252;r Kathi und mich</li><li id="footnote_10_2962" class="footnote">Eher im Sinne von Jahrzehnten als von Jahren</li><li id="footnote_11_2962" class="footnote">Ikea-Kassenzettel anyone?</li><li id="footnote_12_2962" class="footnote">Und diese dann im Volltext durchsuchen oder direkt aus dem PDF Copy &amp; Pasten, aber ich greife vorraus&#8230;</li><li id="footnote_13_2962" class="footnote">Auf Wunsch auch mit GPS-Koordinaten&#8230;</li><li id="footnote_14_2962" class="footnote">In diesem seltenen Fall wird eine handschriftliche <em>erledigt</em>-Notiz auf dem Papier vermerkt</li><li id="footnote_15_2962" class="footnote">Ja, mit der Maus, in dem gescannten PDF. Bumm, Zack, Return.</li><li id="footnote_16_2962" class="footnote">f&#252;r gew&#246;hnlich reichen bereits zwei oder drei</li><li id="footnote_17_2962" class="footnote">Meine letzte Monatsrechnung betrug 63 US-Cent</li></ol>]]></content:encoded>
			<wfw:commentRss>http://instant-thinking.de/2011/03/12/papierkram-zettelwirtschaft-zu-pdf-management/feed/</wfw:commentRss>
		<slash:comments>41</slash:comments>
		</item>
		<item>
		<title>QuickLinks vom 2. Juni bis zum 16. Juni</title>
		<link>http://instant-thinking.de/2009/06/16/quicklinks-vom-2-juni-bis-zum-16-juni/</link>
		<comments>http://instant-thinking.de/2009/06/16/quicklinks-vom-2-juni-bis-zum-16-juni/#comments</comments>
		<pubDate>Tue, 16 Jun 2009 11:00:07 +0000</pubDate>
		<dc:creator>der Dennis</dc:creator>
				<category><![CDATA[]]></category>
		<category><![CDATA[backup]]></category>
		<category><![CDATA[book]]></category>
		<category><![CDATA[cheatsheet]]></category>
		<category><![CDATA[cloud]]></category>
		<category><![CDATA[computer]]></category>
		<category><![CDATA[ct]]></category>
		<category><![CDATA[editor]]></category>
		<category><![CDATA[encryption]]></category>
		<category><![CDATA[filesystem]]></category>
		<category><![CDATA[fujitsu]]></category>
		<category><![CDATA[geek]]></category>
		<category><![CDATA[gpg]]></category>
		<category><![CDATA[gtd]]></category>
		<category><![CDATA[hack]]></category>
		<category><![CDATA[history]]></category>
		<category><![CDATA[howto]]></category>
		<category><![CDATA[interview]]></category>
		<category><![CDATA[iphone]]></category>
		<category><![CDATA[job]]></category>
		<category><![CDATA[mac]]></category>
		<category><![CDATA[microsoft]]></category>
		<category><![CDATA[mobile]]></category>
		<category><![CDATA[network]]></category>
		<category><![CDATA[ntfs]]></category>
		<category><![CDATA[ocr]]></category>
		<category><![CDATA[office]]></category>
		<category><![CDATA[osx]]></category>
		<category><![CDATA[outlook]]></category>
		<category><![CDATA[paper]]></category>
		<category><![CDATA[pdf]]></category>
		<category><![CDATA[pgp]]></category>
		<category><![CDATA[reading]]></category>
		<category><![CDATA[rsync]]></category>
		<category><![CDATA[s510m]]></category>
		<category><![CDATA[scanner]]></category>
		<category><![CDATA[scansnap]]></category>
		<category><![CDATA[security]]></category>
		<category><![CDATA[software]]></category>
		<category><![CDATA[sysadmin]]></category>
		<category><![CDATA[timemachine]]></category>
		<category><![CDATA[txt]]></category>
		<category><![CDATA[vi]]></category>
		<category><![CDATA[vim]]></category>
		<category><![CDATA[vista]]></category>
		<category><![CDATA[visualbasic]]></category>
		<category><![CDATA[windows]]></category>

		<guid isPermaLink="false">http://instant-thinking.de/?p=1795</guid>
		<description><![CDATA[Meine delicious.com-Links vom 2. Juni bis zum 16. Juni: 10.5: Repair Time Machine after logic board changes &#8211; What to do with your Backup when you MAC changed&#8230; rsync-Backup der c&#8217;t unter Windows Vista &#8211; Paperkey f&#252;r das GnuPG Schl&#252;ssel-Backup &#8211; The joy of electronic books &#8211; Scanning around 3000 books and making them available [...]]]></description>
			<content:encoded><![CDATA[<p>Meine <a href="http://delicious.com/der_dennis" class="lidelicious">delicious.com-Links</a> vom 2. Juni bis zum 16. Juni:</p>

<ul>
<li><a href="http://www.macosxhints.com/article.php?story=20080128003716101" class="liexternal">10.5: Repair Time Machine after logic board changes</a> &#8211; What to do with your Backup when you MAC changed&#8230;</li>
<li><a href="http://www.valentin-funk.de/2008/11/03/rsync-backup-der-ct-unter-windows-vista/" class="liexternal">rsync-Backup der c&rsquo;t unter Windows Vista</a> &#8211; </li>
<li><a href="http://blog.kairaven.de/archives/1793-Paperkey-fuer-das-GnuPG-Schluessel-Backup.html" class="liexternal">Paperkey f&uuml;r das GnuPG Schl&uuml;ssel-Backup</a> &#8211; </li>
<li><a href="http://sealedabstract.com/?p=410" class="liexternal">The joy of electronic books</a> &#8211; Scanning around 3000 books and making them available in a personal ebook library. Awesome!</li>
<li><a href="http://www.viemu.com/viemu-vi-vim-word-outlook.html" class="liexternal">ViEmu for Word and Outlook</a> &#8211; is an innovative new product that provides vi/vim emulation for document processing in Microsoft Word, and for mail composing in Microsoft Outlook.</li>
<li><a href="http://mj12net.org/index.php/system-administrator-interview-cheat-sheet.html" class="liexternal">System Administrator Interview Cheat Sheet</a> &#8211; </li>
<li><a href="http://mobileopportunity.blogspot.com/2009/05/quick-history-of-software-platforms-how.html" class="liexternal">A quick history of software platforms: How we got here, and where we&#39;re going</a> &#8211; Well worth the read&#8230;</li>

</ul>
]]></content:encoded>
			<wfw:commentRss>http://instant-thinking.de/2009/06/16/quicklinks-vom-2-juni-bis-zum-16-juni/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

