Converting massive e-book-collections with Calibre and GNU Parrallel

Calibre deals well with massive e-book collections, but it does not offer full text search (as far as I know). If you are on a Mac there is a decent search engine for your personal files built in, called Spotlight. However, Spotlight is not able to search the contents of EPUB or MOBI e-book files. This is why I decided to convert my collection to plain text.

Calibre offers the capability to bulk-convert a lot of books in parallel, but at least on my system it quite often froze after a couple of minutes. Calibre also lets you convert books from the command line with the ebook-convert command. Combined with a simple find and GNU Parallel it can be used to convert massive collections with a one liner:

find $your_library_location -type f -iname "*.mobi" | parallel --timeout 120 --progress "/Applications/calibre.app/Contents/console.app/Contents/MacOS/ebook-convert {} {.}.txt"

Parallel will try to saturate all the available CPUs on your system and can even scale out to other machines with a little more tweaking. The --timeout option will kill off any spawned sub-process that takes longer than the given ammount of seconds, which is nessecary, since sometimes the conversion seems to hang for no apparent reason. The option --progress will give you an idea how many jobs have been completed yet.

Parallel can be installed via the excellent homebrew project by running brew install parallel. The location of the ebook-convert command may vary on other systems, if I remember correctly Ubuntu sets it up correctly when installing Callibre via APT, so you can omit the path.

For me this works well enough and seems a little more robust than Calibres own job-scheduling mechanism. Hope this helps someone else.

Mit an Sicherheit grenzender Wahrscheinlichkeit

Im Keller eines Hauses, das von einer mehrköpfigen Familie bewohnt wird, stellt die Polizei einen PC sicher. Die Bewohner des Hauses kennen ihre Rechte. Weder Eltern noch die erwachsenen Kinder sagen was. Insbesondere nicht dazu, wem der Computer gehört und wer ihn nutzte.  Ein Polizeibeamter wertet den bemerkenswert leeren Rechner aus und findet Inhalte, die möglicherweise als Jugendpornografie strafbar sind. Außerdem entdeckt er etwas Musik, einige Youtube-Clips und vier, fünf Textdateien, in [...]

via Mit an Sicherheit grenzender Wahrscheinlichkeit

Fakt: Die Tücken der Überwachungstechnik » Von markus » netzpolitik.org

Die MDR-Sendung Fakt berichtete gestern über “Die Tücken der Überwachungstechnik”. In Deutschland ist Abhörtechnik im Umlauf, die womöglich mehr kann als zulässig. Konkret geht es um Technik der saarländischen Firma Syborg.

via Fakt: Die Tücken der Überwachungstechnik » Von markus » netzpolitik.org

Ohne Volumenbeschränkung, von wegen

Die Telekom darf für Internetanschlüsse nicht mehr mit Aussagen über hohe Übertragungsraten werben, ohne deutlich auf die Drosselung der Geschwindigkeit bei hohem Datentransfer hinzuweisen. Das hat das Landgericht Bonn nach einer Klage des Verbraucherzentrale Bundesverbandes (vzbv) entschieden. Die Versprechungen waren vollmundig: "Unsere schnellste DSL-Verbindung", "Luxus-Highspeed-Surfen mit bis zu 25 Mbit/s", "ohne Zeit- oder Volumenbeschränkung" – so pries die Telekom ihr Paket "Call & Surf [...]

via Ohne Volumenbeschränkung, von wegen

Keine Wellness für rechten Politiker

Dass Hotels und Fluggesellschaften mitunter einen robusten und mehr als fragwürdigen Umgang mit Minderheiten pflegen, kann man fast täglich in der Zeitung lesen. Vor allem Behinderte werden gern mal als Gäste zweiter Klasse behandelt – auch aus Sorge vor Beschwerden “normaler” Reisender. Es kann aber auch Menschen treffen, die zumindest äußerlich eher unauffällig sein dürften. So etwa den Vorsitzenden der NPD. Dem erteilte ein Hotel Hausverbot, als er zu einem von seiner Frau gebuchten Wellness-[...]

via Keine Wellness für rechten Politiker

Burglars Tip Off Police About Bigger Crime

I find this fascinating: A central California man has been arrested for possession of child pornography, thanks to a tip from burglars who robbed the man's property, authorities said. I am reminded of the UK story of a burglar finding some military secrets on a laptop -- or perhaps a USB drive -- that he stole, and returning them with a comment that was something like: "I'm a crook; I'm not a bloody traitor."

via Burglars Tip Off Police About Bigger Crime

Gema: Ohne uns keine iCloud in Deutschland

Bevor Apple iTunes mit Cloud-Unterstützung in Deutschland anbieten darf, bitten die Verwertungsgesellschaften erst einmal an den Verhandlungstisch. Apple hat noch nicht einmal versucht, mit der Gema zu reden. ( Gema, iCloud)

via Gema: Ohne uns keine iCloud in Deutschland

Senden Sie uns einen E-Postbrief

Mit einem kleinen Gewinnspiel macht die Deutsche Post auf Facebook (Eintrag vom 5. Oktober) für ihren E-Postbrief Reklame: Wir verlosen 3×2 Tickets für das Bundesligaspiel 1. FC Köln gegen Borussia Mönchengladbach am 25.11. im RheinEnergieStadion. Schicken Sie uns bis zum 31. Oktober einfach einen E-POSTBRIEF an fc-tickets@deutschepost.epost.de… Die PR hat die Post wahrscheinlich nötig, ist ihr doch neulich erst gerichtlich untersagt worden, den E-Postbrief als einsatztauglich für alle Rechtsges[...]

via Senden Sie uns einen E-Postbrief

Buchbranche fürchtet Einfluss der Piraten

Zur Eröffnung der Frankfurter Buchmesse hat Gottfried Honnefelder vom Börsenverein des deutschen Buchhandels vor dem wachsenden Einfluss der Piratenpartei und ihrer Positionen gewarnt. In seiner Rede (PDF-Datei) am Dienstagabend appellierte der Vorstand des Branchenverbands an die anderen Parteien, sich nicht "aus wahltaktischen Gründen einer kleinen Gruppe von lautstarken Netzaktivisten" anzunähern.

via heise

Der Staatstrojaner in dreieinhalb Minuten

Alexander Svensson beschreibt den Staatstrojaner und was der CCC über diesen herausgefunden hat:

via Der Staatstrojaner in dreieinhalb Minuten

Staatstrojaner: Piratenpartei will Rücktritt von Innenminister und BKA-Chef

Wenn die Vorwürfe des Chaos Computer Clubs zum Staatstrojaner stimmen, wollen die Piraten den Rücktritt von Hans-Peter Friedrich und BKA-Chef Jörg Ziercke. Auch die FDP bezeichnet die Software für die Onlinedurchsuchung dann als verfassungswidrig. ( Sebastian Nerz, Piratenpartei)

via Staatstrojaner: Piratenpartei will Rücktritt von Innenminister und BKA-Chef

PhoneGap soll Apache-Projekt werden

Facebook: Deine Daten gehören(!) uns. (Wirklich.)

Der Fall hat inzwischen sehr viel mediale Aufmerksamkeit bekommen: Der Österreicher Max Schrems hat erklärt, wie man Facebook dazu bringt, (alle) über einen gesammelten Daten herauszugeben. Man muss unter diesem Link als Grund für die Anfrage “Section 4 DPA” oder “Art. 12 Directive 95/46/EG” angeben und ein Foto / Scan eines gültigen Ausweisdokuments beifügen. Sobald Facebook nachgibt, bekommst du eine CD mit deinen Daten und einem Begleitschreiben zugeschickt. Dafür hat Facebook 40 Tage Zeit, a[...]

via Facebook: Deine Daten gehören(!) uns. (Wirklich.)

Wie Facebook den Logout simuliert.

Nachdem Facebook dank des Unabhängigen Landeszentrum für Datenschutz Schleswig-Holstein vor einigen Wochen in den Schlagzeilen stand und beschuldigt wurde mit dem Like-Button und seiner Trackingfähigkeit gegen deutsches Datenschutzrecht zu verstoßen, hat nun der Australier Nik Cubrilovic Interessantes herausgefunden: Wenn ein Facebook-Nutzer sich aus dem Netzwerk ausloggt, werden nicht alle erhaltenen Cookies gelöscht, sondern lediglich als “ausgeloggt” markiert und mit neuen Ablaufdaten versehe[...]

via Wie Facebook den Logout simuliert.

heise online - Schaar für Grundrecht auf Informationsfreiheit

Der Bundesbeauftragte für den Datenschutz und die Informationsfreiheit, Peter Schaar, verlangt ein im Grundgesetz festgeschriebenes Recht auf Akteneinsicht. Die Grünen wollen im Bundestag einen entsprechenden Antrag stellen.

via heise online - Schaar für Grundrecht auf Informationsfreiheit

Unglaublich: Petition gegen Vorratsdatenspeicherung sprengt 50.000er Marke

Am Wochenende waren wir noch etwas zurückhaltend und haben nicht wirklich dran geglaubt, dass wir bis heute die 50.000er Grenze bei der Petition gegen die Vorratsdatenspeicherung erreichen würden. Immerhin hatten da erst 25.000 Menschen die Petition unterzeichnet und es wurden nicht wirklich mehr. Aber eben wurde die wichtige Marke überschritten und damit haben wir eine Öffentliche Anhörung im Petitionsausschuss des Deutschen Bundestages gewonnen! Das Gute ist: Die Petition läuft noch weitere dr[...]

via Unglaublich: Petition gegen Vorratsdatenspeicherung sprengt 50.000er Marke

Android 2.3.6 entfernt Tethering

Superman vs. Google Plus [Cartoon]

[Source] Related posts: Superman in England [Cartoon] Batman vs. Superman’s Powers [Cartoon] Life Before Google [Cartoon]

via Superman vs. Google Plus [Cartoon]

Heise.de verletzt Facebook-AGB

Der Lacher des Tages kommt von Facebook. Die haben sich bei Heise.de beschwert, weil die wiederum eine Möglichkeit präsentiert haben, den Facebook-Sharebutton datenschutzfreundlich als “2-Klick-Lösung” in die eigene Seite einzubauen. Heise dazu: Facebook beschwert sich über datenschutzfreundlichen 2-Klick-Button. “Die Art und Weise wie Heise.de den Like Button eingebaut haben, verstößt gegen unsere Platform Policies” erklärte Tina Kulow von Facebook gegenüber heise online. In diesen Policies hei[...]

via Heise.de verletzt Facebook-AGB

One day my pretty… one day [Cartoon]

[Source: Explosm.net] Related posts: Wizards: Then and Now [Cartoon] Origami for Beginners [Cartoon] Geek Rule #27 [Cartoon]

via One day my pretty… one day [Cartoon]

Cyborgs: Schlauer, höher, weiter – die Mensch-Maschine

HR2 – Der Tag hat eine Sendung über Cyborgs gemacht: Schlauer, höher, weiter – die Mensch-Maschine. Menschen verfügen über unterschiedliche Begabungen, das ist ein Gemeinplatz. Aber manche sind auch dann noch überdurchschnittlich begabt, wenn sie eigentlich gehandicapt sind. So wie der Sprinter Oscar Pistorius, der Mann ohne Unterschenkel. Aber mit seinen High-Tech-Carbonfedern unter den Knien läuft er Bestzeiten. Im WM-Halbfinale ist er nun zwar ausgeschieden. Aber die Frage nach den Grenzen de[...]

via Cyborgs: Schlauer, höher, weiter – die Mensch-Maschine

Copyright: How long does it last?

[Source] Related posts: Microsoft Slams Google on Copyright Did Michael Moore deliberately break US copyright law? (Unofficial) Apple repair manuals now copyright-free

via Copyright: How long does it last?

Jede Menge ungespültes Geschirr

Spiegel online berichtet über die Bemühungen der Hamburger Polizei, die Autobrandstiftungen unter Kontrolle zu bekommen. Unter anderem gibt es eine  Einsatzgruppe “Brand”. Deren Mitarbeiter klingeln bei Personen von Interesse, betreten deren Wohnungen und führen “aufklärende” Gespräche. Dabei kann man offenbar sehr schnell ins Visier der Ordnungshüter geraten. Autor Bruno Schrep malt plastisch den Fall eines jungen Kochs aus, der unversehens Besuch uniformierten Beamten erhält. Sein einziges Ver[...]

via Jede Menge ungespültes Geschirr

Apple triumphiert: Verkaufsverbot für Samsungs Galaxy-Smartphones

Apple hat vor Gericht ein Verkaufsverbot für einige von Samsungs Android-Smartphones aus der Galaxy-Reihe durchgesetzt. Das Gericht folgte einem Antrag Apples und hat eine einstweilige Verfügung erlassen. Ein Verkaufsverbot für Samsungs Galaxy Tab 10.1 konnte Apple aber nicht erwirken. ( Ace, Samsung Galaxy S2)

via Apple triumphiert: Verkaufsverbot für Samsungs Galaxy-Smartphones

Wer umzieht soll der Runkfunkbehörde sagen warum

Das neue Rundfunkrecht, das die Ministerpräsidenten der Bundesländer sich ausgedacht haben, hat es in sich. Es regelt tatsächlich weit mehr als die Rundfunkordnung. Die ersten 16 der 27 Seiten des “Fünfzehnten Rundfunkänderungsstaatsvertrags” beschäftigen sich nicht mit dem Auftrag und den Aufgaben der öffentlich-rechtlichen Anstalten, sondern mit den Pflichten der Bürger. Die werden in dem Gesetzeswerk nur noch “Beitragsschuldner” genannt. Zu den Pflichten der bundesdeutschen Beitragsschuldner [...]

via Wer umzieht soll der Runkfunkbehörde sagen warum