Artikelformat

Das Ding mit dem Captcha Breaking

Bei diversen Web2.0 Seiten finden sich zum Spamschutz Captcha’s. Um nach wie vor erfolgreich mit eigenen Spam- und Linkbuilding Tools arbeiten zu können muss nun dringend eine Lösung her um dieses lästige Übel zu umgehen. Der folgende Artikel handelt von meinen Erfahrungen und Lösungen zum Thema Captcha Breaking.

Die nahe liegende Lösung: OCR

Dir Abkürzung OCR steht für Optical Character Recognition, also die “normal” Texterkennung, die wir bereits von diversen Scanner Tools kennen wenn wir handschriftliche Texte digital editieren und speichern möchten. Viel schwerer als meine Handschrift ist selten ein Captcha zu lesen 🙂

Sich ein derartiges Tool selber schreiben zu wollen ist je nach Art des Captcha’s unterschiedlich schwer. Fest steht, dass man es nicht schaffen wird einen Captcha Breaker zu schreiben der eine Vielzahl unterschiedlicher Varianten lösen kann da die verschiedenen Ansätze doch sehr unterschiedlich sind, schon beim Entfernen der encrypting Parameter wird man auf Probleme stoßen. Hat man jedoch erst einmal seinen Basis Code ist es oft sehr einfach eine neue Variante hinzu zu fügen. Eine gute Grundlage für die Entwicklung einer eigenen Lösung bietet dieses Tool. Die HowTo ist außerdem sehr aufschlussreich und bietet weit mehr Info’s zu dem Thema als ich sie hier bieten möchte.

Man kann diese Programme auch kaufen doch leider sind diese recht teuer und lösen immer nur ein bestimmtes Captcha. Ein weiterer Nachteil ist das ich ausschließlich Chinesische Anbieter gefunden habe und da doch ein wenig Angst um mein Geld hätte.

User Generated Captcha Breaking

Etwas tricky aber es funktioniert. Die Grundlage ist schnell erklärt: Du zeigst auf einem deiner Projekte dem User ein Captcha, das er eintippen muss um irgend etwas zu bekommen. Doch dieses Captcha ist natürlich nicht von dir, sondern ein für dich zu lösendes. Nun hat dieser Ansatz den Nachteil das du eine Menge Traffic benötigst, damit das auch umsetzbar ist, außerdem muss der User natürlich den Willen haben für “Etwas” einen Captcha Code einzugeben. Gut funktioniert diese Variante im Porno und Warez Bereich, ich denke jeder kann sich vorstellen wie ich das meine.

Captcha Breaking made in India

Diese Möglichkeit ist wohl die Einfachste. Es gibt verschiedenste Unternehmen, die das Captcha Breaking als Dienstleistung anbieten. Hier sendet man einfach nur per API das Bildchen hin und je nach Unternehmen bekommt man in wenigen Sekunden den Code zurück. Doch wer jetzt denkt die Leute hätten einfach nur sehr gute Tools irrt. Vielmehr ist es so das diese, meist in Indien und China ansässigen Unternehmen, eine Horde Angestellter in einem Saal sitzen haben und diese den ganzen Tag nichts anderes machen als unsere Captcha’s zu lösen. Die Lösungsrate liegt zwischen 70% und 90%. Die Preise gehen von 2$ per 1000 Breaks bei DeathbyCaptcha bis 40$ per 1000 Breaks bei Captcha King.

Resümee

Da ich selber lieber meine Tools optimiere als mich um eine gute OCR Lösung zu kümmern war die Entscheidung klar auf der Seite eines indischen Unternehmens. Die Kosten sind für unsere Verhältnisse wirklich zu vernachlässigen und die Lösungsrate ist höher als bei jeder Alternative. Ich möchte das Unternehmen welches ich gewählt habe hier nicht schreiben da jeder neue Kunde die Performance drückt, aber ich denke hier sind alle des Googlens mächtig 🙂


Schreibe einen Kommentar

Pflichtfelder sind mit * markiert.