reCAPTCHA taugt als momentan einziger Captcha-Ansatz
Geschrieben von Gregor Nathanael Meyer um 01:1524 05 2008
Viel wurde schon über Captchas geredet. Captchas sind diese allgegenwärtigen Bilder, die man entziffern muss, um irgendwo etwas im Netz zu nutzen und dabei nachweisen soll, dass man ein Mensch und kein Computer ist. Mitunter gibt es dabei so Stilblüten, wie die zwischenzeitlich bei Rapidshare eingesetzten Captchas, die ich beim besten Willen nicht lesen konnte. Erst der (korrekte) Vorschlag von Cryptload lies mich nachvollziehen, welche Buchstaben da wohl gemeint waren. Gut, dass ich die nur selten zu Gesicht bekomme. Irre. Da scheitert der Mensch und die Computer können es fehlerfrei lesen. Was für eine Umkehrung des eigentlich Gewollten.
Auch ich sichere meine Kommentarfunktion neben der Zwangsmoderation nach einigen Tagen mit einem Captcha ab. Allerdings sind meines Erachtens alle automatisch generierten Captcha-Ansätze zum Scheitern verurteilt, weil die Anti-Captcha-Programme auf die Algorithmen binnen kürzester Zeit angepasst werden und gleichzeitig werden die Dinger mit jeder Iteration für Menschen unleserlicher. Nicht so bei reCAPTCHA, das gerade die von Leseprogrammen nicht entzifferten Wörter nutzt und dabei gleichzeitig einem Bücher-Digitalisieren-Projekt die Entzifferung dieser Wörter liefert. Eine geniale Win-Win-Situation. Mir fallen nur drei Angriffe auf dieses Prinzip ein: Eine bessere OCR, als die von diesem Projekt eingesetzte. Klar, auch ein Angriff auf die konkrete Implementierung ist immer drin. Aber vor allem (schlecht) bezahlte Anti-Captcha-Farmen in China stellen eine echte Gefahr für jedes Captcha dar: Selbst wem die westliche Schrift nicht geläufig ist, der braucht maximal einen Tag Training, um die 26 (bzw. 52) Schriftzeichen halbwegs sicher zu erkennen. Und das reicht: Schon bei angenommenen 10 Captchas pro Minute und einer Erkennungsrate von vielleicht 30% kostet eine Entzifferung bei einem (für China nicht wirklich geringen) Stundenlohn von 3,60€ lediglich 2 Cent. Dreht man an etwas an den Parametern (ich habe sie bewusst teuer angesetzt), kommt man locker unter 1 Cent pro Captcha.
Spätestens wenn es soweit ist, müssen wir uns wirklich eine ganz neue Idee einfallen lassen: Der TKP strebt bei richtiger Auswahl der Platzierung und zu diesen Kosten gegen Null.
Ich komm da jetzt übrigens drauf, weil heute ein Bot aus Thailand offensichtlich 50 mal vergeblich versucht hat, an meinem reCAPTCHA vorbei zu kommen. Ein gutes Gefühl. Ich erfreue mich so lange daran, wie es geht. Noch funktioniert es ja gut.
Kategorien : Web-hinteres-Ende
Trackbacks : Keine Trackbacks »
Short-URL: http://spackblog.de/489
