Recaptcha database nasıl oluşturuluyor?

Recaptcha database nasıl oluşturuluyor?

28 Aralık 2010 0 Yazar: Cem Kefeli

Recaptcha hepimizi kullanmış
Bugün enteresan bir şey dikkatimi çekti: Meğer ki Recaptcha’nın veritabanını biz oluşturuyormuşuz da haberimiz yok! Recaptcha nedir ne değildi bilmeyenler için özet geçiyorum hemen.. Recaptcha form verilerinin post edilmesi aşamasında robot yönlendirmeleri engellemek için oluşturulmuş ve kullanıcının insan olduğunu kanıtlamasını sağlayan bir web öğesi. Böylece spam comment lerin, postaların ve diğer spam içerikli formların daha oluşturulmadan öldürülmesi sağlanmış oluyor.

Peki Recaptcha bizi nasıl kullanıyor?
İşte aslında asıl soru bu. Sizin karşınıza iki metin görüntüsü çıkarıyor Recaptcha ve bunları doğrulamak için kutucuğa girmenizi istiyor. Fakat aslında girdiğiniz kelimelerden birisini kendisi de bilmiyor ne olduğunu. Bilmediği kelimenin sağdaki mi soldaki mi olduğunu ise siz bilmiyorsunuz ama o biliyor. Dolayısı ile kelimelerin ikisini de doğru girmeye çalışıyorsunuz formu post edebilmek için. Eğer Recaptcha’nın anlamını bildiği kelimeyi siz doğru girerseniz diğerine bakmıyor zaten. Çünkü anlamını kendisi de bilmiyor. Fakat anlamını bilmediği kelime için de sizden bir yanıt almış oluyor. Bunu onbinlerce hatta yüz binlerce kişi için yaptığını düşünürseniz ise ortaya çok zekice bir proje çıkmış oluyor. Bizden topladığı cevaplar üzerinden bir istatistik çıkararak metnin olması gereken cevabını ise belirlemiş oluyor. Sallıyorum eğer 100.000 adamdan 85.000’i yukarıdaki image de sağda görünün metin için inquiry diyor ise bu doğrudur olarak kabul ediyor. Recaptcha bu durumu şöyle anlatmış.

But if a computer can’t read such a CAPTCHA, how does the system know the correct answer to the puzzle? Here’s how: Each new word that cannot be read correctly by OCR is given to a user in conjunction with another word for which the answer is already known. The user is then asked to read both words. If they solve the one for which the answer is known, the system assumes their answer is correct for the new one. The system then gives the new image to a number of other people to determine, with higher confidence, whether the original answer was correct.