요즘 각 웹사이트에서 스팸 게시물, 스팸 가입이 활개치고 있는 실정입니다..
그나마 있는 기본적인 스팸방지 프로그램인 "CAPTCHA"도 뚫렸다는 말들이 돌아다니고, 실제로 뚫렸다는 것에 대해 의견이 분분합니다.
왜냐면 기존 CAPTCHA 캡챠는 텍스트가 아닌 이미지이지만, 인식하기 쉬운 문자 탓에 문자인식프로그램을 돌리면 충분히 뚫을 수도 있다고 생각합니다.
바로 그때 "reCAPTCHA"라는 것이 등장합니다..
reCAPTCHA는 유명해서 다들 아실 거라고, 생각합니다.. 트위터,페이스북만 들어가도 reCAPTCHA 쉽게 볼 수 있습니다..
구글에서 reCAPTCHA를 인수해 현재 구글에서 운영하고 있지요.. 구글이 인수할 만큼 reCAPTCHA는 강력하게 스팸을 퇴치합니다..
또한, reCAPTCHA는 " 현재 접근중인 것이 사람인가 아닌가" 를 판별하라는 목적을 가지고 있어, 스팸 프로그램은 접근조차 못하겠죠?
신기하죠.. reCAPTCHA 원리는 도데체 뭘까요?
이것의 원리이자 비밀은 " reCAPTCHA가 입력하라고한 문자열" 에 있습니다..
reCAPTCHA는 두개의 단어혹은 숫자를 입력하라고 합니다..
근데 위 사진을 보면 첫번째 단어는 알아보기 힘들게 찌그려져 있고, 두번째 단어는 한번에 알아보기좋게 말짱하네요..
reCAPTCHA 도움말 (http://www.google.com/recaptcha/help)보면 "문자 디지털화 참여" 라고 쓰여있습니다..
사실 첫번째 단어는 종이책을 컴퓨터로 옮기는 과정(문자 디지털화)에서 컴퓨터가 판독해내지 못하는 단어입니다..
그럼 컴퓨터가 모르는 데... 이게 틀리건지 맞는 건지 모르지않나요? 그럼 막 적어도 모르겠네요..
네.. 맞습니다.. 첫번째 단어는 컴퓨터가 판독해내지 못한 단어이기에 사실 컴퓨터도 모릅니다..
그치만 두번째 단어는 컴퓨터도 아는 단어(판독성공 단어)이기에 그것이 맞는 지 틀린 지만 판별해냅니다..
그럼 기존 캡챠와 "reCAPTCHA"가 다른점이 없잖아요..?
아니요.. 분명히 다릅니다.. 두번째 단어를 맞춘 사람들이 첫번째 단어도 맞출 확률은 60% , 시간이 흘려 대부분의 사람들이 적은 첫번째 단어가 모두 같다면 컴퓨터는 "이 단어가 맞는 단어구나!"라는 99.9%확신을 하게 됩니다..
그렇게 확인된 판독불가 문자가 판독가능 문자로 바뀌게 되는 것이죠..
그래서 reCAPTCHA는 문자 디지털화에 많은 도움을 준다고 할 수 있습니다.. 그렇기에 무료로 제공하는 건지도 모르겠습니다..
reCAPTCHA를 각 웹사이트에 적용하는 방법은 https://www.google.com/recaptcha 에서 확인할 수 있습니다..
XE를 사용하시면 reCAPTCHA애드온( https://xe.conory.com/parket/20604 ) 을 적용하면 됩니다.