国外很多下载网站使用以下验证码,其实是谷歌提供的reCAPTCHA服务(链接),可以免费申请使用。
#Jimmy Liye 翻译了谷歌reCAPTCHA的部分描述(原文:放这个验证码):
验证每个人每天都看到代码,但你是否认为你每不耐烦地输入一个单词,你就为人类做出了一点贡献?
CAPTCHA,或用于区分计算机和人类的全自动公共图灵测试,是我们每天在网上冲浪时都能看到的东西,除了防止垃圾邮件注册或评论之外,它还有其他作用吗?来自 Google 的 ReCAPTCHA(上图)告诉我们,您实际上可以为人类做出贡献。
题外话:现在OCR的读取效率真的不高。下图可以说明问题。
就是这样,某天某台机器扫描了一本书,想把它转成电子版:
结果是这样的:
Hreckinridge' 和 Lane 民主党人在最近的东部建议中鼓起勇气,[xxxxxxxxxxx] 积极参加竞选活动:最初支持 DonoLea 的几位著名民主党人正在站出来。对于另一名助手,显然在联邦 [xxxxxxxx] 的 [xxxxxxxx] 之下。最近发表了一份致 1ifornia 全国民主党的讲话,敦促该党支持 HaeeslipslDas,这显然加强了 [xxxxxxxxx] 的助手:它由 65 名民主党人签署,其中许多人在党,其中 22 人是联邦公职人员,[xxxxx] 更多人是联邦赞助的接受者,其他人代表大量政客提供文件 [xxxx][xxxxxx] mTheDcu8las 民主党人也很活跃 爱尔兰和德国的投票将大多是和ths#党的支部一起去,但是是[xxxxxxxxx]到[xxxxxxxx][xxxxx][xxxx][xx]越强。
到目前为止,有 17 家 IT 报纸宣布支持 DonGres,13 家支持 Base$-IaaIDGS,9 家仍然不置可否,甚至有可能采取任何一种方式。在这种情况下,共和党人怀有不无道理的希望,即民主党的分歧可能如此平等、平衡,以至于给予州 [xx] LIaCOLV。相同的 [xxxxxxx] 贝尔和埃弗雷特会议已在该州的不同地区举行,但到目前为止,该党并没有表现出太多级别的悲伤 ale air en。
这是因为原书质量比较差:
看到这个,电脑傻眼了,吐出一堆这个东西:
' letz-1- rrk fit: 1' .在其对 Vc ,rt, cann 为 tlm yc H_ tcr,la, .n。 '二; , arc ti:( h of thc 1",ats that to ltc rc: ,;. , I; ., l: rel!;n. tani., , ./olio, IJuteilu, . 1!'i./_ ;lr”n. Iiam! Jr .r. F'l,nr_.Z.._%i;;, ,, : rt-Irn: am/ tf.rri.:, t?m steamer as a tr nW r . Uu ,tin;t, c ac?1 1",at firm/a t;nn, accor.liu; to .t rn. 'Cl.w r. wu ru lm:nui MistinW /y in u;th, - .ink ;:,k 至于“w ax 1111, :111(I vle:iR a of ;: (,am( into, mnr r-, tm if tlm wo r(uu.in:' of t?u : la?:Iv. \' c : ol in thc , ucr:atic , , Tlau :; will h:aw tu-li.r \. '1'Im yap?tts Il ,,n an,/I, , rr:l.r, (, t tf,is r:ity, 从它开始,用 lu:rtic: ol \ 1- e:l.k.
你能理解吗?无论如何,我不明白。出现验证码的目的是为了改变它。此图解释了它的工作原理:
1、我们首先扫描了一本书,其中包含大量单词的书籍
2、我们发现计算机无法识别的单词,这些单词可能是不同的字体。当然,损坏的程度也与书的年代和扫描质量有关。
3、为了让这些验证码更安全,我们将把它弄得更扭曲,并在上面加上一条线。
4、验证码是这些词中的两个。
在它的帮助下,第二张图片上面的文字会变得清晰出多(但还是有点不对劲):
纽约州游艇中队昨天下午在纽波特的年度巡游中进入港口。以下是停泊在这里的船只的名称:Jessie、gera loliv erelun Annie、Mannering、Julia、Bonita、Magic wut、Rambler、floumblie、Henrietta、Sea-Drift 和 Maria,轮船 America 为招标船。根据习惯,每艘船在停泊时都开枪。这些报告在该市清晰地听到,引起了对“发生了什么”的相当多的询问,相当多的乐观人士来到我们的办公室询问这些枪是否是大西洋电缆成功铺设的宣告信号。我们总是给出否定的回答。该中队将于今天启程前往纽波特。华盛顿和这座城市的游艇,从它开始,与纽黑文人的聚会。
可能有人要问了,既然机器看不懂,那他怎么判断你是对是错呢?我一开始也有这个问题,谷歌是这样解释的:
两个验证码一个是正确的百姓网验证码有什么用,并且已经过人工审核,另一个是错误的百姓网验证码有什么用,机器无法读取。的。当您丢失正确的一个时,我们将默认为另一个。这样,每输入一个验证码,就为人类的知识宝库加了一个字。
简而言之,reCAPTCHA 的价值在于它为广大用户找到了一种巧妙的方式来帮助进行图书转录。当要求用户输入验证码时,用户可以看到两个字:一个是已知字(控制字),另一个是 OCR 软件无法确认的字。一旦部分用户正确回答了同一个模糊词,该词就会被转换为控制词,OCR软件会记住这个词。
来自 Omelette 和 Yiyan.com。