reCAPTCHA:一次一个字地数字化图书 google的绝妙创意

像下图的验证码界面相信不少网友见过吧?

recaptcha

这个是Google和很多其它网站都在使用的验证码界面。我很久之前就遇到过了, 但我是到今天才知道它叫reCAPTCHA, 并且这背后的有藏着一个大阴谋--Google正在用它一次一字地数码化传统的打印在纸上的报纸和图书!

每次reCAPTCHA会显示两个单词。 这两个单词中有一个google是认识的, 另一个是google用扫描仪从图书或报纸上扫描出来,用计算机识别不出来的难字。 用户在填验证码后,google会根据那个已经认识那个单词的输入准确性判断用户是不是机器人。如果用户通过测试, google就把用户录入的另一单词作为对应难识别字的正解。。。 当然,google不会只相信一个人的判断, 它会把这个难词多次交给不同的人去识别, 然后统计分析出最可能的正解。 这样的验证验被提交一次, 实际上就是在帮google录入一个图书的文字!

CAPTCHA验证码本来是在垃圾信息同机器人横飞的年代,不得以被逼出来的一种费财费力的东西。 没想到google会将之变废为宝, 利用它来信息化图书。 这可人类省下多少精力, 又可为自己带来多少利润呢?

我在想: 现在很多人花钱到健身房去健身,其实上在里做了很多无用功, 要是能用类似这些健身的功力来发电, 用这些电可以从井抽多少的水? 又可以节省多废气的排放呢?

google关于reCAPTCHA的更多说明(英文):
http://www.google.com/recaptcha/learnmore

reCPTCHA是开放api的。你可以在自己的网站上使用reCAPTCHA。 从上面的链接进去可以申请。

转载请注明: 转自船长日志, 本文链接地址: http://www.cslog.cn/Content/rechaptcha-google/

此条目发表在 信息处理 分类目录,贴了 , , , 标签。将固定链接加入收藏夹。

reCAPTCHA:一次一个字地数字化图书 google的绝妙创意》有 1 条评论

发表评论

电子邮件地址不会被公开。 必填项已用 * 标注

*

您可以使用这些 HTML 标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>