标签归档:创意

reCAPTCHA:一次一个字地数字化图书 google的绝妙创意

像下图的验证码界面相信不少网友见过吧?

recaptcha

这个是Google和很多其它网站都在使用的验证码界面。我很久之前就遇到过了, 但我是到今天才知道它叫reCAPTCHA, 并且这背后的有藏着一个大阴谋--Google正在用它一次一字地数码化传统的打印在纸上的报纸和图书!

每次reCAPTCHA会显示两个单词。 这两个单词中有一个google是认识的, 另一个是google用扫描仪从图书或报纸上扫描出来,用计算机识别不出来的难字。 用户在填验证码后,google会根据那个已经认识那个单词的输入准确性判断用户是不是机器人。如果用户通过测试, google就把用户录入的另一单词作为对应难识别字的正解。。。 当然,google不会只相信一个人的判断, 它会把这个难词多次交给不同的人去识别, 然后统计分析出最可能的正解。 这样的验证验被提交一次, 实际上就是在帮google录入一个图书的文字!

CAPTCHA验证码本来是在垃圾信息同机器人横飞的年代,不得以被逼出来的一种费财费力的东西。 没想到google会将之变废为宝, 利用它来信息化图书。 这可人类省下多少精力, 又可为自己带来多少利润呢?

我在想: 现在很多人花钱到健身房去健身,其实上在里做了很多无用功, 要是能用类似这些健身的功力来发电, 用这些电可以从井抽多少的水? 又可以节省多废气的排放呢?

google关于reCAPTCHA的更多说明(英文):
http://www.google.com/recaptcha/learnmore

reCPTCHA是开放api的。你可以在自己的网站上使用reCAPTCHA。 从上面的链接进去可以申请。

发表在 信息处理 | 标签为 , , , | 一条评论