新しいを創造する知恵
2015.04.14

ログイン画面の変な文字?の入力はある事への貢献にもなっていた。

「CAPTCHA」という画像の文字を入力して、認証を行う機能には、セキュリティ対策だけでなく、世の中に役立つ取り組みにもなっていた。あの歪んだ読みにくい文字にこんな意味があったなんてΣ(゚д゚lll)


「CAPTCHA」ってどこかで見たり、聞いたりした事ありませんか?

きっとどこかで見ていると思います。

では、こんな画面を見たことありませんか?

CAPTCHA

出典:The Official CAPTCHA Siteより

 ブログのコメントやログイン画面等で見かけると思います。

 

『CAPTCHA』とは

“コンピュータと人間を区別するためのテスト”という意味の言葉から頭文字をとったものだそうです。

上記画像にある読みにくい文字は、厳密にはCAPTCHAそのものではなく「画像を使ったCHATPCHAのうちの一部」と表現できます。

アルファベットだけでなく、ひらがなやカタカナで書かれたものもあったりします。

 

文字を入力させる理由は

CAPTCHAはもともとbot(自動的に特定パターンの作業を行うプログラム)への対策として生まれたものだそうです。

botの例として、Web上の個人情報をあらゆる場所から自動的に収集するプログラムもbotと呼ばれます。

単純な作業をパターン化してくれるbotは良い事に使えば大変便利な機能ですが、悪意のあるbotも多々あったりするので、

「操作者がbotなのか人間なのか」を判断するための仕組みとして画像を用いたCAPTCHAが発達しました。

 

なぜ歪んだ文字があったりするのか

一つ目の理由

「単純にbotへの対策です。」

OCRというのは“光学文字認識”技術(画像から文字を認識する技術)を利用したbotにも対応できるよう、単純な文字の画像ではなく

「OCRで認識できないけど人間なら読める文字の画像」ということで、文字を歪めたり、重なったりした画像を使っています。

 

二つ目の理由

「本のデジタル化への貢献です。」

実はCAPTCHAを入力する度に、本のデジタル化へ貢献していたというのです。

あなたが入力している単語は実際にデジタル化されている本の中の、コンピュータが認識できなかった単語だそうです。

1単語ではなく2単語入力させるものを見かけると思います。その理由は、単語の一つは本から取り出した単語(スキャナで読み込んだもの)で、コンピュータはそれを何と読むのか知りません。何と読むのか分からないから、認証もできないのです。

だからもう一つ、システムが答えを知っている単語を提示しているのです。

CAPTCHAはどちらがどちらの単語かは指定せず、両方入力する事を求めます。

そしてシステムが答えを知っている単語を正しく読めたら、コンピュータは入力者が人間であると認識し、もう一つの単語も正しく読まれた可能性が高いと判断するのです。

そして、この過程を10人の異なる人々に繰り返してもらい、すべての人が同じように読んだとき、新しい単語がデジタル化されたことになるのです。

まとめ

ログインやコメントの投稿の度に、入力を求められるあの読みにくい文字も本のデジタル化に貢献できてると思えば、

ほんの少しだけでもイライラせずに入力できるかなと思います。

一つの役割しかなかった事に付加価値をつけて役立てる事は、何か他でも活用できそうだと思いました。

普段から何気なく行っている決まった作業にも何か付加価値がつけられたりすると良いですよね。

 

参考:あの「イラつく文字認証」のおかげで年間250万冊もの本がデジタル化されている