ネットを使った大規模共同作業 (TEDTalks)

Luis von Ahn / 青木靖 訳
2011年4月

(CAPTCHAの画像)こんな風にゆがんだ文字を読んでフォーム入力をしたことある人? すっごく煩わしいと思った人は? やっぱりみんなそうですよね。考案したのは私です。(笑) まあ、考案者の1人ですね。

これはCAPTCHAと呼ばれています。これの目的は、入力しているのが確かに人間で、何百万回もフォームを送信するように作られたプログラムではないと確認するためです。どうしてこれがうまくいくのかというと、目の見える人であればこんなゆがんだ文字でも問題なく読み取れますが、コンピュータにはまだそれができないからです。例えばチケット販売サイトのチケットマスターがユーザにゆがんだ文字を読ませるのは、一度に何百万枚もチケットを注文するプログラムをダフ屋に作らせないためです。

CAPTCHAはネットの至る所で使われ、あまりに多く使われているので、ランダムに選ばれた文字列が不運な結果になることがあります。これはYahoo!のユーザ登録ページの例ですが、ランダムな文字列がたまたま“WAIT”(待て)という意味ある単語になっています。ここで傑作なのはYahoo!のヘルプデスクが20分後に受け取ったメッセージです(「どうなってるんでしょう? 20分以上待っても何も起きないんですが?」——笑)。この人は待たなきゃいけないと思ったようです。しかしそれも、この人ほど不運ではないでしょう(“RESTART”(やり直せ)と表示された画面——笑)。

CAPTCHAは私たちが10年以上前にここカーネギーメロン大学で開発し、広く使われるようになりました。次に、その何年か後に作ったCAPTCHAの進化形の話をしましょう。これはreCAPTCHAと呼んでいるもので、ここカーネギーメロン大学でやり始めて、それをベンチャー企業にしました。そして1年半ほど前にGoogleがその会社を買収しました。

そのプロジェクトがどう始まったかですが、あるすごいことに気づいたのがきっかけでした。CAPTCHAは世界中の人によって毎日2億回も入力されているのが分かったのです。最初このことを聞いて、自分の研究成果の影響の大きさに随分誇らしく思えたのですが、それから申し訳ない気持ちになりました。それというのも、CAPTCHAの入力には毎回10秒ほど時間を無駄にすることになりますが、これを2億回と掛け合わせると、人類は全体としてこの煩わしいCAPTCHAへの入力のため、毎日50万時間も無駄にしているわけです。申し訳ない気にもなります。(笑)

ある意味Webの安全に貢献しているCAPTCHAを単になくしてしまう訳にはいかないのですが、この労力を何か人類の役に立つことに利用できないかと考えました。どういうことかと言うと、CAPTCHAに入力する10秒間で人の脳は実はものすごいことをしています。コンピュータには未だできないことです。その10秒でユーザに何か有益な作業をさせられないか? 言い換えると、現在のコンピュータでは解けない巨大な問題を10秒分の断片に分割して、CAPTCHA入力の際人間に解かせられないかと考えたのです。答えはイエスで、それが私たちの今していることです。

実はCAPTCHAを入力するとき、皆さんは人間だと証明するだけでなく、本の電子化にも貢献しているのです。その仕掛けを説明しましょう。本の電子化プロジェクトはいろいろあって、Googleもやっていますし、インターネット・アーカイブでもやっています。Amazonも今やKindleで本を電子化しています。それには、まず古い本を取り上げて・・・こういう形のあるやつですが・・・あの、見たことありますよね? 本っていうんですけど? (笑) まず本を選んで、それをスキャンします。

本のスキャンでは各ページのデジタル写真を撮ります。すべてのページについて文字部分を画像にするわけです。次にその画像の中の語をコンピュータで解読する必要があります。そのためにOCR(光学文字認識)という技術を使います。文字を写真に撮って、写真の中の文字を読み取ろうとするわけです。問題はOCRが完璧ではないということで、とくに文字がかすれたり、ページが黄色くなっているような古い本では、OCRで読めない語がたくさん出てきます。50年以上昔に印刷されたような本では、語の3割はコンピュータで読み取れません。それで私たちがやっているのは、コンピュータで認識できなかった語をCAPTCHAの入力をする人に読んでもらうということです。

皆さんがCAPTCHAの入力をするときに表示される文字は、電子化中の本でコンピュータが認識できなかった部分なのです。この頃では語が1つでなく2つ出てくるようになっていますが、1つはシステムが本から取ってきたもので、コンピュータが読めなかったものを出しています。正解を知らないので、ユーザの入力が正しいのか分かりません。それで確認のためにもう1つ正解の分かっている問題を出します。どっちがどっちかは言わず、両方入力してもらいます。正解の分かっている方の問題に正しい答えが入力されたら、入力しているのは人間で、もう一方の入力も正しいだろうと期待できます。これを違う人で10回ほど繰り返して入力がすべて一致していたら、本の1語が新たに電子化されるわけです。

それがこのシステムの仕組みです。このシステムを公開したのは3、4年前ですが、すでに多くのWebサイトが、時間を無駄にする古いCAPTCHAから、本を電子化する新しいCAPTCHAに切替えています。だからチケットマスターでチケットを買うときも、皆さんは本の電子化に貢献しているのです。Facebookで友達の追加や挨拶をするときも、何かの本の電子化に貢献しているのです。Twitterをはじめとする35万のサイトがreCAPTCHAを使っています。reCAPTCHAを使っているサイトは非常に多く、1日に電子化される語の数は相当なものになります。1日に1億語、1年では本にして250万冊分にもなります。それがすべて1度に1語ずつ、人々によるCAPCHA入力だけで行われているのです。(拍手)

毎日それほど多くの語を扱っているので、おかしなことも起こります。今はランダムに選ばれた2つの単語を繋げて出しているので、余計おかしなことが起きやすくなっています。たとえばある時「クリスチャン」という語が出ました。これ自体おかしいことは何もありませんが、別のランダムに選ばれた語と組み合わせるとまずいことになり得ます。こんな風に(“悪しき クリスチャン”というCAPTCHA)。さらに不運なことに、この文字が表示されたのは、たまたま「神の国の大使館」というWebサイトでした。まずっ。(笑) もう1つまずかった例は、民主党議員ジョン・エドワーズのサイトです(リベラル派のサイトで“くそ リベラル”と表示されている——笑)。誰彼となく侮辱して回っているわけです。

もちろん侮辱ばかりというわけではありません。ランダムに選んだ2つの語を出しているので、何か面白いものになることもあります。実際これはインターネット上で大きなミームになっていて、何万という人がこの「CAPTCHAアート」で遊んでいます。お聞きになったことのある人もいるでしょう。どんなことをするかというと、インターネットを使っていてCAPTCHAで何か変なものが出たとします。たとえば「見えない トースター」とか。とりあえず画面コピーを取って、それからもちろんCAPTCHAの入力をします。本の電子化にまずは貢献するためです。それからCAPTCHAの画像に関連する絵を描き加えます(宙に浮いているトーストの絵)。これが遊び方です。こういう作品が何十万とあります。中には可愛らしいのもあります(拳を握りしめた赤ん坊の写真と“それを 握りしめた”というCAPTCHA)。もっとおかしいのもあります(赤ら顔のワシントンやフランクリンの絵と“ラリってる 建国者たち”というCAPTCHA)。この「古生物学的 シャベル」みたいに、ラッパーが登場するやつもあります(化石発掘現場前に立つラッパーの写真 [訳注 シャベルの綴りがラッパーの使う-izzleスピークになっているのでラッパーで出てきている])。

次にこの数字(750,000,000)はreCAPTCHAについて私がとても嬉しく思っている点で、reCAPTCHAを通して本の電子化に多少なりとも貢献している人の数は7億5千万人に上ります。世界人口の10%以上が、人類の知識のデジタル化に貢献しているのです。このような大規模な数字こそが、私の研究の原動力になっています。こんな疑問を持ったのです。人類が達成した偉業、人々の協力によって為された歴史的大事業に目を向けてみると、エジプトのピラミッドにしても、パナマ運河にしても、月に人を送ることにしても、興味深い共通点があります。いずれも携わった人の数が同じで、不思議なことにどれも10万人によって成し遂げられているのです。その理由は、インターネット以前の時代には、10万より多くの人を協調させるのは資金の有無にかかわらずそもそも不可能だったのです。しかしインターネットのおかげで、人類の知識の電子データ化には7億5千万もの人が参加しているわけです。私の研究の契機となった疑問は、10万人で月に人を送れるのなら、その千倍の1億人では何ができるだろう、ということです。

この疑問から出発して、いろんなプロジェクトに取り組みました。中でも特にワクワクしているものについてお話ししましょう。1年半ほど密かに取り組んできて、まだ公開していませんが、Duolingoという名前で、公開前なのでどうか内密に。(笑) みなさん信頼していますから。このプロジェクトが始まったのは、院生のセベリン・ハッカーにある問いを投げかけたときでした。これがセベリン・ハッカー、私のところの院生です(フクロウの面をかぶっている男の写真)。ちなみに聞き間違いじゃなく本当に「ハッカー」という名字なんです。私は彼に聞きました。「1億人を使ってWebを無料で各主要言語に翻訳しようと思ったら、どうすればいい?」

この質問にはいろいろ考えるべきことがあります。第一にまずWebを翻訳するということ。現在Webでは様々な言語が使われていますが、大きな部分を英語が占めています。英語を知らなければその情報にアクセスはできません。しかし他の言語の部分もたくさんあって、その言語を知らなければそれにアクセスすることはできません。だからWebの全体、少なくともその大部分を主要なすべての言語に翻訳したい。それが私のやりたいことです。

コンピュータで翻訳したらいいと思う人もいるかもしれません。機械翻訳でいいのでは? 今や方々で機械翻訳が使われるようになっています。Web全体をそれで訳してしまったら? 問題は精度が不十分だということです。この先15〜20年は駄目でしょう。たくさんの間違いをします。仮に間違っていなかったとしても、いつも間違ってばかりいるので信頼していいのか分かりません。

機械で翻訳されたものがどんなものか例をお見せしましょう。これはあるフォーラムの投稿で、JavaScriptについての質問をしています。日本語から英語に機械翻訳されています。読んで頂ければと思いますが、この人は最初に機械翻訳であることを謝っています。次の文は質問の前置きで、何かの説明をしています。JavaScriptの質問だということをお忘れなく(「よくヤギ時にインストールするエラーがゲロになります」)。それから質問の最初の部分が来ます(「風や竿やドラゴンのようになるのは何回ですか?」)。次は私のお気に入りの部分です(「これは父の石への侮辱でしょうか?」)。そして最後が極めつけです(「あなたの愚かさを謝ってください。ありがとうがいっぱいです」)。機械翻訳はまだ不十分だということです。元の話に戻りましょう。

Web全体の翻訳をしてくれる人が必要です。さて次の疑問は「別にタダでなくてもいいのでは?」ということでしょう。Web全体をプロの翻訳家にお金を払って翻訳してもらえばいい。そうしてもいいかもしれませんが、あいにくとものすごくお金がかかります。たとえば巨大なWeb全体からすればほんの小さな部分、Wikipediaの英語版をスペイン語に訳すとしましょう。Wikipediaにはスペイン語版もありますが、英語版にくらべたらずっと小さく、サイズにして20%くらいしかありません。残りの80%をスペイン語に翻訳しようと思ったら、少なくとも5千万ドルはかかります。甚だしく搾取された国にアウトソースした場合でそうなんです。プロの翻訳というのは高くつくのです。それで私たちがやろうとしているのは、Webの各言語への翻訳を1億人の人にタダでやってもらうということです。

そうしたときにすぐ直面する大きな壁が2つあります。1つはバイリンガルの不足です。インターネット利用者に翻訳ができるほどのバイリンガルがそもそも1億人もいるのか分かりません。これは大きな問題です。もう1つの問題は動機付けの欠如です。どうすればWebをタダで翻訳するよう動機付けられるのか? 通常はお金を出して翻訳してもらいます。どうすればタダでやりたくなるのか? Webの翻訳を考え始めてすぐ、この2つの問題にぶつかりました。それから、2つの問題を同時に解決できる方法があることに気づきました。一石二鳥の方法があるのです。翻訳を何億という人がやりたがることに変え、それがバイリンガル不足の問題の解決にもなるということ。それは語学教育です。

今日、外国語を学習している人は12億人以上います。みんな本当に外国語を学びたがっているのです。学校で勉強させられるからというばかりではありません。たとえばアメリカだけでも、外国語学習ソフトに500ドル以上使う人が5百万人以上います。みんな本当に外国語を習いたがっているのです。それで私たちがこの1年半取り組んできたのは、DuolingoというWebサイトで、その基本的な仕組みは、みんなが外国語をタダで学び、同時にWebの翻訳もするということです。つまり実践を通して学ぶわけです。

初心者に対してはごく単純な文を提示します。Webにはもちろん使える文がふんだんにあります。すごく単純な文と、それぞれの単語の意味が提示されます。翻訳しながら、他の人はどう訳しているか見て、外国語を学んでいきます。上達するにつれ、より複雑な文が提示されるようになります。しかし実践して学ぶという点はいつも変わりません。

この方法の何がすごいかというと、実際非常によく機能するということです。何より、みんな本当に外国語を学びたがっています。システム構築が済んでテスト中ですが、本当に外国語を学ぶことができます。優れた外国語学習ソフトを使った場合に劣らず上達し、本当に外国語を身に付けているのです。しかも同様に上達できるだけではありません。はるかに楽しく学べるのです。Duolingoでは本物のコンテンツを使って学ぶからです。作り物の文章で学ぶのではなく本物のコンテンツで学ぶ方が本質的に興味深いものですし、本当に外国語を学ぶことができます。

それだけでなくさらに驚くのは、このサイトから得られる翻訳は、彼らが初心者であるにもかかわらず、プロの翻訳者に劣らず正確だということで、驚くほどです。例をお見せしましょう。これはドイツ語から英語に翻訳された文章です。一番上がドイツ語、真ん中がプロの翻訳家による英訳で、1語につき20セント払っています。一番下がDuolingoユーザによる英訳で、彼らは元々ドイツ語は全く知りませんでした。ほとんど完璧なことがお分かりになると思います。プロの翻訳家並の翻訳にするためちょっとした仕掛けをしてあります。複数の初心者の翻訳から良い所を取って組み合わせているのです。

しかし組み合わせているのにかかわらず、このサイトでは翻訳を非常に早く行えます。それでWikipediaを英語からスペイン語に翻訳するのにかかる時間を見積もってみました。これは5千万ドルに値する仕事だということを思い出してください。Wikipediaをスペイン語に訳すには、アクティブユーザ10万人なら5週間でできます。アクティブユーザ百万人なら80時間です。これまで私のプロジェクトはどれも数百万のユーザを得ていたので、このプロジェクトでも非常に早い翻訳ができるようになると期待しています。

Duolingoの最も刺激的な点は、語学教育に公平さをもたらすビジネスモデルだということです。何が問題だったかというと、今までの語学教育のビジネスモデルは学習者にお金を払わせるということです。つまりロゼッタストーンに500ドル払うわけです。(笑) それが現在のビジネスモデルです。このモデルが問題なのは、世界の人口の95%は500ドル払うことができないからです。貧しい人たちにはとても不公平な、お金持ち向けに特化したモデルです。一方Duolingoでは、学びながら翻訳をして価値を生み出すので、たとえばどこかに翻訳料を払ってもらうこともでき、それが収益を得る方法になります。学習者は学習しながら価値を生んでいるので授業料は必要ありません。時間で支払っているのですから。そしてその時間にしても、語学学習にはどの道必要なもので、時間を余計無駄にするわけではないというのが素晴らしいところです。貧しい人の不利にならないフェアなモデルというのがDuolingoの優れたところです。

これがDuolingoのアドレスです。(拍手) このサイトは正式公開前ですが、ここに来れば非公開ベータへの参加申し込みができます。3、4週間以内には開始されるでしょう。Duolingoの開始をお待ちください。

ここでお話ししているのは私ひとりですが、Duolingoの開発はここに挙げた人をはじめとする優れたチームによって行われています。どうもありがとうございました。(拍手)

 

[これはTED公式日本語訳です。翻訳をレビューしていただいたAkinori Oyama氏とTakafusa Kitazume氏に感謝します。]

home  rss  

オリジナル: Luis von Ahn: Massive-scale online collaboration