【ウソ?本当?】スマートフォンはあなたの話を聞いているのか

2019年8月13日

友達と何かについて話をしていたら、話していた内容に関連する広告がスマートフォンの画面に現れた、という類いの話をしばしば耳にします。

簡単に説明が付くケースもあります。結婚を間近に控えた私の同僚が不満を漏らしていました。Googleでウェディングドレスを検索したことなど一度もないのに、検索エンジンが何度もドレスを勧めてくるようになったというのです。結婚して3か月経った頃には、子どもを持つことを考えてもいなかったのに、検索結果にベビー用品が表示されるようになったそうです。これはまあ、謎とは言えない話で、陰謀説を持ち出すほどのことではありません。

しかし、どうも怪しく思われるケースもあります。たとえば、これまで一度もバーベキューをしたことがないのに、ある日「バーベキューをしたい」と口に出したとたん、バーベキュー用品の広告が表示されるようになった…偶然でしょうか?

このような話を聞いたり、実際に体験したりした多くの人々が、私たちの会話のすべては、スマートフォンのマイクを通じて巨大IT企業に筒抜けになっていると信じるようになっています。これはウソ?それとも本当?この点については後ほどお話しすることにして、まずはあなた自身で実験してみることをお勧めします。

実験:自分にはまったく縁がないことをスマートフォンに向かって言ってみる

友だち何人かと集まって、テーブルの上に全員のスマートフォンを置きます。そして、誰も考えたことがなかったようなことについて元気よく会話をしてください。たとえば、「洪水制御4ステム?ずっと欲しかったんだよね!洪水制御4ステムがセールになっていたら買う!」といった具合に。ちなみに、ここではキーワードの表記を意図的に変な風に変えてあります。あなたがこの記事を読んだことで、検索エンジンが「”とあるシステム”をあなたが買いたがっている」と判断しないようにするためです(もちろん、実際の実験ではその「とあるシステム」の名前を出して話をしてください)。

もしかしたら本当に欲しいかもしれないものの名前は、使わないようにしてください。想像力を働かせて、100万年後になっても絶対に欲しいとは思わない何かを考え出しましょう。「竪穴式10居」とか、「カピBAラ」とか、何でもいいです。

ただし、条件が1つあります。キーワードを決めたら、何があってもその言葉を検索しないでください。ネットで検索してしまうと実験になりません。SiriやAlexa、Cortana、Google Assistantのような音声アシスタントにも言わないように注意しましょう。ところでGoogleと言えば、自分についてGoogleが今まさにどんな情報を収集しているかを確認できるページがあります(こちらです)。

友人とひとしきりおしゃべりをしたら、次の週もそのキーワードを使ったやりとりを続けてください。「ねえ、新しい竪穴式10居に取り付ける、洪水制御4ステムのことなんだけど…」という風に。

私も、同僚と一緒にこの実験をしました(結果は記事の最後で)。

スマートフォンの広告が私たちを見透かしているように見える理由

それでは、ウソか本当かという話に移りましょう。検索サービスを提供する巨大IT企業が私たちの生活を見透かしているかのように見えることがあるのには、いくつか理由があります(マイクを通して盗聴しているという陰謀説を除く)。

理由1:インターネットサービスは正確なモデルを構築している

Your phone isn’t really spying on your conversations — the truth might be even creepier』(英語記事)という記事の中で、Googleの元社員が、GoogleとFacebookは利用者の「デジタル分身」を持っているのだと述べています。この「分身」は、機械学習の手法を用いて利用者のふるまいを再現します。そして、どこかの時点でデジタル分身は利用者そっくりになり、利用者が何を欲しがるかを予測し始めるのです。

Facebookについては、女性が妊娠しているかどうかを、本人が知るよりも先に判断できるという話を聞いたことがあります。SNSのフィードをスクロールする速度で分かるのだそうです。

個人的にはそんなテレパシー能力を信じようとは思いませんが、ここに一定の真実が含まれていることは否定できません。機械学習は年々、確実に精度が良くなっています。なお、当社の(当社の脅威検知メソッドの1つ)も機械学習と同じような動作をします。基本にあるのは、「アヒルのような声で鳴くものは、おそらくアヒルだろう」という考え方です。たとえば、ある疑わしいファイルがあり、それが既知のマルウェアと似たふるまいを見せたら、そのファイルは悪意あるファイルだろうと判断されます。

理由2:音声アシスタントが意図せず有効になっている

巨大IT企業が何でもお見通しである理由はほかにもあります。音声アシスタントが偶発的にオンになった場合です。スマートフォンは時折、持ち主が「Alexa」「OK、Google」「ヘイ、Siri」、「Cortana」と口に出したと勘違いするのです(実際には言っていないのに)。

起動のためのワードが正しく発音されなくても、音声アシスタントは反応します。何か似たワードが引き金となってアシスタントがオンになり、スマートフォンがその後の発話をすべて聞き取り、関連するものを広告に表示した、という可能性があります。

聞き耳を立てるスマートスピーカー

スタンバイモードになっているときは、スタンドアロンの音声アシスタント(スマートスピーカーに内蔵のものなど)であっても、あなたの話を常に聞いているわけではありません。呼びかけられるのを待っているのです。起動コマンドを受け取るために、デバイスは小容量のバッファ(音声保存用に数秒程度)、専用のプロセッサー(あまり高性能ではない)、特定のワード向けに調整された音声認識アルゴリズムを使用します。

常時稼働しているのはこれだけで、ほとんど電力は使用しませんし、インターネットトラフィックも発生しません。起動ワードを検知してはじめてデバイスはフル起動し、サーバーに接続し、録音したデータを転送して認識します。

ところで、スマートフォンのアシスタントアプリは画面に表示されたものを読むことができる。利用者が声に出さなくても読み取りは行われる

理由3:利用者の「ドメイン」

あなたが友人や配偶者とデオドラントについて、またはデオドラントの必要性について(必要ではないといいのですが)話したとします。あなた自身は会話した内容について検索しませんでしたが、話し相手は検索しました。会話の後であなたがデオドラント用品の広告を目にするようになったとしても、それほど驚くことではありません。

インターネットサービスは、あなたのアカウントと話し相手のアカウントの間に何らかのつながりがあると、すでに当たりをつけているのです。その人とは、しょっちゅう同じ場所に出かけたり、出先で同じWi-Fiネットワークを使ったり、同じデバイスでログインしたことがあったりしませんか?検索エンジンがそのような関係性の人たちを「ドメイン」に分類し、一緒に購買を決定する可能性が高いと見て同じ製品の広告を表示しているのかもしれません。

このようなことが実際に起きているとは断言できませんが、インターネットサービスの一環としてこのようなことが行われていても不思議ではありません。

理由4:当てずっぽうが当たった

私の場合、自分の興味とは関係のない広告がよく表示されます。サウナの装置とか、妊娠テストとか、どこかへの旅行とか。あなたも似たような経験があるかもしれません。

検索エンジンを利用する人は大勢います。したがって、ある日サウナの効用について友達と話した後に、無作為に表示されたキャンペーン広告をたまたま目にして、それがたまたまサウナの広告だった、ということはあり得ます。それを見たあなたは、「自分の会話がスマートフォンに盗聴されている」とネットに投稿します。一方で、サウナの話をしていない人が同じ広告を見ても、その人は何も投稿しません。こうして、前者の話は人の目に触れますが、後者の話は語られることも知られることもありません。

このような偶然の一致は、それほど驚くことではないのです。例を挙げましょう。あるトーナメント戦で、8つのチームが準々決勝に進みました。4 + 2 + 1の7試合が残っています。各試合の結果は2通り、一方が勝ってもう一方が負けるか、その逆です(引き分けはなし)。したがって、予想される試合結果は、2の7乗で128通りになります。

ここで、戸数が128の集合住宅があるとします。各戸の郵便受けに128通りの結果予想を1つずつ入れたとしたら、そのうち1戸の住人には、100%的中した予想が届くことになります。その住人はびっくりするでしょうが、実際は配布先の数が十分な大きさだったというだけの話です。

似たような(だが、根本的に違う)実験

あるVブロガーが、私たちの実験と似た、しかし根本的に異なる実験をしています。この人は、YouTubeでライブ配信をしながら、意図的に犬用おもちゃの話をします。そして、Googleの広告があっという間に反応したのを示してみせました。

この実験と私たちの実験には、決定的な違いがあります。このVブロガーの実験では最初からマイクがオンになっており、音声情報は直接Googleに送信され、Googleがそれに反応しています。この実験の中で驚くに値するのは、反応時間の早さだけです。

私たちが知りたいのは、知らないうちにマイクがこっそりとオンになって、スマートフォンが会話を盗聴し、サーバーに情報を送ることはあるのか?ということであり、この実験が問うている内容とは根本的に異なります。

ここで、少し横道にそれますが、触れておきたいことがあります。この巨大IT企業が私たちから音声情報を受け取った場合(ここまでで説明したような正当な方法で)、それを人間が聞くことが可能であり、実際に聞いている(英語記事)ということです。その目的は音声認識機能の向上です。しかし、自分の名前や、住所や、病歴を口にしているとしたらどうでしょうか。音声検索はテキスト検索と同じで、自分が口に出して尋ねたことを無条件でシェアすることになるのです。

結論

当社の実験に話を戻しましょう。私と同僚はスマートフォンを前に、「コーニス」(天井と壁の間の突出部)という素晴らしいテーマについて長きにわたって(実に1週間!)熱く語り合ったのですが、コーニスの広告が表示された人は誰もいませんでした。それとは違うつまらない広告は山ほど表示されたのですが。

この実験の信憑性を高めるには、実験してくれる人がもっと必要です。あなたもぜひ加わってください!もしよかったら、実験のために使うキーワードをSNS経由で私たちに教えていただけたらと思います(もちろん、結果も)。その場合は、巨大検索エンジンにばれてしまわないように、キーワードの何文字かを見た目や読み方が似ている別の文字や数字に置き換えてくださいね。

締めくくりにちょっとした話をひとつ。私の友人が同僚たちに、会社のキッチンからいつもスプーンがなくなるんだよね、と愚痴をこぼしました。これを聞いた同僚たちはいたずら心を起こして、この友人宛に仕事のメールを送るときは必ずメールの末尾に白いフォントで「スプーン スプーン スプーン スプーン」と書くことにしました。メールクライアントはGmailでした。さてどうなったか。哀れな友人は、スプーンの広告ばかり表示されるようになったのでした。なかなか怪しい感じではありませんか。

というわけで、噂を単純に信じるのではなく、ぜひ実験してみてください!

追記:カスペルスキー セキュリティのWindows対応プログラムにあるバナー広告対策機能とWebトラッキング防止機能を有効にして、ばっさりと広告を非表示にすると同時に多くの企業によるWebトラッキングをシャットアウトするという方法もあります。