Alexaがやってることは“盗聴”なのか? スマスピを使うリスクとメリット
先日、わが家にあるAmazon製タブレット「Fire HD 10」も無事「Showモード」がアップデートにより追加されました。Showモードはディスプレイ付きのスマートスピーカー「Amazon Echo Show」と同等の機能を、タブレットで実現するというものです。この機能をオンにすると、タブレットに向かって「アレクサ」と呼び掛けることで、スマートスピーカーのように使えるようになります。便利ですね。
実は私、スマートスピーカーの「Amazon Echo」を随分前に(とても安いときに)購入し、一時期はよく使っていました。特にニュースを流し聞きするには大変便利で、NHKラジオやJ-WAVEのニュースがそのまま好きなときに聞けます。しかし、寝室に置いていたためか、いつしか使わなくなっていきました。リビングに置いたままのタブレットで同じことができるなら、再度使ってみようかなと思っています。
●そんなときにやってきた、不穏なニュース
そして先日、少々気になるニュースがありました。米Amazon.comのスマートスピーカーが収集した音声記録の一部が、同社の従業員に「聞かれている」という報道です。
Amazonが、AIアシスタント「Alexa」の品質改善のため、利用者が発した言葉を含む音声記録を聞いて精度向上に努めているというものです。同社によると、専任の従業員は秘密保持契約が結ばれている他、ユーザーの個人情報も分からないようにしているそうです。
また、日本でもAlexaの音声を聞いてテキスト化する専任従業員を募集していることも話題になりました。
この報道をどのように受け取るべきでしょうか。「Amazonがわが家を盗聴しているのは怖い」と思う人もいれば、「特に聞かれて困ることもないから気にしない」と考える人もいるでしょう。
個人的には過度に恐れたり無関心であるよりは、“適切に怖がる”ことができると良いかなと思っています。そのヒントになるかもしれないポイントをあらためて考えてみましょう。
●スマートスピーカーはなぜ安いのか
まずはスマートスピーカーのお値段を考えて見たいと思います。日本語での音声認識を行い、それに合わせた返答をしてくれるという夢のようなデバイスは、原稿執筆時点ではわずか3980円(税込)で販売されています。
普通に考えると、非常に高度な技術が必要な日本語の音声認識が、こんなに小さなデバイスで安価にできるというのは驚きです。その理由は簡単、デバイスとしてはいくつかのボタンとネット接続のための無線LAN部分、そしてマイクとスピーカーが搭載されているだけで、処理は全てクラウドで行われるからです。
高度な判断を行うモジュールは内蔵されていませんので、通常のスピーカーにそれなりのプロセッサが搭載されているだけ、ともいえます。
その代わりに、あなたがスマートスピーカーに話しかけた“音声”をクラウドに送信する必要があるのです。もちろん収集した音声データは暗号化されており、クラウドとあなたのスマートスピーカーとの間での通信は盗聴や改ざんはできないようになっています。
例えばAmazonのAlexaであれば、アプリの設定画面からAlexaとの会話履歴が見られるようになっています。音声データの再生も可能で、自分がAlexaに語りかけた言葉そのものが記録されていることが分かるでしょう。
これはAmazonだけではありません。例えばGoogleのスマートスピーカー「Google Home」や、Androidでの音声入力などの履歴も、Googleのマイアクティビティに記録されていることが分かります。
履歴を見ると分かりますが、例えばスマートスピーカーに誰かの名前を聞き取らせたり、経路案内などの音声が残っていたとしたら、その人がこれから誰に会うのか、どこに行くのかなどの情報を類推することができるでしょう。
スマートスピーカー本体でこれらの音声認識処理を行うことは、この価格帯では不可能です。こういった事実を理解することで、「スマートスピーカーを提供する企業に音声記録が残る」ことは不自然ではないと割り切ることはできるでしょう。
●「世の中に還元する」という見方
もう一つ、今回の事件を考えるための視点を取り上げてみます。それは音声認識などの技術が(特に日本では)今後の大きな発展が見込める分野であり、「企業側に音声データを提供することで技術向上に貢献できる」とする見方です。
皆さんは何らかのWebサービスにログインするときに、「ロボットではありません」というチェックボックスが出てくるのを見たことがありますか。
これは、利用者が人間かプログラム(bot)かを判断させるための「reCAPTCHA」と呼ばれる仕組みです。米Googleが提供しているもので、botがアカウントを大量に作ったり、大量のID/パスワードを用いてログインしたりするのを防ぐ狙いがあります。
似たような仕組みとして「グニャグニャとした文字を読み取って入力する」というものもあります。これも人間と機械を判別するための仕組みで「CAPTCHA」と呼ばれます。
しかし、GoogleはもはやこのCAPTCHAを利用していません。最近ではreCAPTCHAがよく使われており、「ロボットではない」というチェックボックスを押すと、3×3のマス目に画像がちりばめられ、「自動車を選択しろ」「信号を選択しろ」などと指示されます。
reCAPTCHAには、人間か悪質なスパムかを判別する以外の目的があります。reCAPTCHAのサイトには、「reCAPTCHA makes positive use of this human effort by channeling the time spent solving CAPTCHAs into annotating images and building machine learning datasets. This in turn helps improve maps and solve hard AI problems.」とあり、この結果が機械学習のデータセット構築に役に立っていると説明しています。
そう考えると、設問の理由がよく分かります。Googleは自動運転の研究をしていること、そしてreCAPTCHAで「自動車」「標識」「信号」「建物」の画像を“人間に教えてもらう”ことで、自動運転における外界の画像認識精度を向上させているのです。これはなかなか、頭がいいですね。2018年には、ユーザーによる操作が必要がない「reCAPTCHA v3」も公開されています。
実際のところ、上記のスマートスピーカーの音声に関して人間がチェックをし、その品質を向上させようという試みは、reCAPTCHAと似ているのかもしれません。安価に技術を利用できるのは、未来の世界を明るくするためともいえるでしょう。
●しかし、プライバシーはないがしろにしてはならない
だからといって、私たちの個人情報を技術革新のために無条件で差し出す必要はありません。“助け合いによって世界の技術レベルが向上する”のは確かですが、一部の企業だけがその恩恵を受けるのも納得がいかなかったりします。
問題の発端となったAlexaのプライバシー管理については、Amazonのコメントとアプリの設定について利用者自らが吟味し、どうするかを決めなければならないでしょう。
まずはAmazon.co.jpの「プライバシー設定」(ログインが必要)で「新機能の開発に貢献する」をオフにすることを検討してみましょう。スマートスピーカーに限らず、OS、アプリ、スマートフォンなどの品質向上に情報提供をするかどうか、あらためて身の回りのデバイスやサービスについて見直してみるといいかと思います。
今回の報道を受けて「もうスマートスピーカーは使わない」「Amazonのプロダクトは全部信用しない」といった判断を下す人もいるかもしれません。しかし、“適切に怖がる”ことができれば、リスクを理解した上で私たちの生活をより便利にすることだってできます。
まずは、私たちのプライバシーが侵害されうるデバイスが身の回りにどれだけ存在するかを把握することです。そして、それらの設定を見直した上でそれでも残るリスクを許容できるかを判断しましょう。そのためには、ベンダー側はどのような情報を取得し、その見返りとしてどのようなサービスが提供できるのか、いま以上に分かりやすくユーザーに開示すべきでしょう。
私たちのプライバシーに踏み込んでくるサービスはこれからもますます増えていくはずです。スマートフォンを始め、そういったサービスの全てを生活から排除することはもはや難しいといえます。メリットとリスクのバランスがとれているかを常に意識していきたいですね。
