対話AI「ChatGPT」にそれほどの革新性はない--Metaのチーフサイエンティスト
OpenAIが開発した「ChatGPT」について、大きな可能性を期待する声がこのところ相次いでいる。ChatGPTは、人間の問いかけに応じて自然言語で対話ができる人工知能(AI)プログラムだ。
多くの人がChatGPTプログラムに新しさを感じ、唯一無二のものに違いないとして高い関心を抱いている。
だが、AIの研究者らは、そういう考えに異を唱えている。
「根底にある技術という点で、ChatGPTは特に革新的なものではない」と、MetaでチーフAIサイエンティストを務めるYann LeCun氏は米国時間1月19日、少数の報道関係者や企業幹部が参加した「Zoom」会議で語った。
LeCun氏は次のように述べた。「革新的なところは何もないが、世間ではそのように受け取られている」「まとめ方がうまいというだけであり、その点では見事だ」
同氏によれば、このようなデータ駆動型のAIシステムは、これまでにも多くの企業や研究機関で開発されてきたという。そのため、OpenAIのアイデアがこの種の取り組みでユニークだという見方は正しくないとしている。
「OpenAIが他の研究所と比べて特に先進的だということはまったくない」(同氏)
同氏は「GoogleやMetaはもちろん、少なくない数のスタートアップが、基本的に極めて似たような技術を持っている」とした上で、次のように述べた。「私はこれ(ChatGPT)を簡単なことだと言いたいわけではないが、実際にはすでに公開されている技術であり、隠された秘密のようなものはない」
同氏は、Collective[i]が主催するオンラインのディスカッションシリーズ「Collective[i] Forecast」に、スピーカーとして招待された。
ChatGPTは「iPhone」やグーグル検索のような時代を変える技術になるか
チャットボットの類いは1960年代から存在していたが、2022年終盤に登場した「ChatGPT」には、投資家やIT企業、一般大衆を魅了する何かがある。
すでにインターネット上には、不本意な交通違反切符について争うための専用のチャットボットから、ワークアウトやダイエットの計画を立てるチャットボットまで、ChatGPTの人間に近い対話能力を利用するアイデアが溢れかえっている。
しかし、もっと大きな疑問が存在する。それは、ChatGPTが(あるいはより正確には、そこに使われている技術が)「iPhone」やGoogle検索、Amazonの「Alexa」などの世代を代表する他のブレークスルーと同じような、世界を一変させるような影響力を持つ技術になるかどうかだ。
この疑問の回答が出るまでには年単位の時間がかかる可能性が高いが、人工知能の専門家は、2023年にはChatGPTに使われている技術を用いた新たな製品やアプリケーション、サービスが大量に登場すると予想している。この技術は、カスタマーサービスのチャットボットや、Alexaや「Siri」のような音声を使用したバーチャルアシスタントや、検索エンジンや、電子メールの受信箱などのさまざまな技術と、人間との相互作用のあり方を大きく変えるかもしれない。
アレン人工知能研究所の顧問であり、同研究所の理事を務めるOren Etzioni氏は、「6カ月以内には、チャットボットや音声アシスタントの会話能力が大きく向上するだろう」と述べている。
2023年に入ってから、ChatGPTが私たちの仕事に与える影響に関するニュースがいくつも報じられている。例えば、OpenAIのプレジデント兼共同創業者であるGreg Brockman氏は、米国時間1月10日に、ChatGPTのパフォーマンスを向上させたプロフェッショナル向けの有料版ChatGPTを準備しているとツイートした。またThe Informationは、複数の記事で、ChatGPTを生んだOpenAIの出資企業であるMicrosoftが、「Bing」「Outlook」「Word」「PowerPoint」などの製品にこの技術を取り入れることを検討中だと報じている。ニューヨーク市教育局が、「生徒の学習に対する負の影響が懸念される」として学校のデバイスからChatGPTへのアクセスをブロックしたことも話題になった。The Wall Street Journalは、OpenAIが約290億ドル(約3兆8000億円)規模の株式公開買付けを実施することを検討しており、米国で最も企業価値が高いスタートアップの1つになる可能性があると伝えている。
McKinsey Global InstituteのパートナーであるMichael Chui氏は、「物事にはハイプサイクルが存在し、この技術が現在世間の想像力を刺激していることは明らかだ」として、「しかしハイブサイクルの背景では、ビジネスにおける現実的なユースケースに徐々に技術の進歩が組み込まれる過程が進んでいるものだ。そしてそれはすでに始まっている」と述べた。
ChatGPTの正体とその仕組み
ChatGPTは研究用のプレビュー版としてオンラインで無料公開されているチャットボットで、OpenAIは、その目的はシステムに現実での利用から学習させることだと述べている。ChatGPTは、「健康的な夕飯のアイデアが欲しい」「就職面接で『自己紹介してください』と言われたときの最も良い答え方は?」などといった、直接的な質問に答えることができる。しかしChatGPTは、詩や歌詞、エッセイのようなものを書く能力も持っており、年末年始の挨拶状を作成させたり、ToDoリストを整理させることもでき、退職願いの下書きを頼むことさえできる。
ChatGPTは、人間によって書かれたインターネット上の大量のデータを使ってトレーニングされており、そのデータには人間同士の会話も含まれる。しかし、ChatGPTはインターネットに接続されてはおらず、正しくない答えを返すこともあり、その知識も限られている。
ChatGPTは、その驚くほど人間的な文章と自信に満ちた回答で、一夜にして世間の話題を攫った。Brockman氏は12月上旬に、リリースから5日間でユーザー数が100万人を超えたとツイートしている。
Cui氏は、OpenAIの「DALL・E」のようなChatGPTなどと同様のAI技術を使って絵を生成するプログラムについて、「これらは、多くの人が『人間がすることだと思っていた』と感じるようなことをやっている」と述べている。
優れたチャットボット、オフィスで役に立つツール
米CNETのDavid Lumb記者が12月に記事にしているように、ChatGPTが日常的な仕事(例えば買い物リストの作成や子どもを寝かしつけるときのお話を作るなど)に使われている単発の例はたくさんある。まだ分かっていないのは、ChatGPTに使われている技術が、日常的に使われているアプリケーションやサービスでもっと大きな役割を果たすようになるのか、果たすとすれば、どのような役割かということだ。専門家が最も影響が大きいと予想している分野の1つがチャットボット業界で、特にカスタマーサービス用のエージェントに大きな影響が及ぶと考えられている。
MetaやSquare、Verizonなどの企業にAIを使用したカスタマーサービスツールを提供しているAdaは、すでにChatGPTに使われている言語モデルである「GPT-3」を使用している。Adaは12月20日に、OpenAIの技術の利用を深めていくと発表した。
将来的には、AlexaやSiriのような音声ボットもこの技術から恩恵を受けられる可能性がある。
「午後5時にアラームをセットするのにChatGPTは必要ない」とEtzioni氏は言う。「しかし将来は、これらの音声アシスタントがもっと強力な会話機能を持つようになるだろう」
ChatGPTに期待されているもう1つの用途が、次世代のオフィスアシスタントだ。専門家は、この技術を使えば、コードを書いたり、電子メールの下書きをしたり、職務記述書を作成したりといったあらゆる作業が楽になる可能性があると考えている。JasperやUnbounceなどの企業はすでに、GPT-3を使用したコピーライティング用のツールを提供している。これらのツールは、キャッチフレーズやソーシャルメディアのキャッチコピー、電子メールのメッセージ、製品の説明などを作成するためのものだ。
The Informationの記事によれば、MicrosoftはChatGPTに使用されているAIモデルをOutlookに組み込み、正確なキーワードを入力しなくても、受信トレイから正しい検索結果を得られるようにしたいと考えているという。また同社は、OpenAIのソフトウェアを使用して、ユーザーの指示に従って内容を書くことができるチャットボットをWordやOutlookに組み込むことを議論しているとも報じられている。
Microsoftは、「GitHub Copilot」と呼ばれる製品で、AIを使ってコードを書く作業をスピードアップする方法を模索している。この製品は、「OpenAI Codex」と呼ばれるOpenAIのAIモデルを使用して、コードや関数を提案する機能を持っている。
マサチューセッツ工科大学(MIT)のYoon Kim教授は、「コーディングの分野でもChatGPTがゲームチェンジャーになる可能性がある」と話す。同氏は、ほとんどのプログラマーは問題に遭遇すると質問を検索して似たような状況に当てはまる回答を探す作業をしているが、チャットボットにコードの誤りを修正するように命じるのは、それよりもずっと楽だと述べている。
会話的な検索
ChatGPTが持っている会話形式で情報を提供する能力は検索と比較されており、こうしたツールが最終的にGoogleに取って代わるのではないかと考える人が出てきている。ChatGPTを少しでも触ってみた経験があれば、そう考える理由は分かるはずだ。ChatGPTは、検索エンジンと同じように、「小バエを駆除する方法は?」や「ゲーム・オブ・スローンズに登場する名家でもっとも権力が強いのは?」といった質問に答えることができ、記事の断片やリンクのリストを表示するのではなく、以下のスクリーンショットのように、簡単な答えと具体的な手順を提示してくれる。
ChatGPTは検索エンジンと似たような仕事もできるが、現状では答えを得るためにウェブを調べ回ることはできないため、得られる回答はずっと限定的なものだ。例えば、「今、Netflixで一番いい映画は何か」といった質問をすると、以下のように「すみません、私はOpenAIに訓練された言語モデルであり、インターネットを閲覧したり現在および今後のプロダクトの情報にアクセスしたりできないため、Netflixで一番いい映画のリストを提供することはできません(後略)」という答えが返ってくる。
ただし大手IT企業は、この技術を検索エンジンに取り入れる方法を検討している。The Informationの記事によれば、MicrosoftはChatGPTに使われているAIを使用して、一部の検索クエリーに対してより対話的に答えを返すバージョンの「Bing」を公開する準備を進めており、この機能は3月末までに登場する可能性があるという。記事では、ChatGPTはウェブの情報を参照できないため、検索結果をユーザーに提示する手段を改善するために使われる可能性が高いと述べている。
2021年にサービスを開始した検索エンジンである「You.com」も、2022年末に自社のサイトでChatGPTに似たチャットボットを提供し始めた。
The New York Timesは、Googleの経営陣がChatGPTの公開を受けて「緊急事態」を宣言したと報じた。記事によれば、同社のさまざまなチームが、5月に予定されている同社のカンファレンスまでに、さまざまなAIツールを開発するために再配置されたという。Googleは、2022年夏に話題になった「LaMDA」と呼ばれる自社製の言語モデルを持っており、このモデルが発表された際には、同社の元エンジニアであるBlake Lemoine氏が、このAIが感情を獲得したとして公の場で懸念を表明していた(GoogleはThe Washington Postに対し、同氏の主張には根拠がないと述べた)。
ChatGPTが持っている自然な会話を操る能力は、Googleが同社の検索エンジンや音声アシスタントで採用しているアプローチにも似ている。初期のインターネット検索では、青いリンクのリストが表示されるだけだったが、現在では、情報を記したパネルや、記事の断片や、画像の列などを交えたページが出力されるようになり、リンクをクリックしなくてもユーザーが直接回答を得られるようになった。ChatGPTのように、クエリーに対して会話形式で回答できれば、Googleの検索がより効率的になることは容易に想像できる。「Googleアシスタント」は、この4年間でより対話的になるとともに、新たなタスクを獲得しており、しばらく答えを待つ能力が追加されたり、ユーザーの代わりにレストランを予約できるようになったりしている。
しかし、ChatGPTのようなチャットボットが、Googleのような正確で信頼できる検索結果を出せるようになるまでには時間がかかるだろう。MITのKim教授によれば、今後出てくる可能性が高いのは、従来の検索結果とChatGPTの対話的プレゼンテーションを組み合わせた、何らかのハイブリッドシステムだという。
「そのシステムは、検索エンジンの検索結果を使ってより流暢な自然言語の回答を作成することができ、同時にその答えを作成するのに使われた情報源も表示することができるだろう」とKim氏は述べている。この説明は、Microsoftが取り組んでいると言われている新しいBingの機能とも似ている。
ChatGPTの限界や回答の正確さに対する懸念
ChatGPTには大きな可能性があるが、懸念も多い。最大の懸念は、ChatGPTの回答は常に正しいとは限らないという問題にまつわるものだ。OpenAIはChatGPTの欠点を率直に明かしており、同社のウェブサイトには、ChatGPTは「もっともらしいが、正確ではない回答や無意味な回答を書くことがある」と明記されている。また同社は、ChatGPTは2021年以降の事象については限られた情報しか持っていないため、アドバイスに使うべきではないと述べている。プログラマーのためのQ&Aサイト「Stack Overflow」は、ChatGPTやGPTが作成した回答にあまりにも誤りが多いため、一時的に掲載を禁止した。
スタンフォード大学Institute for Human-Centered Artificial Intelligenceのフェローで、プライバシーやデータポリシーに詳しいJennifer King氏は、「いずれは難しい質問が尋ねられるようになるだろう」と述べている。「そうした難しい質問が出てきたときに、AIの答えが正しいかどうかを見分けるにはどうしたらいいだろうか」
また、技術を悪用する人間の問題もある。ニューヨーク市教育局は、不正使用への懸念から、学校用端末からChatGPTへのアクセスを制限した。また、セキュリティ企業であるCheck Point Researchによれば、OpenAIの技術はすでにサイバー犯罪集団によって攻撃用のツールを開発するために使われているという。
King氏は、企業がChatGPTのようなツールを製品に取り込むタイミングについて聞かれると、「それは、各企業がこのようなツールのリスクをどう評価するか、そのリスクを抑制可能だと考えるかどうかの問題だ」と述べた。
ChatGPTは回答を作るのが得意だが、急激に注目されるようになったことで、問われる質問も増えている。研究のためのプレビューが終了したら、次はどうなるのだろうか。OpenAIやこの技術を利用しているほかの企業は、前述のような問題をどのように解決するのか。対話型AIは今後、iPhoneのような世代を代表する技術になるのか。これらの疑問に対する答えはいずれ明らかになるだろうし、それも遠い先のことではないだろう。
Etzioni氏は、「すでに新しいアプリケーションが数多く登場しているが、3年後や5年後といったスパンではなく、6カ月後にはもう、はるかに多くのものが登場しているはずだ」と述べている。
ChatGPT開発企業のCEO、教育関係者の懸念に回答…「我々は電卓を使うことに適応した」
OpenAIのサム・アルトマンCEOはインタビューで、ChatGPTを用いた盗作を特定する方法を考案すると述べた。
しかし、盗作を100%検出できるツールを作ることは本質的には不可能だという。
アルトマンは学校や政策立案者に対し、検出ツールに頼らないように忠告している。
話題のAIチャットボット、ChatGPTの開発を手がけるOpenAIのサム・アルトマン(Sam Altman)CEOは、教育現場でAIによる盗作を発見するための方法を開発すると述べているが、それは不正を完璧に検出することを保証するものではないと警告している。
アルトマンは「なるべく早くいくつかのことをやってみようと思っている」と、StrictlyVCのコニー・ロイゾス(Connie Loizos)とのインタビューで述べている。
「GPTのような言語モデルで出力したものを、教育現場でもう少し検出しやすいようにする方法があるかもしれない。しかし正直なところ、断固とした決意のもとでこれを利用する人は、それすら回避してしまうだろう」
これまで長い間、新たな技術は生活や教育現場に取り入れられてきており、ある程度時間が経過すると、これらの技術はよい影響を与えるようになったとアルトマンは言う。
「AIによるテキスト生成は、誰もが適応しなければならないものだ。我々は電卓を使うことに適応し、数学のテスト内容を変えてきた。ChatGPTはその極端なバージョンであることは間違いないが、同時にそのメリットも極端なものだ」
ニューヨーク市教育局管轄下の学校やシアトルの公立学校は、盗作やカンニング防止のために学校でChatGPTを使うことを禁止した。アルトマンのコメントはそれを受けてのものだ。
