GPT-5が公開されたが、このAIは明らかに汎用人工知能でも人工超知能でもない

GPT-5が公開されたが、このAIは明らかに汎用人工知能でも人工超知能でもない

今回は、OpenAIが新たに公開したGPT-5を取り上げる。これは同社の従来の生成AIおよび大規模言語モデル(LLM)の後継と見なされ、長らく待望され、多くの憶測と期待を呼んだリリースだ。

結論から言えば、これは印象的なバージョンであり注目すべき改良点を備えるものの、汎用人工知能(AGI)ではない。ここ数年、GPT-5が山を動かし、ついに真の、全方位的な人間レベルの知能に到達するとほのめかされてきたため、GPT-5こそAGIだと考えたとしても仕方のない理由があっただろう。

しかし、少なくとも今回それが起きたわけではない。

今回手にしたのは、さまざまな顕著な進歩と強化により称賛される、やや出来のよい生成AIである。祝うに値する。概して、これは有用で便利な道具だと言える。だが繰り返すが、いかなる意味でも頂点のAIではない。

また、これが次の段階、すなわち人工超知能(ASI)の前触れになると期待していたなら、残念ながらそれも違う。そうだと示す証拠は何もない。ASIは依然として捉えがたく、手の届かないところにある。いつか振り返ったとき、GPT-5がそこに至る歴史の一部だったと見なされる可能性はある。あるいは、GPT-5は単に考案・公開された数多のAIの1つにすぎず、実際のASI到達とはほとんど関係がなかったと気づくかもしれない。

ここからは、GPT-5とは何であり、何ではないのかについてさらに述べる。

■GPT-5の正式リリース

サム・アルトマンと彼のチームがGPT-5の公開をアピールするライブ配信のプレゼンに加え、OpenAIのウェブサイトにはGPT-5を説明する各種技術文書が掲載されている。AI開発者や技術者にとっては、GPT-5全体の仕組みを準技術的に描写した「GPT‑5 System Card(システムカード)」は参照する価値があると勧めたい。

複数の新しいGPT-5サブモデルを包み込む「ラップアラウンド」構造

■複数の新しいGPT-5サブモデルを包み込む「ラップアラウンド」構造

重要な点の1つは、GPT-5が本質的に、従来の製品ラインを反映した複数の新しいGPT-5サブモデルを包み込む「ラップアラウンド」構造になっていることだ。これは極めて重要なので説明しておく。

ご存じのとおり、OpenAIの従来モデルは有機的に拡張され、GPT‑4o、GPT‑4o‑mini、OpenAI o3、OpenAI o4‑mini、GPT‑4.1‑nanoなどが存在してきた。OpenAIのAI機能を使う際、特に開発者や熱心なユーザーは、利用目的に応じてどのモデルを使うか選ばねばならなかった。あるものは速く、あるものは遅い。あるものは特定の問題群に深く強く、他は浅かった。

いわば多種多様なメニューから、手元の課題に最適なものを選ぶ必要があったわけで、その責任は利用者側にあった。どのモデルが目的に適しているかを把握し、選択と試行を重ねる当たり外れの大きいプロセスになりがちだった。

GPT-5では、そうした従来版が新しいGPT‑5サブモデルへと引き上げられ、上位にある統合GPT‑5モデルが、投げかけられた問題や質問に対してどのサブモデルが最適かを選ぶ仕組みになっている。この「傘型」もしくは「ラップアラウンド」方式については後ほどコメントするので、しばし待っていてほしい。

米国時間2025年8月7日付のOpenAI公式ブログ「GPT-5のご紹介」によれば、GPT‑5の要点は次のとおりである(抜粋)。

・「本日、当社の中でも最も高い性能・速度・汎用性を備えたフラッグシップモデルGPT‑5をリリースします」

・「どのモデルを使うかを意識しなくても、常に丁寧で専門的レベルの回答を受け取れます」

・「GPT‑5は2つのモデルを搭載しています。ほとんどの質問に回答する、高性能かつ高速度のハイスループットモデルと、より難しい問題に対応する高度なリーズニングモデル(GPT‑5思考)です。また、会話のタイプや複雑さ、必要なツール、あるいは「慎重に考えて」といったユーザーの明確な意思に基づき、リアルタイムルーターがどのモデルを使用するかをすばやく判断します」

・ 「GPT‑5はGPT‑4oやOpenAI o3をはじめとする当社の従来モデルと比べて、知能が飛躍的に向上しており、コーディング、数学、資格認識のベンチマークにおいて最高水準を達成しています。特に重要なのは、多くの人にとってChatGPTの日常的な使用目的となっている文章作成支援、フロントエンドのコーディング、健康に関する質問などで優れた能力を発揮する点です」

・「本日以降、GPT‑5はすべてのユーザーにご利用いただけるため、誰もが専門家並みの知能を活用することが可能となります。有料ユーザーの場合は、利用制限が引き上げられます。Pro登録者は GPT‑5 Proにもアクセスできるようになります。このバージョンは、拡張推論機能を搭載しているため、さらに信頼性と精度が向上した回答を得られます」

新しいアーキテクチャの特徴

■「ラップアラウンド」の利点と欠点

称賛されるラップアラウンドの側面が意味するところを考えたい。

たとえ話を使おう。車を運転する際、ほとんどの人は自動変速機(オートマチックトランスミッション)を好む。かつては手動変速機が標準だったが、次第に自動変速機が標準になった。

GPT‑5のモデルは、どのGPT‑5サブモデル(たとえ話の「ギア」)を使うべきかを決める自動変速機のようなものだ。日常的なユーザーはおおむねそのアプローチに満足するだろう。ただし、自動変速機がときに最善ではないギアを選んでしまうことがあるように、GPT‑5が選ぶサブモデルの選択も最良でない場合がある。

問題は、自動モードで選ばれたサブモデルが最良ではなかったとしても、そのまま実行されてしまう点にある。利用料金を支払っているなら、その実行時間のコストは発生するのに、期待ほど堅固な答えを出さないことがありうる。

さらに、最適ではないサブモデルの選択がなされたという事実によって、知らず知らずのうちに不当な扱いを受けたことにさえ気づかないかもしれない。むしろ生成された答えが可能な限り最良の達成だったと仮定するだけの可能性が高い。だが一方、車が坂道や直線道路を走っているときには特定のギアを選択するのと同様に、より良い仕事をするかもしれないと思ったGPT-5サブモデルの1つを直接試した場合には、より良い結果が生じたかもしれない。

この自動切り替え機能が時間とともにどう進化するかは興味深い。現時点の利点は、どのサブモデルを使うかという骨の折れる選択をしなくてよくなる点だ。欠点は、自動切り替えが利用者にとって必ずしも最適ではない選択を下す恐れがある点だ。

■いわゆる「思考時間」の側面

生成AIやLLMの利用では、処理にどれだけの実行時間を与えるかを決める点も重要だ。

私は以前から、これを業界の多くが「Thinking Time」(思考時間)と呼ぶのは耳障りだと主張してきた。「思考」という語は人間の思考や精神的処理を想起させるためであり、AIの擬人化という不適切で正当化できない表現である。実際に起きているのは、計算処理時間をより多く許しているだけだ。

私はこれを崇高な「思考」と同一視しないが、そう表現するのが一般的になってしまったのは事実だ。悲しいことだ。

私は一貫して、どれだけの実行時間が適切かをユーザーに決めさせるのは難しいと述べてきた。多くの場合、適切な時間の見当はつかない。純粋な当てずっぽうになりがちだ。AIの内部動作に通じていない限り、少し時間を足すのがよいのか、たくさん足すべきなのか判断は難しい。追加の処理時間はコストを押し上げ、結果が出るまでの時間も延びることも忘れてはならない。

GPT‑5には、自動変速機の別の側面として、依頼内容に応じて処理をどれだけ続けるべきかを判断しようとする仕組みがある。実際に人々がGPT‑5を使い込んだときにどうなるかは、これから明らかになるだろう。不要な追加実行時間が大量に発生する可能性もあるし、最適に近い実行時間に落ち着く可能性もある。

様々な強化点

■一方ベンチマークは華々しい

GPT‑5について最初に耳にする・目にする話題の多くは、各種AI業界ベンチマークでの性能だ。

ベンチマーク成績は上々のようだ。想定の範囲内である。一部はその成績に熱狂するだろうが、何を期待するかによって受け止めは異なる。過去の成績や他のLLMとの比較に満足するなら、喜ぶ理由は確かにある。

一方、AGIに近づいているはずだという心構えなら、その成績は失望といわざるを得ない。ベンチマークがAGIの瀬戸際を示しているという突飛な主張を鵜呑みにしてはならない。以前の分析でも述べたが、現在主流のベンチマークはAGIに関してはせいぜい周辺的な指標にすぎない。

本気でAGIを目指すなら、基準を引き上げる必要がある。

ちなみに、サム・アルトマンは、GPT‑5はAGIへの道のりにおける重要な1歩だと述べる一方で、AGIに必要な主要特性をGPT‑5が欠いていることも率直に認めている。たとえば、初期の本番投入後に継続的に自律学習することはできないと述べている。AGIの本質的要件のひとつがAIの自己学習能力であるというのが一般的な見解・前提だ。

■コーディングとライティングの強化

GPT‑5は、従来モデルよりプログラムコードの生成に優れるようだ。

補足しておくと、生成AIの用途として「vibe coding」(バイブ・コーディング)が人気を増している。どんなプログラムを作りたいかをAIに自然言語で伝えると、AIがそのプログラムのソースコードを生成するというものだ。英語などの自然言語で要件を指定すればコードが自動生成される――これはプログラミング創世記からの夢である。

もっとも、生成AIやLLMでコードを作るには、なお多くの落とし穴がある。バグを含むことがある。意図の一部しか実現しないことがある。頼んでもいないことまでやってしまい、困ることもある。等々だ。

いずれにせよ、GPT‑5はデバッグ能力が向上し、ユーザーインターフェースやフロントエンドの作成でも改善が見られるようだ。いわゆるバイブ・コーダーたちがGPT‑5を手にして徹底的に試せば、ほどなく限界や落とし穴についての記事が出てくるだろう。

文章生成の面でも、GPT‑5は多岐にわたって改善されているようだ。詩の生成能力が強化され、文章の深みや、より説得力のある物語やナラティブを作る力が増しているという。とはいえ、日常的なユーザーは大差を感じないかもしれない。より高度な構成力を求めていた層だけが、AIが以前よりうまく書いていると実感するのだろう。

AGIとASIはどこに

■正直さ、ハルシネーション、迎合性

以下は、GPT‑5について私の注意を引いた3点である(前掲のOpenAIブログからの抜粋)。

(1):「事実性の改善に加え、GPT‑5(thinking使用時)は、特に不可能な課題、仕様が不十分な課題、主要ツールが欠けている課題に対して、自身の行為や能力をユーザーにより正直に伝えます」

(2):「GPT‑5は、これまでのモデルに比べてハルシネーション(事実無根の虚構的回答)の発生する可能性が、有意に低くなっています」

(3):「GPT‑5はこれまでのモデルよりも同調性が低く、不要な絵文字の使用も少ないですが、きめの細かい、思慮に富んだフォローアップを行います」

第1と第2の点は、GPT‑5が従来のOpenAIモデルより正直で、ハルシネーションが起きにくいことを示している(「ハルシネーション」は、AIが事実と無関係の虚構の応答を生む現象を指す、AI分野における言葉の不適切な転用でもある)。

AIがこれまで、そして今なお私たちに嘘をつくことがあるという事実にショックを受ける人もいるかもしれない。AIが作り話をする――すなわちAIハルシネーションを起こす――ことは多くの人が聞いたり目撃したりしているはずだ。懸念は、AIハルシネーションが見かけ上もっともらしく、AIが自信と正しさのオーラをまとっているため、人々が虚偽を信じ込み、ときにはその荒唐無稽な主張を受け入れてしまう点にある。

朗報は、GPT‑5が嘘とハルシネーションを抑えるらしいことだ。残念ながら、それがゼロというわけではない。言い換えれば、嘘をつかず、ハルシネーションもしないAIが望ましいのは確かだ。そうなっていく可能性が高まっていると前向きに解釈できるが、重要なのは、依然としてそれが起きているという現実である。

警戒を怠らないことだ。

■AGIとASIはどこにあるのか

GPT‑5を存分に試し、OpenAIの最新の生成AIとLLMを楽しむとよい。新機能は豊富で、多くのユーザーは満足するだろう。グラスに上質なワインを注ぎ、対話型AIの絶え間ない進歩を味わえばよい。

湿っぽく聞こえるのは避けたいところだが、華やかな演出と喧噪の中にあっても、AGIには到達しておらず、ASIに至っては近づいてすらいないのは明白だ。この道筋が正しいのかと疑問視する向きもある。AI業界は近視眼的になり、皆が同じ発想に基づく同じ解法に集中しているのかもしれない。最終的にAGIとASIに到達するには、AIの構築方法と必要なアーキテクチャを根本から再考する、既存の枠を超えた発想が求められる可能性がある。

最後は前向きな言葉で締めくくろう。

かつてカール・セーガンは「どこかで、何か信じられないようなものが知られるのを待っている」語った。この言葉はまさに、AGIやASIの達成にも当てはまる。

🍎たったひとつの真実見抜く、見た目は大人、頭脳は子供、その名は名馬鹿ヒカル!🍏