ChatGPT等での推論モデル拡大、AI半導体需要を強烈に押し上げか--NVIDIAフアン氏
AIはバブルなのか。NVIDIAのジェンセン・フアンCEOは「新しい産業革命のただ中だ」と言い切る。
NVIDIAはAIブームの基盤を担う半導体やサーバーを供給し、AIの追い風を背景に時価総額で世界最大の企業となった。水曜日の決算説明会では、直近四半期の売上高が467億ドルに達したと明らかにし、生成AI市場の勢いに減速の兆しは見えないと強調した。
「今後数年間、そしてこの10年を通じても、非常に大きな成長機会が続くだろう」(フアン氏)
一方、OpenAIのサム・アルトマンCEOは最近、「投資家はいまのAIに過熱気味だ」と指摘している。とはいえ、AIが「非常に長いあいだで最も重要な出来事」であるとの認識は変わらないとも述べた。
フアン氏は、AIを動かす半導体やコンピュータへの「きわめて強い需要見通し」があるとし、データセンター拡張の動きは当面続くとの見方を示す。AIインフラ投資は今十年末までに3〜4兆ドルに達する可能性があるとも試算した(参考までに米国の名目GDPは約30兆ドル)
当然、データセンターは土地・水・電力を大量に消費する。近年は施設の巨大化が進み、周辺コミュニティへの影響や米国の電力網への負荷が増大している。さらに、より多くの電力を要する生成AIの新機能が広がれば、需要は一段と膨らむ見通しだ。
推論モデルが半導体需要を拡大
いまや「1回の質問=1回の処理」とは限らない。計算需要を押し上げているのは、推論(reasoning)を取り入れた新世代モデルだ。「いわば長い思考で、長く考えるほど、より良い答えになることが多い」とフアン氏は説明する。
この手法では、モデルが複数のウェブサイトを横断して調べ、同じ問いを再試行し、分散した情報を統合して1つの回答にまとめる。推論を別モデルとして提供したり、「深く考える」といった選択肢で切り替えさせたりする企業もある。OpenAIはGPT-5に推論を直接組み込み、ルーティングによって軽量な通常モデルと高負荷の推論モデルを自動で振り分ける設計を採った。
ただしフアン氏によれば、推論モデルは従来型の大規模言語モデルに比べ、同じ質問でも必要な計算資源が100倍以上に膨らむ場合がある。タスクを自律的にこなすエージェント型システムや、可視化や実世界での動作まで扱うロボティクス向けモデルの台頭も相まって、半導体、電力、データセンター用地の需要は拡大基調が続く。
「世代が進むたびに、需要は増える一方だ」と黄氏は語った。