Google 500万人1兆のウェアラブルデータに基づく「ヘルスケアAI基盤モデル」を開発
Googleの研究チームが500万人のウェアラブル端末から得られた1兆のヘルスケアデータを用いて、自然言語による健康状態の説明を生成するAI基盤モデルを発表した。このモデルは35種類の健康指標予測タスクで評価され医師によるテストでも実データと同等の高い結果を示している。
Googleの研究チームが開発したウェアラブル健康データ向けのAI基盤モデルについて複数の情報源が報じている。このモデルは複数のメディアにおいてSensorFMやSensorLMという名称で言及されている。発表の初期段階では500万人の参加者から収集した1兆分以上のデータで訓練されたと伝えられていた。しかし公開された査読付き論文によって実際の訓練データは127カ国における10万3643人の同意したユーザーから収集された5970万時間分のFitbitおよびPixel Watchのデータであることが明らかにされた。データの収集期間は2024年3月から5月である。
このシステムは心拍数や活動量などの生理学的な生データを自然言語による健康状態の説明へと直接的に変換する機能を備えている。モデルは階層的なキャプション生成パイプラインを使用しており様々な統計情報から詳細な説明を自動で生成する仕組みである。事前のラベル付けされたデータによる明示的な学習を必要とせずにユーザーの活動を特定するゼロショット行動認識の能力も備えている。
さらにセンサーの読み取り値とテキストによる記述を照合するクロスモーダル検索機能や現在の生理学的状態を要約するキャプションの生成機能も実装されている。従来の活動認識モデルは検出の対象となる活動ごとにラベル付けされた訓練データを必要としていた。しかし今回のモデルが採用したゼロショットアプローチはその技術的なボトルネックを回避し手動によるキュレーションを行うことなく解釈できる行動や健康状態の対象範囲を大幅に拡大している。
モデルの性能評価は35種類の多岐にわたる健康指標予測タスクを通じて行われた。結果として分類タスクにおける精度が向上したことに加え生成タスクの誤差が28%削減されたことが報告されている。さらに臨床医を対象としたテストにおいて1860件にのぼる評価が行われモデルが生成した健康要約は非常に高く評価された。
Googleは以前にも16万5000人のユーザーから収集した4000万時間以上のデータを用いたウェアラブル基盤モデルの研究を発表している。今回のモデルは参加ユーザーの層を絞り込みつつ全体としてのデータセットの規模を大幅に拡大したものである。入力するデータ量と計算量を追加することで一貫して性能が向上するというモデルのスケーリング挙動も確認されている。現状においてこのモデルはあくまで研究領域にとどまっている。心房細動のパターンの特定や代謝変化の予測といった実際の臨床現場での展開には事前の厳密な規制当局による審査が必要となる。
