22歳の天才エンジニア「Claude Mythos」を推測でほぼ完コピ、無料で公開する

米Anthropicの非公開AIモデル「Claude Mythos」のアーキテクチャを理論的に推定し、再構築したオープンソースプロジェクト「OpenMythos」が公開された。22歳の開発者Kye Gomez氏が主導し、公開済みの研究論文群を元にPyTorchで構築した。7億7000万パラメータの小規模構成で、13億パラメータのモデルに匹敵する推論性能を示す。

Claude Mythos の構造を推測で模倣し、オープンソースで公開

　OpenMythosは、米Anthropicの非公開AIモデル「Claude Mythos」の「Silent Reasoning（暗黙の推論）」アーキテクチャの再現を目的とするプロジェクトである。Claude Mythosは高度なサイバーセキュリティ能力を持つとされ、「Project Glasswing」と呼ばれるAnthropic内部のペネトレーションテスト等で運用されているが、安全上の理由からモデル自体の外部公開は見送られている。Gomez氏はこの非公開モデルの内部構造を、再帰的深さを持つTransformerやループ型言語モデルに関する複数の既存研究から推定し、第一原理に基づいて独自に構築した。

　開発の基盤には、「Parcae」と呼ばれるループ型言語モデルのスケール則に関する論文や、推論プロセスを潜在空間内で反復処理する技術文献が用いられている。技術メディアの報道によると、OpenMythosのアーキテクチャは7億7000万パラメータという小規模な構成でありながら、従来の13億パラメータ規模のTransformerモデルに同等の性能を発揮する。

　海外の技術コミュニティやRedditでは、この推論特化型モデルが今後のAI開発エコシステムに与える影響が議論されている。巨大な計算インフラを持たない開発者であっても、高度な推論機能を持つAIシステムをローカル環境で稼働させる手段となるためだ。事実、一部の開発者はAMDのプロセッサ「Strix Halo」などを搭載したハードウェア環境を用いて、OpenMythosの動作検証をすでに進めている。

　今回のプロジェクト公開はAIのセキュリティ体制に関する新たな課題を浮き彫りにした。Anthropicが危険性を考慮して非公開とした技術の基幹部分が、誰でもアクセスできる公開文献の組み合わせによって、オープンソースの枠組みで実質的に再現された。高度な未公開モデルであっても、既存研究の延長線上でアーキテクチャのリバースエンジニアリングが可能であることが実証された形となる。AIシステムの能力向上と並行して、技術の透明性と安全上のリスク管理をどのように両立させるかという対応が、業界全体に求められている。

天才エンジニアが構築した「反復深度トランスフォーマー」とは？

　Kye Gomez氏は、既存の巨大IT企業や学術機関に属さない異色の経歴を持つAI開発者である。フロリダ州マイアミ近郊で育ち、10歳でプログラミングを開始した。13歳で独自のAIモデルを開発し、母親のGmailアカウントをハッキングしてゲームのコードを入手したエピソードを持つ。3つの高校から退学処分を受け、大学教育も受けていない。公開された学術論文の理論を直接コードとして実装する手法を徹底し、オープンソースの超知能イニシアティブ「Agora AI Labs」のディレクターとして活動するほか、複数AIエージェントの連携フレームワーク「Swarms」のCEOも務める。その独自路線は業界内で物議を醸しており、米OpenAIが自社のコードを盗用したと非難したほか、競合プロジェクト「ai16z」の創設者からコードも書けない詐欺師と批判されるなど、激しい対立を繰り返している。

　Gomez氏が発表したOpenMythosは、一部のセキュリティ専門家のみに限定公開されているAnthropicの「Claude Mythos」を推測し、PyTorchを用いてゼロから構築したモデルである。中核となるアーキテクチャ「反復深度トランスフォーマー（Recurrent-Depth Transformer）」は、入力データを数百の異なる層に順次通過させる従来の方式とは異なり、単一の層を繰り返しループさせる構造を持つ。処理は3段階で構成され、入力データをモデルの内部表現に変換する初期段階を経て、同じパラメータの層を最大16回から64回ループさせる処理を行い、最後に内部表現をテキスト出力に変換する。

　このループ構造により、OpenMythosは文字トークンを外部に出力しながら思考プロセスを展開する既存モデルとは異なり、潜在空間内で反復処理を行いながら内部で推論を進める「沈黙の推論（Silent Reasoning）」を実現している。さらに、適応型計算時間（ACT）を採用し、問題の複雑さに応じてループ回数を動的に調整する。簡単な処理は少ないループ回数で早期に打ち切り、複雑な問題にはループ回数を増やして深く計算資源を割り当てることで効率的な動作を担保する。

　同一層の反復処理は、信号が指数関数的に増大する残差爆発のリスクを伴うが、OpenMythosは「Parcae」と呼ばれるアーキテクチャの線形時不変（LTI）制約という数学的アプローチを適用し、信号の増幅率を示すスペクトル半径を常に1未満に抑制して学習と推論の安定性を確保している。同時に、特定の専門家モデルのみを稼働させるMixture of Experts（MoE）をループ内に組み込み、全体の約5%のパラメータのみを動的に有効化する。これにより、7億7000万という小規模なパラメータ数でありながら、従来の巨大モデルに匹敵する推論性能と高速処理を両立させた。モデルの規模拡大のみを追求してきたAI開発の潮流に対し、推論の反復というアプローチがサイズを凌駕する可能性を証明している。

🍎たったひとつの真実見抜く、見た目は大人、頭脳は子供、その名は名馬鹿ヒカル！🍏

Reply ›

Forums › 👩‍💻パソコン・スマホ › パソコン

Home

›

Forums

›

Forums Home

Invite a Friend Contact Us Bookmark Language (English)

Select Language

English

日本語

中文(台灣)

中文(简体)