放課後のサイエンス

LLM-FeynmanがMaterials Informatics最大の課題を解決してしまったのか?

March 28, 2025 | 0 Minute Read

LLM-asking

この論文を目にした時、コロナ騒動が始まった直後に真冬のNYで参加したAI系の国際学会(AAAI)の情景を思い出さずにはいられなかった。

自然言語処理セッションの約9割を占めていたと思われる中国系の人たちが、米国入国禁止措置のために、急遽ビデオ録画発表に変更となり、だだっ広い会場で聴衆3~5人程度と寂しい雰囲気の中、現地でひたすら録画発表を聞いた時に感じたことを。

もともと材料系の研究者であった私が、初めて参加した自然言語処理系の国際学会であったが、国際学会なのに人種多様性が低く、ほとんどが中国の人だということに、先ずは素直に驚いた。

そして、近い将来、Materials Informatics(MI)の分野も、中国の人たちがけん引する世の中になるであろうという、確かな予感が刻まれたことが思い起こされた。

そんな思いを引きずり出してくれたのが、LLM-Feynmanという自然言語処理をベースにしたMIフレームワークに関する論文が出されたとの記事である。あの時の予感は的中なのか!? との思いで、急いで論文を読んでみたが、はたして・・・


LLM-Feynman: Leveraging Large Language Models for Universal Scientific Formula and Theory Discovery

どんな論文?

この論文を注目する理由は、単に経験式を導出するのではなく、なるべく理論的に説明可能な形で「高精度な回帰式」を導出してくれる、つまり、外挿予測にも強そうな回帰式を得られる、と謳っているからです。これって、材料研究者にとっては、夢のような話です!

『初めに断っておくと・・・』という書き方をすると、「あ~、予感は外れたのね~~」となってしまうかもしれないが、ちょっと違う。 実際に原文をたどると、この論文はまだプレプリントの段階であり、本文中に書かれているサポートデータも貼られていない不完全なもの。 つまり、私のような第三者は検証することがでないため、書いてあることを只々信じるしかなく、話半分で読んでもらいたい、ということです。

とはいうものの、気になるのは、実際の成果ですよね。

先ず、論文中に書かれている成果を簡単に紹介すると、『2D材料やペロブスカイト構造の合成可能性の分類』『固体電解質のイオン伝導率や2D材料のGWバンドギャップの予測』 といったタスクにおいて、解釈可能な数式を高精度に生成できた、というものです。

また、『ファインマン物理学講義から得たデータセットを用いた実験』では、データセットにノイズを加えた場合において、従来の記号回帰法であるAI-Feynmanと比較して好成績を収めた、ということです。


LLM-asking

ファインマン物理学講義を用いた実験

この論文では、LLM-Feynmanフレームワークの有効性を検証するために、ファインマン物理学講義から得られたデータセットを用いて実験を行っています。

この実験では、

  • 100の基本的な公式を「単純なタスク」
  • 20のより複雑な公式を「難しいタスク」

として設定し、LLM-Feynmanと従来の記号回帰法であるAI-Feynmanの性能を比較しています。

実験の結果、ノイズがない場合、LLM-FeynmanAI-Feynmanはどちらも単純なタスクにおいて全ての公式を正しく識別しました。

しかし、データにノイズを加えた場合、LLM-FeynmanAI-Feynmanよりも高い成功率を維持しました。

  • 単純なタスクにおいて、LLM-Feynmanはノイズレベルが10⁻³および10⁻²の場合でも、それぞれ100%と86%の成功率を達成したのに対し、AI-Feynmanは85%と67%でした。
  • 難しいタスクでは、ノイズレベルが10⁻²の場合、LLM-Feynmanは90%の成功率を維持しましたが、AI-Feynmanは55%に低下しました。

90%とか100%といった数字を見ると、『早く試してみたいな~』となりませんか?


技術的にはどうなんだ?

LLMの専門家ではないので、Geminiに要約してもらいました。

LLM-asking

LLM-Feynmanフレームワークは、自動化されたデータ前処理と特徴エンジニアリング、自己評価と反復改良によるLLMベースの記号回帰モンテカルロ木探索(MCTS)による数式解釈の3つの主要モジュールで構成されています 。  

  1. 自動データ前処理と特徴エンジニアリング: 入力データの特徴量と目標値の物理的な意味と次元を考慮して、欠損値の処理や特徴量の正規化などの前処理を自動的に行います。材料科学の問題に対しては、特徴量の選択、LLM推奨の特徴量マッチング、反復的な特徴量改良という3つの自動化された特徴量計算スキームを組み込んでいます 。  

  2. LLMベースの記号回帰: LLMを活用して数式を生成し、自己評価によって解釈可能性を評価します。そして、多目的最適化を用いて、精度、複雑さ、解釈可能性のバランスを取りながら、最適な数式を探索します 。  

  3. 数式解釈: モンテカルロ木探索(MCTS)とLLMを統合することで、数式の物理的・化学的な意味を体系的に解釈し、改良します。MCTSは、LLMが生成した解釈のアイデアを探索木で表現し、各ノードのスコアをUCB(Upper Confidence Bound)に基づいて決定することで、解釈空間を効率的に探索します。


なんだか、凄そうです!


独自の見解

私の研究者生活を振り返ると、常に経験式との戦いでした。 実験データから材料の特性を予測する経験式を導くことは、材料開発において避けて通れない重要なプロセスですが、多くの時間と労力を要する作業でもありました。 もし、LLM-Feynmanのようなツールがあれば、このプロセスが大幅に効率化され、より迅速に材料開発を進められるのではないかと期待しています。

さらに、これまで個々の研究テーマが終了する度に、そこで得られた経験式は、その場限りの知識として埋もれてしまい、十分に活用されているとは言えない状況でした。 しかし、LLM-Feynmanが、これらの経験式を蓄積し、発展させることを可能にするのであれば、過去の知見を未来の材料開発に活かすことができ、材料開発をさらに加速させることができるかもしれません。

また、企業には長年の研究開発によって蓄積された膨大な量の実験データやノウハウが存在しますが、それらは必ずしも組織全体で共有・活用されているとは限りません。 LLM-Feynmanが、これらの社内に散在する経験・知識を統合し、新たな知見を生み出す力を持つのであれば、材料開発における企業の競争力を大きく向上させる可能性を秘めていると感じています。


今後の展望

この研究がさらに発展すれば、材料開発の現場は大きく変わる可能性があります。 LLM-Feynmanが、研究者の直感や経験に頼っていた部分をAIによって補完し、新たな材料開発の可能性を広げてくれるかもしれません。

今後の研究の進展に、大いに期待したいと思います。



脚注

  1. 記号回帰 (Symbolic Regression): 数式を自動的に発見する技術のことです。与えられたデータに対して、最もよく当てはまる数式を、コンピューターが様々な組み合わせを試しながら探します。

  2. モンテカルロ木探索 (Monte Carlo Tree Search, MCTS): ゲームAIなどでよく使われる探索アルゴリズムの一種で、試行錯誤を繰り返しながら、最適な選択肢を見つけ出すための手法です。この論文では、LLMが生成した数式の解釈を効率的に探索するために用いられています。