材料開発に活用できる機械学習アルゴリズムの具体例:マテリアルズインフォマティクス入門(6)

この記事では…
マテリアルズインフォマティクス(MI)の導入に必要な機械学習の基礎知識について解説します。

(執筆:一之瀬 隼/ 製造業ライター)

前回は、マテリアルズインフォマティクス(MI)で用いられている、機械学習の基本的な知識と、機械学習アルゴリズムを構築する際に用いられるプログラミング言語を紹介しました。今回は、機械学習の具体的なアルゴリズムについて解説します。

材料開発への機械学習アルゴリズム適用例


ここでは、具体的な機械学習アルゴリズムの特徴と、材料開発への適用例を紹介します。教師あり学習からは、ランダムフォレストとベイズ最適化、教師なし学習からは、主成分分析。これら3つのアルゴリズムについて、確認します。

筆者注:各アルゴリズムの説明については、説明用に簡略化して記載しています。専門的に見ると表現が適切でない場合があるかもしれませんが、ご容赦ください。

ランダムフォレスト


ランダムフォレストは、個別に学習をさせた複数の学習結果の多数決を取るアンサンブル学習の一種です。ランダムフォレストの場合には、個別の学習器として決定木を用いており、複数の決定木を組み合わせることで、決定木の弱点である過学習を避けることが可能です。

ランダムフォレストのメリットは、線形回帰や決定木を単体で用いる場合よりも予測精度が高く、データ数が多くても学習が速い点が挙げられます。一方で、アンサンブルされているため、モデルのどの要素が重要なのか分かりにくい場合がある点は、デメリットといえます。

京都大学の研究グループでは、ランダムフォレストを使ってまだ誰も作ったことがない未知の物質の構造を探索するような研究を行っています。ランダムフォレストでは、予測結果に対して、その結果の確度も計算できるため、それを活用することで「まだ作られていないが、作られている物質に近い」物質を見つけ出すことが可能です。

ベイズ最適化


ベイズ最適化は、「活用」と「探索」のバランスを数理・統計に基づいて決定する手法の1つです。

「活用」とは、既にある程度いい結果が得られると分かっている選択をすることです。分かっていることなので失敗はしませんが、経験済みのことよりも優れた結果を得ることはできません。

「探索」とは、未知のものに挑戦し新しい経験をための選択をすることです。失敗するリスクはあるかもしれませんが、今までの経験では得られなかった優れた結果を得られる可能性があります。

ベイズ最適化は汎用性が高く、機械学習のチューニングにも応用可能です。一方で、実装が難しい場合があり、特に材料開発のシミュレーションや実験装置と組み合わせるのは難易度が高いです。

材料開発では、

1. 材料を作成
2. それを評価
3. 結果を考察して次の材料を作成する

という流れを繰り返すことで、狙いの材料を開発していきます。ベイズ最適化を用いることで、蓄積された材料データを元に結果の評価と次の材料を決定する3のプロセスを自動化できる可能性があります。

主成分分析


主成分分析は、教師なし学習の次元削減のなかでも、もっとも広く使われている手法です。複数の変数で表現されるデータに対して、例えばxとyを合成して新たな変数zに置き換え、変数の数を減らすことで、データを解釈しやすくします。

データの次元を減らせるため、多次元データの可視化により解釈がしやすくなる点や過学習を回避しやすくなる点が、主成分分析のメリットです。一方で、情報の損失があり、精度が悪化してしまう点がデメリットとなります。

材料開発への主成分分析の活用としては、周期表を新しい解釈で再構築するようなことが行われています。まずは、各元素に対して特性に影響を与えそうな数十種類の情報を集めます。それを主成分分析にかけ、人間が認知しやすい3次元に次元削減することで、性質が近い元素が近い位置に表示される3次元の周期表を作ることが可能です。

機械学習アルゴリズムの活用で効率的な材料開発を実現


今回は、ランダムフォレスト、ベイズ最適化、主成分分析の3つの機械学習アルゴリズムの特徴と、材料開発への適用例を紹介しました。ここで紹介した情報はほんの一部であり、さまざまな機械学習アルゴリズムが材料開発に活用されています。

材料開発を効率的に進めるためには、機械学習アルゴリズムの知識に加えて、それをどう材料開発に活用するかのアイデアと結果を分析するための材料開発に関する知識、これらを全て組み合わせる必要があります。

個人でこれら全ての役割を担うのは簡単ではありません。基本的な知識を幅広く持った上で、それぞれのメンバーが得意分野を生かしながら材料開発に取り組むことで、マテリアルズインフォマティクスの効果を最大化できるでしょう。

(連載終わり)

プロフィール

一之瀬 隼(いちのせ・しゅん) 自動車部品メーカーの現役エンジニアとして、先行開発から量産展開まで幅広い業務を経験。産まれたばかりの子供の成長を楽しみながら、エンジニアとライターの活動両立に苦戦中! 趣味は旅行(海外も国内も)と美味しいものを食べることと、学ぶこと。

>>執筆者ブログ「悠U自適

sample
PlaBase編集部
PlaBase[プラベース]

これまでカタログや材料メーカー各社のホームページ内に散在していた樹脂(プラスチック)成形材料の情報をPlaBaseに集約しました。 メーカー・樹脂名・物性値など多様な検索方法によって、お客様の目的に合った樹脂成形材料のデータを探し出すことができます。