IOT・AI活用事例ウェブセミナ

本文

最近流行の注目単語A 機械学習・統計学 -製造業における活用事例とポイント-

2018.07.17

今回は機械学習に関して従来の統計学との比較、事例を紹介します。
*「機械学習」の詳細については書籍で勉強していただき、ここでは活用のヒントとなる事例を二つ紹介します。
*機密保持のため、若干抽象的な表現になっている部分があります。

1)機械学習と統計学の違いについて

従来の製造業での分析では、私の見る限り統計学を用いて来ました。例えば、実験計画法、ワイブル分布、レイリー分布といったものから統計学に基づいたシックスシグマ法まで基本的には統計学と言われるものと関連づいています。

ところが近年では、機械学習という言葉が見かけてきています。これらの違いは、実は余りありません。機械学習の手法の一種として統計学を用いる事も多いためです。機械学習は「人間が経験的に行っている学習能力と同様の推測をコンピュータで再現」しようとする手法になります。統計学も「過去のデータから、応用数理の手法を用いて数値上の性質や規則性」を見出す学問になります。機械学習においても、人が見つけるような規則性を見出すために統計学を用いる事があります。しかし異なるような技術・考え方もあります。

具体的には、統計学は「原因追及」やモデルの成り立ちを説明する事に重きを置いています。例えばですが、TOEICの点数で悪かったとします。TOEICの場合ですとリスニングパートで短い文章・長い文章、またリーディングパートで語彙、文法といった様々パートで自分の不得意な部分や得意な部分が点数で評価されます。こういったリスニングで悪いといった事や語彙力が低いといった事が原因追及にあたります。この説明力が必要な時は統計学を用いるほうが推奨されます。

異常を自動的に今後知りたいといった際、いちいち異常が出るたびに説明をしっかりする必要がないケースは機械的に学習して自動的化する機械学習のほうが優れています。

2)製造業での機械学習及び統計分析の活用事例1

異常データ生成
業種:加工メーカー
従業員数:非公開
活用ポイント:統計分析と機械学習の使い分け、データ蓄積により予測精度向上

故障データは一般的に、非常に少ないため予測するのに十分なデータが集まることは少ない事が多いです。そういった時でも機械学習を用いる事により、データ量を増やしたり、正常なデータを減らしたりする事で統計的な原因追及をしたり、予測モデルを作る事が可能です。

現場ではマシニングセンタの切削加工での軸受けの冶具上に取り付けていた測定センサーでの振動を計測していました。マシニングマシンの軸が大きく振動すると工具の摩耗に繋がり、高価な工具寿命も短くなり更に加工不良の損失も大きいです。工具の摩耗を減らすために大きく振動している原因が知りたいというお話でした。ただしこの振動データは全体の2%ぐらいしか異常な動きはしておらず、統計分析をしてもこの大きく振動をする原因がつかめないという厄介な問題です。フーリエ変換等の手法でも原因はつかめませんでした。

統計解析の弱点としては、予測に対しての精度が弱い事が多いです。統計的な手法ではなく機械学習を用いる場合は、予測に対する精度が弱いときになります。最初用いた手法は多変量解析の一種である部分的最小二乗回帰を用いていたが、振動データは全体の2%ぐらいしか異常な動きはしておらず、モデルの精度の観点からはどうしても全てを正常と判断、異常を予測できませんでした。

そこで機械学習の中で持ちられるやり方で再トライ、機械的に異常データと正常データを増やす事と減らす事で上手く原因の予測ができるようにしました。アルゴリズム名はSMOTEというやり方です。

具体的な原因としては、マシンニングマシンの端の方でかつ、固いものを削るときにどうしても振動が大きくなってしまう。真ん中らへんでは上手くいくのに端の方だと電流値が大きくなっていたのが原因でした。

ポイントとして日頃のオペレーションにおいて、古いデータに新しいデータを投入する事によってモデルを機械的に更新する事で異常値の当たる率がよくなっていきました。そういった事を重ね、原因追求及び予測モデルの構築をしていきました。

2)製造業での機械学習及び統計分析の活用事例2

上質な油を求めて
業種:水産加工
従業員数:非公開
活用ポイント:社内の知見と機械学習の特徴量の比較

水産加工で、油を加工していく際のガス濃度を適切に設計していきたいという問題です。
油を加工していく際に、油の中でも上質な部分を残していくと上質な油が出来ていくのですが、常圧蒸留装置の中を通っていく際に成分が幾分か抜けていってしまい品質が落ちてしまいます。

常圧蒸留装置がなければ、不純物も取り除くことはできません。圧力・温度・外気温といったパラメーターもありますが、中のガスの酸素濃度を調整していく必要があります。常圧蒸留装置の各ステップでデータを取得しているため、ざっとパラメーターだけでも50種類以上あります。また統計分析では苦手な「多重共線性」が発生しています。

多重共線性とは、原因の説明変数の間に関係性があると予測精度等が落ちてしまうという事が発生します。今までは統計分析を用いて、一つ一つ特徴量と呼ばれるものを作成していました。例えばですが、常圧蒸留装置の3ステップでの温度と外気温が〇〇以上の時で、圧力が〇〇異常の時は異常が起こる可能性があるといったようなことです。

職人的な経験による運転条件を微修正は確かに必要ですが、属人化しやすいというデメリットもあります。またちょくちょくと細かい集計をし、上のような特徴量が増えているのも問題でした。

社内の知見や職人の経験では限界

こういった時に、機械学習は自動的に特徴量を作っていってくれるため適切な使い方になります。また因果関係も自動的に捉えてくれるため、疑似相関という事も減り、機械学習で自動的に作ったモデルの方がわかりやすかったという事にもなりました。疑似相関というのは以下のような場合です。

今まではある工程Bでのガス濃度が次工程の濃度に影響していると考えられていました。

しかし実際に機械学習にて、分析を進めると以下のような関係でした。

工程Bのガス濃度が工程Cにも影響をしており、その濃度が上質な油の濃度を決めていたのです。直接的には工程Bのガス濃度と工程Cでの上質な油の濃度は実は関係なかったのです。

この工程Cでのガス濃度はコントロールできる変数だったため、工程Cでのガス濃度を調整する事で工程Cでの上質な油の濃度を高める事が可能になり、最終フェーズへの上質な油を維持していく事が可能になったのです。社内の知見は確かに大切ですが、職人に任してしまうと属人化してしまう対象も機械学習で自動的に特徴量作る事で簡素化できる可能性が十分にあります。

コラムへのお問い合わせ

・オムロンエフエーストア編者から
製造でのデータサイエンス応用って難しいと思われませんか?事例が少なく、数式・数学・各種手法が難しい、費用対効果がわからない、正答率が高くないと実用にならない、などハードルは高いです。
エフエーストアでは製造現場へのデータサイエンス活用に関して専門家に依頼、ウェブセミナを開始します。できるだけ事例紹介を多くしてヒントになる、かつ一方通行的内容にならないよう各回で質問をお受けしてFAQとして回答を掲載します。FAQ形式として、回答に会社名、個人名等は記載されません。またご質問が質問のあった次回以降にとりあげる内容の場合FAQには非掲載にさせていただきます。本セミナのご質問は、各回のお問い合わせフォームより行ってください。エフエーストアフリーダイヤルお客様相談室フリーダイヤルでは受け付けておりません。