機械学習の先進的な事例 生産機械 (S3-110)

数理・データサイエンス教育強化拠点コンソーシアム
24 Jun 202010:19

Summary

TLDRこのビデオスクリプトは、機械学習が製造業の異常検知にどのように役立つかを説明しています。IoTの導入により、ビッグデータをリアルタイムに解析し、安定した生産を維持し、設備効率を最大化することが可能になりました。機械学習は、データからモデルを学習することで、正規分布を仮定しないデータドリブンな処理が可能になります。異常検知には、排他識別や総体識別など、様々な機械学習の方法が用いられますが、製造現場では特に排他識別が一般的です。実際の事例を通じて、加工機械から得られたデータを使って異常を検知する方法が解説されています。

Takeaways

  • 🌟 機械学習は製造業で安定した生産と設備効率の最大化を目指す異常検知に役立ちます。
  • 📈 IoTの導入は製造工程でビッグデータをリアルタイムに解析し、予兆を検知することで安定生産を実現します。
  • 🔍 異常検知は、データドリブンな機械学習技術を用いて、正規分布を仮定しないモデルから学習します。
  • 📊 分類器は異常検知に使用され、排他識別と総体識別の2つの方法があります。
  • 🔎 排他識別は正常品の分布に属さない観測値を検知し、たまたま発生する異常を見つけるのに適しています。
  • 🔄 総体識別は観測値が特定の群に属するのかを検知し、設備の運転状況のロックを検知するのに適しています。
  • 🛠️ 製造現場では、学習データが少ないため排他識別が総体識別よりも一般的に使用されます。
  • 📊 カーネル密度推定法はデータの分布をモデル化し、異常検知のための期待分布を定義するために使用されます。
  • 📉 異常検知の仕組みでは、期待分布からの逸脱は重要な指標ですが、閾値の設定が誤ると異常を検知しにくくなります。
  • ⏱️ 異常の予兆は生産開始からすぐに観測でき、工程条件の是正が早ければ異常を回避可能であることが示唆されます。

Q & A

  • 吉野睦さんは、何についての講義を担当していますか?

    -吉野睦さんは、機械学習の精神的な事例、特にビッグデータを用いた異常検知について学ぶ講義を担当しています。

  • IoTが導入される目的は何ですか?

    -IoTが導入される目的は、安定した生産を続ける、止まらない工程を実現することによって設備効率を最大化することです。

  • ビッグデータはどのようにして安定した生産を助けるのですか?

    -ビッグデータはリアルタイムに解析され、異常の予兆を検知し、工程条件を是正することで安定した生産を助けます。

  • 機械学習はなぜ異常検知に役立ちますか?

    -機械学習は、データからモデルを学習するデータドリブンな処理が可能であり、正規分布などの前提がなくても適用できるためです。

  • 異常検知に用いられる機械学習の方法は何ですか?

    -異常検知に用いられる機械学習の方法には、分類器が主に用いられます。分類器は排他識別と総体識別に大別されます。

  • 排他識別と総体識別の違いは何ですか?

    -排他識別は正常品の分布に属さない観測値を検知する方法で、たまたま発生する異常を見つけるのに適しています。総体識別は観測値がどの群に属するのかを検知する方法で、設備の運転状況が特定の状態にロックしているような状況を検知するのに適しています。

  • 製造現場でなぜ排他識別が好まれるのですか?

    -製造現場では総体識別は学習時に正常品と異常品のデータを同数必要としますが、実際の不良率は高くないのでデータが集まりません。一方で排他識別は正常品のデータだけでもモデルを構築できます。

  • カーネル密度推定法とは何ですか?

    -カーネル密度推定法は、核となる関数、カーネル関数をいくつも頂点に立てて、グネグネした局面を表現する方法です。一般にはガウス関数が用いられます。

  • 異常検知の仕組みで注意しなければならない点は何ですか?

    -異常検知の仕組みで注意しなければならない点は、期待分布を逸脱しても、確率が5%以内のものは正常とみなされるという点です。

  • データの逸脱度を指標化する方法には何がありますか?

    -データの逸脱度を指標化する方法には、それぞれのデータ点に対する推定密度から二の対数尤度を計算する方法や、移動平均を使う方法があります。

  • この講義の事例で示されたデータはどのようにして異常を検知するのですか?

    -この講義の事例では、加工品の直径やバイトハグのストロークのデータから、期待分布から逸脱しているデータを95%の信頼範囲で特定し、その逸脱度を指標化することで異常を検知しています。

Outlines

00:00

🛠️ 異常検知と製造業における機械学習の活用

株式会社デンソーの吉野睦が機械学習を用いた生産機械の異常検知について解説しています。製造業では、安定生産と設備効率の最大化のためにIoT技術が導入されています。このIoTデータをリアルタイムで解析し、異常の予兆を検知し、製造プロセスの条件を自動で調整する仕組みです。特に異常検知には機械学習が活用され、データドリブンなアプローチが可能となることが強調されています。異常検知の方法として、排他識別や総体識別が紹介され、製造現場では学習データが不足するため、主に排他識別が利用される理由が説明されています。

05:03

📊 データの可視化と異常検知の具体例

機械学習を使った異常検知の詳細な手順について説明しています。時系列データの可視化により、正規分布に基づく古典的な管理方法では捉えきれないデータの特性が明らかになります。カーネル密度推定法を用いてデータをモデル化し、異常検知を行います。異常の予兆を早期に検出し、適切なアクションを取ることが重要であり、例として生産開始後約500台目で異常の兆候が観測され、その時点で工程条件を是正すれば最終的な異常を回避できた可能性が示されています。

Mindmap

Keywords

💡機械学習

機械学習は、コンピュータがデータから学習し、経験を通じて改善する技術です。ビデオでは、機械学習が製造機械の異常検知に適用され、ビッグデータを用いたモデルから予測や診断が行われます。例として、加工機械のデータから異常を検知する手法が説明されています。

💡ビッグデータ

ビッグデータとは、膨大な量のデータを指し、リアルタイムに解析することで洞察を得ることができます。ビデオでは、製造工程から収集されたビッグデータが機械学習に用いられ、異常の予兆を検知し、安定した生産を維持する方法が語られています。

💡IoT

IoTは「Internet of Things」の略で、物(thing)がインターネットを介して相互にデータを交換する技術を指します。ビデオでは、製造業でIoTを積極的に導入し、設備効率を最大化する目的で使用されています。

💡異常検知

異常検知とは、通常とは異なるパターンや予期しないイベントを検出するプロセスです。ビデオでは、機械学習を用いた異常検知が導入され、製造工程の安定性を確保する上で重要な役割を果たしています。

💡データドリブン

データドリブンは、データに基づいて意思決定やアクションをとるアプローチを指します。ビデオでは、機械学習がデータドリブンな処理が可能とされ、正規分布などの前提なしにモデルを学習する能力があると説明されています。

💡分類器

分類器は、データポイントを特定のカテゴリに分類する機械学習のアルゴリズムです。ビデオでは、異常検知に使用される分類器が排他識別と総体識別に分けられ、それぞれの特徴や使用例が説明されています。

💡カーネル密度推定

カーネル密度推定は、確率密度関数を推定する統計的手法です。ビデオでは、カーネル密度関数法が用いられ、異常検知においてデータの分布をモデル化し、異常の予兆を特定する際に役立ちます。

💡期待分布

期待分布とは、データが従うと予想される分布です。ビデオでは、異常検知において期待分布からの逸脱を用いて異常を検出する手法が取り上げられており、その重要性が強調されています。

💡逸脱度

逸脱度とは、データが期待分布からどれだけ遠いかを示す指標です。ビデオでは、逸脱度を指標化し、異常の予兆を監視する手法が取り上げられています。具体的には、移動平均を使って逸脱度を可視化する例が説明されています。

💡自律的制御

自律的制御とは、システムが自分自身で意思決定し、状況に応じて行動を調整する制御方式です。ビデオでは、製造工程の条件が自律的制御によって自動的に是正され、安定した生産が維持されると説明されています。

Highlights

株式会社デンソーの吉野睦が第1集の第10回を担当。

機械学習の精神的な事例として、生産機械について学ぶ。

ビッグデータを用いた異常検知の活用事例を紹介する予定。

製造業でIoTの導入が進む。

IoTの目的は安定生産と設備効率の最大化。

ビッグデータをリアルタイムに解析して予兆を検知。

自律的制御で工程条件の是正が自動的に行われる。

機械学習は正規分布の過程がなくてもデータからモデルを学習可能。

異常検知に用いられる機械学習方法は主に分類器。

分類器は排他識別と総体識別に分かれる。

排他識別は正常品の分布に属さない観測値を検知。

総体識別は観測値がどの群に属するのかを検知。

製造現場では排他識別が一般的に用いられる。

総体識別は学習時に正常品と異常品のデータが同数必要。

排他識別は正常品のデータだけでもモデルを構築可能。

加工機からのデータで異常が大量に発生している箇所を特定。

データのモデル化にはカーネル密度関数法が用いられる。

カーネル密度推定法で正常時の95%が含まれる領域を特定。

異常検知の仕組みは期待分布を逸脱しても5%以内は正常とみなす。

期待分布の範囲を広げすぎると予兆検出が難しくなる。

異常検知の予兆は生産開始後約500台目から観測される。

異常検知の活用が今後期待されている。

Transcripts

play00:01

こんにちは株式会社デンソーの吉野睦です

play00:05

第1集の第10回を担当します

play00:09

今回は機械学習の精神的な事例

play00:13

生産機械について学びます

play00:16

具体的にはビッグデータを用いた異常検知について

play00:20

活用事例を紹介したいと思います

play00:24

現在製造業では iot を積極的に導入し始めています

play00:30

iot は internet of things の略称です

play00:36

導入の目的は安定生産を続ける

play00:39

止まらない工程を実現することによって設備効率を最大化することです

play00:45

そのために製造工程ないから収集されたビッグデータをリアルタイムに解析して

play00:52

以上の予兆を検知し常に安定生産ができるよう

play00:56

工程条件を是正します

play01:00

皇帝条件の是正は自律的用制御を用いて自動的に行われます

play01:07

実績を制御に関する説明は本稿では割愛します

play01:13

さて

play01:14

工程から収集されたビッグデータの解析には機械学習が使用されます

play01:21

その理由は

play01:23

古典統計が前提としている正規分布の過程がなくても

play01:28

データからモデルを学習するいわゆる

play01:32

データドリブンな処理が可能だからです

play01:36

機械学習方法は侏儒ありますが異常検知に用いられる

play01:41

主な方法を次のページに示します

play01:45

本稿では期待分布からの逸脱を適用した事例を紹介します

play01:53

この表は

play01:55

異常検知の方法をまとめたものです

play01:58

もちろんこの表に記載した方法以外にも多数の方法が提案されています

play02:06

異常検知に用いる方法は主に分類器です

play02:10

分類器は排他識別と総体識別に大別されます

play02:15

それぞれアノマリーがたシグネチャ型とも呼ばれます

play02:21

はいた識別は正常軍を学習しておいてその分布に属さない

play02:27

観測値を検知する方法です

play02:30

たまたま発生する異常を見つけるのに適しています

play02:35

この中で関連性からの逸脱は少し変わっていて

play02:40

多次元の空間に正常軍が載っている

play02:43

超平面があるのですがその超平面からの逸脱を検知するという方法です

play02:51

総体識別は観測値が123のどの群に属するのかを検知する方法で設備の運転状況が

play03:01

ある状態に連続してロックしているような状況を検知するのに適しています

play03:10

この中で dtw は圧力変化などの波形の分類を行う方法です

play03:18

ところで製造現場では排他識別が用いられることが多いのですがその理由について説明

play03:25

しておきます

play03:28

一般的に総体識別は学習時に聖霊

play03:33

プレーを同数程度必要とします

play03:37

しかし工程ない不良率はそんなに高くありませんので分類器を構築できるくらいの以上

play03:44

品フレイはなかなか集まりません

play03:48

一方履いた識別は学習時のデータが正常品

play03:53

精霊の身であってもモデルを構築できます

play03:58

そのため製造現場では排他識別が好んで用いられるのです

play04:06

では事例を見ていきましょう

play04:10

これらのグラフはマシニングセンターと呼ばれる加工機から得られた

play04:14

1日分のデータです

play04:19

グラフの縦軸はそれぞれ加工品の直径とバイトハグのストロークです

play04:27

線分台のデータだけを持ち上の桁は取り除いてあります

play04:33

グラフの横軸は生産台数です

play04:38

加工品の直径がガクンと小さくなる箇所が参加者ありますがこれはハグを交換した

play04:45

タイミングです

play04:48

新品の刃は切れ味が良いので少し削り席になっています

play04:52

でもこれは異常ではありません

play04:56

さてこのデータには以上が大量に発生している箇所がありますがそれがどこかわかり

play05:02

ますか

play05:05

またその予兆も観測されているのですがそれがどこから始まっているか分かりますか

play05:13

機械学習を用いるとこれらが明らかになります

play05:17

順を追って説明していきます

play05:22

このグラフは全ページの時系列データを散布図にしてみたものです

play05:28

各々のデータのヒストグラムを合わせて表示しています

play05:35

1日数点しか観測しない古典的な管理方法では正規分布を仮定せざるを得ないのですが

play05:41

このように全数データを観測すると明らかに正規分布ではないことがわかります

play05:51

2次元正規分布とみなした時の投稿楕円を重ねて表示していますが

play05:57

このように分布を仮定して逸脱を調べることは無理だとわかります

play06:04

そこでこのいびつな分布をデータドリブンでモデル化して吐いた識別を行います

play06:12

なお本来は教師データとして正常に推移した

play06:17

別の日のデータを用いるべきですがそれが入手出来なかったのでこの事例では

play06:23

以上含んだこの日の観測データを用いています

play06:30

このようなケースでは閾値設定に配慮が必要です

play06:36

データのモデル化にはカーネル密度関数法あるいは

play06:41

カーネル密度推定法と言われる方法を用います

play06:46

カーネル密度関数法とは核となる関数

play06:49

カーネル関数をいくつも頂上して

play06:53

グネグネした局面を表現する方法です

play06:57

カーネル関数には一般にガウス関数が用いられます

play07:01

本事例もガウス関数を用いました

play07:06

その結果を図示しています推定関数に基づき

play07:11

正常時の95%が含まれる領域を投稿線で示しました

play07:16

これが機体分布になります

play07:20

また来たい分布から逸脱しているデータはわかりやすいように打点で示しています

play07:27

実際には

play07:28

この日は以上が大量発生していましたので打点は全体の5%ではなく約12%を占めて

play07:36

います

play07:39

異常検知の仕組みで注意しべき点は期待分布を逸脱しても

play07:45

1立つ率が5%内のうちは皇帝は正常だということです

play07:52

もしそれが嫌だ

play07:54

正常ならば逸脱はゼロにしたいと考えて期待分布の範囲を全体の99.7%のように

play08:02

広くしてしまうとほとんどのデータが機体分布に含まれてしまい

play08:07

予兆検出ができなくなります

play08:12

さて先ほどの期待分布を逸脱した打点を元のグラフに色を変えてプロットしていました

play08:20

これだけではよくわかりませんのでさらに逸脱度を指標化してみました

play08:27

5月度の指標化にはそれぞれの打打点に対する推定密度から二の対数尤度を計算して

play08:34

プロットする方法がよく用いられますが

play08:37

この方法は経験的にデータが暴れることがわかっていますので私は移動平均を使うこと

play08:44

をおすすめします

play08:47

この3つのグラフの一番下のグラフは過去に向けて指数減衰する重みを課した

play08:54

発生率の移動平均を示しています

play08:58

このような移動平均は一般的には良い wma

play09:03

expo ねぇシャリー上テッド moving average と言われています

play09:08

このグラフから

play09:10

この日は生産開始から500個くらいまでは逸脱度は最大5%で推移していることが

play09:17

読み取られますそこまでは正常だったということです

play09:22

しかしその後1脱童は正常とみなされる5%を超え始め最後の一瞬には全体の80%が

play09:32

期待分布から逸脱していることが分かります

play09:38

ただしこの状態が検知されてからアクションを始めても手遅れです

play09:44

それより重要なのは生産開始後約500台目からすでに以上の予兆が観測されている

play09:52

ことです

play09:54

この時工程条件を是正すれば最後の逸脱は回避できるのです

play10:01

今後このような活用が期待されています

Rate This

5.0 / 5 (0 votes)

Related Tags
機械学習異常検知IoT製造業ビッグデータ自動制御データドリブン分類器予兆検知カーネル密度品質管理
Do you need a summary in English?