機械学習の先進的な事例 生産機械 (S3-110)
Summary
TLDRこのビデオスクリプトは、機械学習が製造業の異常検知にどのように役立つかを説明しています。IoTの導入により、ビッグデータをリアルタイムに解析し、安定した生産を維持し、設備効率を最大化することが可能になりました。機械学習は、データからモデルを学習することで、正規分布を仮定しないデータドリブンな処理が可能になります。異常検知には、排他識別や総体識別など、様々な機械学習の方法が用いられますが、製造現場では特に排他識別が一般的です。実際の事例を通じて、加工機械から得られたデータを使って異常を検知する方法が解説されています。
Takeaways
- 🌟 機械学習は製造業で安定した生産と設備効率の最大化を目指す異常検知に役立ちます。
- 📈 IoTの導入は製造工程でビッグデータをリアルタイムに解析し、予兆を検知することで安定生産を実現します。
- 🔍 異常検知は、データドリブンな機械学習技術を用いて、正規分布を仮定しないモデルから学習します。
- 📊 分類器は異常検知に使用され、排他識別と総体識別の2つの方法があります。
- 🔎 排他識別は正常品の分布に属さない観測値を検知し、たまたま発生する異常を見つけるのに適しています。
- 🔄 総体識別は観測値が特定の群に属するのかを検知し、設備の運転状況のロックを検知するのに適しています。
- 🛠️ 製造現場では、学習データが少ないため排他識別が総体識別よりも一般的に使用されます。
- 📊 カーネル密度推定法はデータの分布をモデル化し、異常検知のための期待分布を定義するために使用されます。
- 📉 異常検知の仕組みでは、期待分布からの逸脱は重要な指標ですが、閾値の設定が誤ると異常を検知しにくくなります。
- ⏱️ 異常の予兆は生産開始からすぐに観測でき、工程条件の是正が早ければ異常を回避可能であることが示唆されます。
Q & A
吉野睦さんは、何についての講義を担当していますか?
-吉野睦さんは、機械学習の精神的な事例、特にビッグデータを用いた異常検知について学ぶ講義を担当しています。
IoTが導入される目的は何ですか?
-IoTが導入される目的は、安定した生産を続ける、止まらない工程を実現することによって設備効率を最大化することです。
ビッグデータはどのようにして安定した生産を助けるのですか?
-ビッグデータはリアルタイムに解析され、異常の予兆を検知し、工程条件を是正することで安定した生産を助けます。
機械学習はなぜ異常検知に役立ちますか?
-機械学習は、データからモデルを学習するデータドリブンな処理が可能であり、正規分布などの前提がなくても適用できるためです。
異常検知に用いられる機械学習の方法は何ですか?
-異常検知に用いられる機械学習の方法には、分類器が主に用いられます。分類器は排他識別と総体識別に大別されます。
排他識別と総体識別の違いは何ですか?
-排他識別は正常品の分布に属さない観測値を検知する方法で、たまたま発生する異常を見つけるのに適しています。総体識別は観測値がどの群に属するのかを検知する方法で、設備の運転状況が特定の状態にロックしているような状況を検知するのに適しています。
製造現場でなぜ排他識別が好まれるのですか?
-製造現場では総体識別は学習時に正常品と異常品のデータを同数必要としますが、実際の不良率は高くないのでデータが集まりません。一方で排他識別は正常品のデータだけでもモデルを構築できます。
カーネル密度推定法とは何ですか?
-カーネル密度推定法は、核となる関数、カーネル関数をいくつも頂点に立てて、グネグネした局面を表現する方法です。一般にはガウス関数が用いられます。
異常検知の仕組みで注意しなければならない点は何ですか?
-異常検知の仕組みで注意しなければならない点は、期待分布を逸脱しても、確率が5%以内のものは正常とみなされるという点です。
データの逸脱度を指標化する方法には何がありますか?
-データの逸脱度を指標化する方法には、それぞれのデータ点に対する推定密度から二の対数尤度を計算する方法や、移動平均を使う方法があります。
この講義の事例で示されたデータはどのようにして異常を検知するのですか?
-この講義の事例では、加工品の直径やバイトハグのストロークのデータから、期待分布から逸脱しているデータを95%の信頼範囲で特定し、その逸脱度を指標化することで異常を検知しています。
Outlines
🛠️ 異常検知と製造業における機械学習の活用
株式会社デンソーの吉野睦が機械学習を用いた生産機械の異常検知について解説しています。製造業では、安定生産と設備効率の最大化のためにIoT技術が導入されています。このIoTデータをリアルタイムで解析し、異常の予兆を検知し、製造プロセスの条件を自動で調整する仕組みです。特に異常検知には機械学習が活用され、データドリブンなアプローチが可能となることが強調されています。異常検知の方法として、排他識別や総体識別が紹介され、製造現場では学習データが不足するため、主に排他識別が利用される理由が説明されています。
📊 データの可視化と異常検知の具体例
機械学習を使った異常検知の詳細な手順について説明しています。時系列データの可視化により、正規分布に基づく古典的な管理方法では捉えきれないデータの特性が明らかになります。カーネル密度推定法を用いてデータをモデル化し、異常検知を行います。異常の予兆を早期に検出し、適切なアクションを取ることが重要であり、例として生産開始後約500台目で異常の兆候が観測され、その時点で工程条件を是正すれば最終的な異常を回避できた可能性が示されています。
Mindmap
Keywords
💡機械学習
💡ビッグデータ
💡IoT
💡異常検知
💡データドリブン
💡分類器
💡カーネル密度推定
💡期待分布
💡逸脱度
💡自律的制御
Highlights
株式会社デンソーの吉野睦が第1集の第10回を担当。
機械学習の精神的な事例として、生産機械について学ぶ。
ビッグデータを用いた異常検知の活用事例を紹介する予定。
製造業でIoTの導入が進む。
IoTの目的は安定生産と設備効率の最大化。
ビッグデータをリアルタイムに解析して予兆を検知。
自律的制御で工程条件の是正が自動的に行われる。
機械学習は正規分布の過程がなくてもデータからモデルを学習可能。
異常検知に用いられる機械学習方法は主に分類器。
分類器は排他識別と総体識別に分かれる。
排他識別は正常品の分布に属さない観測値を検知。
総体識別は観測値がどの群に属するのかを検知。
製造現場では排他識別が一般的に用いられる。
総体識別は学習時に正常品と異常品のデータが同数必要。
排他識別は正常品のデータだけでもモデルを構築可能。
加工機からのデータで異常が大量に発生している箇所を特定。
データのモデル化にはカーネル密度関数法が用いられる。
カーネル密度推定法で正常時の95%が含まれる領域を特定。
異常検知の仕組みは期待分布を逸脱しても5%以内は正常とみなす。
期待分布の範囲を広げすぎると予兆検出が難しくなる。
異常検知の予兆は生産開始後約500台目から観測される。
異常検知の活用が今後期待されている。
Transcripts
こんにちは株式会社デンソーの吉野睦です
第1集の第10回を担当します
今回は機械学習の精神的な事例
生産機械について学びます
具体的にはビッグデータを用いた異常検知について
活用事例を紹介したいと思います
現在製造業では iot を積極的に導入し始めています
iot は internet of things の略称です
導入の目的は安定生産を続ける
止まらない工程を実現することによって設備効率を最大化することです
そのために製造工程ないから収集されたビッグデータをリアルタイムに解析して
以上の予兆を検知し常に安定生産ができるよう
工程条件を是正します
皇帝条件の是正は自律的用制御を用いて自動的に行われます
実績を制御に関する説明は本稿では割愛します
さて
工程から収集されたビッグデータの解析には機械学習が使用されます
その理由は
古典統計が前提としている正規分布の過程がなくても
データからモデルを学習するいわゆる
データドリブンな処理が可能だからです
機械学習方法は侏儒ありますが異常検知に用いられる
主な方法を次のページに示します
本稿では期待分布からの逸脱を適用した事例を紹介します
この表は
異常検知の方法をまとめたものです
もちろんこの表に記載した方法以外にも多数の方法が提案されています
異常検知に用いる方法は主に分類器です
分類器は排他識別と総体識別に大別されます
それぞれアノマリーがたシグネチャ型とも呼ばれます
はいた識別は正常軍を学習しておいてその分布に属さない
観測値を検知する方法です
たまたま発生する異常を見つけるのに適しています
この中で関連性からの逸脱は少し変わっていて
多次元の空間に正常軍が載っている
超平面があるのですがその超平面からの逸脱を検知するという方法です
総体識別は観測値が123のどの群に属するのかを検知する方法で設備の運転状況が
ある状態に連続してロックしているような状況を検知するのに適しています
この中で dtw は圧力変化などの波形の分類を行う方法です
ところで製造現場では排他識別が用いられることが多いのですがその理由について説明
しておきます
一般的に総体識別は学習時に聖霊
プレーを同数程度必要とします
しかし工程ない不良率はそんなに高くありませんので分類器を構築できるくらいの以上
品フレイはなかなか集まりません
一方履いた識別は学習時のデータが正常品
精霊の身であってもモデルを構築できます
そのため製造現場では排他識別が好んで用いられるのです
では事例を見ていきましょう
これらのグラフはマシニングセンターと呼ばれる加工機から得られた
1日分のデータです
グラフの縦軸はそれぞれ加工品の直径とバイトハグのストロークです
線分台のデータだけを持ち上の桁は取り除いてあります
グラフの横軸は生産台数です
加工品の直径がガクンと小さくなる箇所が参加者ありますがこれはハグを交換した
タイミングです
新品の刃は切れ味が良いので少し削り席になっています
でもこれは異常ではありません
さてこのデータには以上が大量に発生している箇所がありますがそれがどこかわかり
ますか
またその予兆も観測されているのですがそれがどこから始まっているか分かりますか
機械学習を用いるとこれらが明らかになります
順を追って説明していきます
このグラフは全ページの時系列データを散布図にしてみたものです
各々のデータのヒストグラムを合わせて表示しています
1日数点しか観測しない古典的な管理方法では正規分布を仮定せざるを得ないのですが
このように全数データを観測すると明らかに正規分布ではないことがわかります
2次元正規分布とみなした時の投稿楕円を重ねて表示していますが
このように分布を仮定して逸脱を調べることは無理だとわかります
そこでこのいびつな分布をデータドリブンでモデル化して吐いた識別を行います
なお本来は教師データとして正常に推移した
別の日のデータを用いるべきですがそれが入手出来なかったのでこの事例では
以上含んだこの日の観測データを用いています
このようなケースでは閾値設定に配慮が必要です
データのモデル化にはカーネル密度関数法あるいは
カーネル密度推定法と言われる方法を用います
カーネル密度関数法とは核となる関数
カーネル関数をいくつも頂上して
グネグネした局面を表現する方法です
カーネル関数には一般にガウス関数が用いられます
本事例もガウス関数を用いました
その結果を図示しています推定関数に基づき
正常時の95%が含まれる領域を投稿線で示しました
これが機体分布になります
また来たい分布から逸脱しているデータはわかりやすいように打点で示しています
実際には
この日は以上が大量発生していましたので打点は全体の5%ではなく約12%を占めて
います
異常検知の仕組みで注意しべき点は期待分布を逸脱しても
1立つ率が5%内のうちは皇帝は正常だということです
もしそれが嫌だ
正常ならば逸脱はゼロにしたいと考えて期待分布の範囲を全体の99.7%のように
広くしてしまうとほとんどのデータが機体分布に含まれてしまい
予兆検出ができなくなります
さて先ほどの期待分布を逸脱した打点を元のグラフに色を変えてプロットしていました
これだけではよくわかりませんのでさらに逸脱度を指標化してみました
5月度の指標化にはそれぞれの打打点に対する推定密度から二の対数尤度を計算して
プロットする方法がよく用いられますが
この方法は経験的にデータが暴れることがわかっていますので私は移動平均を使うこと
をおすすめします
この3つのグラフの一番下のグラフは過去に向けて指数減衰する重みを課した
発生率の移動平均を示しています
このような移動平均は一般的には良い wma
expo ねぇシャリー上テッド moving average と言われています
このグラフから
この日は生産開始から500個くらいまでは逸脱度は最大5%で推移していることが
読み取られますそこまでは正常だったということです
しかしその後1脱童は正常とみなされる5%を超え始め最後の一瞬には全体の80%が
期待分布から逸脱していることが分かります
ただしこの状態が検知されてからアクションを始めても手遅れです
それより重要なのは生産開始後約500台目からすでに以上の予兆が観測されている
ことです
この時工程条件を是正すれば最後の逸脱は回避できるのです
今後このような活用が期待されています
Weitere ähnliche Videos ansehen
5.0 / 5 (0 votes)