実践統計学入門 QC7つ道具の使い方 異常検出

はじめに

品質管理において、定量的なものの代表はQC7つ道具であり、定性的なものは新QC7つ道具となる。

QC7つ道具とは、パレート図ヒストグラム、散布図、特性要因図、チェックシート、グラフ、管理図であり、このうち定性的なものはチェックシートであり、そのほかはコンピュータを用いて解析が可能である。

新QC7つ道具とは、親和図法、連関図法、系統図法、マトリックス図法、アローダイアグラム、PDPC法、主成分分析であり、このうち定量的なものは主成分分析がコンピュータを用いて解析が可能である。

ここでは、定量的なQC7つ道具のうち、チェックシートを除く6つの手法を、生産現場の故障の発生までの経緯を模擬的にたどることにする。

データは福井教授の作成した品質管理1.txtを用いるので、福井教授作成のマニュアルと併せて読まれることをお勧めする。

QC7つ道具

使用するデータ。それぞれの工場での初期不良の発生個数

これを折れ線グラフで不良品の発生個数のバラツキ具合を見てみる。

品質管理はORに入っている。ここでQC7つ道具を選ぶ

折れ線グラフを選択する

折れ線グラフ

このグラフから、工場3のバラツキが大きいように思えるのでパレート図を用いて、改善すべきかどうかを判断する。

パレート図を作成するメニュー

実際のパレート図

この図からは工場2と工場3が同じであり、先ほどの折れ線とは結果が違っている、つまり初期不良が特別多いようには思われない。

しかし、工場の重要性は金額ベースでも見る必要がある。そこで、金額ベースの損失のデータでもパレート図を描いてみる。

金額ベースのデータ

金額ベースのパレート図

これを見ると、工場3の損失が他に比べておおきいのがわかる。従って、早急に改善すべきは工場3の初期不良の改善である。

そこで工場3のデータは1つなので「x 管理図」を用いて異常を調べる(データが複数個ある場合は𝑥̅管理図を用いる)

X管理図。このグラフより管理限界線近くにまで跳ね上がっている点がある

また、ばらつきの異常を調べるために𝑅管理図を用いて調べてみる。

R管理図。管理限界線を越えたバラツキが見て取れる

x 管理図で限界線近くまで拡がる場合があったので、「ヒストグラム」で分布の特性を見てみる。自然な誤差の場合には分布が正規分布に近いものになる。 

正規確率紙へのプロット

工場3の初期不良ヒストグラム

正規確率紙へのプロットとヒストグラムより、正規分布ではないことを示しており、異常が発生している可能性を考えなければならない。

原因を特定するために特性要因図を用いて絞り込みを行う。ここで、CAnalysisの機能を使ってもいいし、マインドマップ(ここではXmind)を用いてもよい。どちらか使いやすい方を選んでほしい。

CAnalysisによる特性要因図

Xmindを用いた特性要因図

初期不良にばらつきがある場合、上の特性要因図のような原因が考えられるが、今回はマザーボードの異常によるものが多かったため、その原因を考えて行くと、接着機器の運転異常が原因ではないかと疑われた。

不良品発生の状況を層別の手段で考えるために、不良品の発生に午前と午後の差はあるのか、機器による差はあるのかを「層別」の手法で調べてみたところ、以下の結果を得た。

この場合「層別」とは、初期不良数を午前と午後、機械Aと機械Bに分けることを意味する。QC7つ道具の量的データ検定を実施する。

先頭列で群分けにチェックをいれる

シャピローウィルク検定より正規性はない

2群間の比較で対応なし・正規性なしとなることより、ウィルコクソンの順位和検定を実施

群別データからにチェックを入れて、検定を実施する

ウィルコクソンの順位和検定を実施した結果。午前と午後の間に差はない

同様の手順で、機械Aと機械Bを実施する。

この場合も2群の間に正規性はないのでウィルコクソンの順位和検定を実施する。

機械Aと機械Bの間に差があるといえる

この結果から、機器の不良が考えられたが、異常は断続的に表れるので、何らかの外的な要因があるように思われた。異常発生と天候との関係に気付くものがおり、調べてみた。

量的データの検定で、正規性の有無を調べたところ正規性があるとわかった。

シャピローウィルク検定により正規性が認められた

2群間の比較で対応なしで正規性があることより等分散性を調べた。

等分散性がないことよりウェルチのt検定を実施する

天候と器機の間に差があるといえる

原因がかなり絞り込めたので、調べてみると湿度により機器に不具合が発生していることが分った。 

以上のようにQC7つ道具の使い方の流れはこんな具合になる。こういった流れは固定化できるものではないので、現場に習熟して、使いこなせるようにしてほしい。

異常検出

異常検出には2通りある。

ひとつはデータの異常である。極端に大きな(あるいは小さな)値があるときに、異常かどうかを調べなければならない。

このことをgmanual05-2(OR2)より抜粋してみると

生産現場における検査過程では多くのデータが測定されるが、正常なデータと異常なデータの迅速な選別は品質管理の上で非常に重要である。ここでは、データが多変量正規分布に従う場合、マハラノビス距離の 2 乗を元にしたホテリングの t2 統計量に基づく判定法を用いる。また、多変量正規分布に従わない場合は、確率的な解釈も可能な混合正規分布モデルを仮定する方法を用いている。
また、1次元データについては、ガンマ分布による異常検知の方法も加えている。

具体的な方法はgmanual05-2(OR2)を参照して欲しい。

もうひとつは重回帰分析における多重共線性の問題である。これを回避する回帰分析には、リッジ解析、PLS回帰分析、主成分回帰分析などがあり、リッジ回帰分析は分散共分散に手を入れることで回避をし、PLS回帰分析、主成分分析は自由度の個数に手を入れることによって行われる。

しかし、これらの分析は入門のレベルを超えてしまっているので割愛する。知りたい方は

gmanual03_3(多変量解析3)

を参照して欲しい。

サイトご利用方法

次のページ・前のページを利用するよりも、グローバルメニュー(ヘッダー部分にある項目)をクリックしていただければ、その項目の全体像が一目でみることができ、クリックすればそのサイトへ飛びます。

google、yahoo、Bingなどで検索する場合、検索ワードは先頭に、孤立じじい、と入力しその後に、グローバルメニューのどれかひとつを入力すると、その検索サイトが上位表示されます。