# MTS란?
1) MTS란 마할라노비스 다구치 시스템을 통해 이상탐지에 미치는 변수들의 영향력을 확인하고 이들을 통해 효율성이 높은 이상 탐지 모델을 제시하는 것을 말한다. 따라서 상관관계가 있는 적은 수의 데이터로 예측 정확성을 높일 수 잇는 시스템이다.
2) 패턴인식 시스템 중 하나로 서로 비교되는 두 그룹을 하나의 공통지표인 마할라노비스 거리(MD : Mahalanobis Distance)로 나타내고, 품질공학의 SN비(Signal to Noise)개념을 적용하여 패턴인식에 중요한 항목과 중요하지 않은 항목을 선별하여 예측 능력과 효율성이 높은 패턴 인식 시스템을 개발하는 방법이다.
# MTS의 장점
적은 수의 데이터로 유용한 변수들을 선정할 수 있기 때문에 비용절감과 효율성의 측면에서 의미가 있다.
# MTS의 필요성
공정을 모니터링하기 위해서는 여러개의 다양한 센서를 설치한 후 해당 센서에서 취합한 데이터를 이용하여 이상여부를 감지 및 대응하게 된다.
하지만 모니터링 데이터 중에서 특정 센서가 공정의 이상탐지에 영향을 못미치는 변수라면 해당 센서 데이터를 모니터링하고 수집하는 것이 불필요한 작업일 수 있다.
따라서 효율적이고 효과적인 공정관리 시스템을 구축하기 위해서는 센서들이 공정의 합/불 판정에 미치는 영향이 어떠한지 확인해야 한다.
# MTS에서 중요한 점
- 마할라노비스 공간을 잘 정의해야 한다. 이를 위해서는 정상그룹을 대상으로 마할라노비스 공간을 구성해야 한다.
- 일반적으로 정상그룹(양품)과 비정상그룹(불량품)을 구분하는 시스템을 개발해야 할 때 더 관찰하기 쉬운 것은 정상그룹이다.
치수가 너무 커서 불량인 제품이 있고 무게가 낮아서 불량인 제품이 있는 것처럼 비정상 그룹 내에는 다양한 패턴이 존재한다.
하지만 정상그룹은 대체로 상당히 닮아 있고 균일한 특성을 갖고 있다.
# 이상감지 기준 개발(마할라노비스 공간 구성 -> 거리 계산 -> Threshold값 설정)
1) 전문가와 함께 온전한 정상그룹을 대상으로 마할라노비스 공간을 만든다.
- 정상그룹의 시료 안에 비정상 그룹의 시료가 혼입된다면 오염된 데이터로 인해 마할라노비스 공간이 단위 공간으로서 적합하지 않게 된다. 따라서 반드시 해당 분야의 전문가와 함께 정상그룹의 시료를 선정해야 한다.
2) 정상그룹의 시료수가 비정상 그룹의 시료수보다 많아야 한다.
- 정상그룹의 패턴을 정확하게 파악하기 위해서는 비정상 그룹의 시료수보다 많은 시료를 수집해야 한다.
3) 측정항목은 두 그룹(정상, 비정상)에 대해 모두 동일해야 한다.
4) 정상그룹과 비정상 그룹에 대해 표준화 작업을 한다.
- 정상그룹의 평균, 표준편차를 이용하여 표준화를 수행한다.
-> 다차원 공간의 원점을 기준점으로 하고 마할라노비스 거리 평균이 1인 단위 공간을 만들기 위함이다.
- k : 측정 항목의 개수
- n : 측정 시료의 개수
- m : k번째 측정항목의 평균
- s : k번째 측정항목의 표준편차
- 비정상 그룹은 정상그룹의 값(평균, 표준편차)을 이용하여 표준화를 수행한다. 즉 비정상그룹을 정규화된 정상그룹의 기준점과 같아지게 표준화를 하여 두 그룹간의 마할라노비스 거리비교를 쉽게 수행할 수 있도록 한다.
-> 반드시 정상그룹의 평균, 표준편차를 이용하여 표준화 작업을 수행해야 한다.
5) 마할라노비스 거리 계산
- 정상그룹과 비정상 그룹의 마할라노비스 거리를 계산한다.
- j번째 측정 시료의 마할라노비스 거리 계산식은 다음과 같다.
R-1은 측정항목들간의 상관계수 행렬의 역행렬으로 이를 이용하여 n개 시료에 대한 마하라노비스 거리를 계산할 수 있게 된다.
공분산행렬을 사용하는 기존의 마할라노비스 시스템과 다르게 MTS에서는 상관행렬을 사용한다.
-> 상관행렬을 사용하게 되는 경우 데이터 스케일에 영향을 덜 받아 더 균질한 정상그룹의 마할라노비스 거리 집합을 얻을 수 있다.
6) Threshold값 설정
- 정상/비정상 그룹의 마할라노비스 거리를 구분짓는 기준값을 설정한다.
-> 일반적으로 정상그룹의 마할라노비스 거리는 작게 나오고, 비정상그룹의 마할라노비스 거리는 크게 형성된다.
- Threshold값 설정단계는 정상/비정상 그룹을 가장 잘 나눌 수 있는 값을 찾는 과정이다.
-> Threshold값을 너무 낮게 할 경우 정상그룹에 속한 시료가 비정상그룹으로 판정될 가능성이 높아지며, 높게 설정할 경우 반대의 Risk가 존재한다.
# 측정항목별 SN비 이득을 계산
1) SN비 이득계산
- 예측 능력이 있는 중요한 항목들을 선정한다.
2) 2수준계 직교배열표를 이용한 중요항목 선정
- 중요한 항목 선정을 위해서는 직교배열표를 사용한다.
-> 측정항목별로 생기는 수많은 실험횟수가 직교성을 통해 줄어들게 된다.
3) SN 이득율 계산
- 해당 측정항목을 담을 수 있는 직교배열표를 이용하여 망대특성의 SN비를 계산하고 예측 능력을 분석한다.
- 직교배열표를 이용하여 해당개수의 실험조건을 얻은 후, 각각의 실험조건에 대한 마할라노비스 거리를 계산한다.
- 각각의 실험조건에는 Level1값과 Level2값이 있으며 이에 대한 마할라노비스 거리를 계산하여 해당 실험조건에 대한 SN비를 계산한다.(SN Gain = avg(SN비1) - avg(SN비2))
4) SN 이득율 계산결과 해석
- SN Gain > 0 : 진단에 영향을 끼치는 변수
- SN Gain < 0 : 진단에 영향을 미치지 않는 변수
댓글 없음:
댓글 쓰기