TLCC란 무엇인가?
제조업에서는 시계열 데이터를 분석해야 하는 경우가 많다. 왜냐하면 설비나 생산에서 발생되는 데이터는 모두 Time이 Tagging되어 발생되기 때문이다. 대부분의 데이터가 시간에 따라 발생되기 때문에 시계열 데이터를 분석해야 한다.
두가지 시계열 parameter의 상관관계를 분석하는 방법에는 여러가지가 있다. 물론 우리가 가장 잘 알고 있는 피어슨 상관계수를 사용하면 일반적으로 시계열 데이터의 상관관계를 파악할 수 있을 것이다.
하지만 다른 방법들도 있고 특히 시계열 데이터가 여러가지 이슈가 있을 수 있으므로 이번에는 TLCC에 대해서 알아보도록 하겠다.
1. 정의
- TLCC란 Time Lagged Cross Correlation의 약어로 두 시계열 간의 상관관계를 시간 지연(lag)을 고려하여 분석하는 기법이다.
- 한 시계열이 다른 시계열에 미치는 영향을 시간에 따라 평가할 수 있도록 하는 방법이다.
- TLCC란 Time Lagged Cross Correlation의 약어로 두 시계열 간의 상관관계를 시간 지연(lag)을 고려하여 분석하는 기법이다.
- 한 시계열이 다른 시계열에 미치는 영향을 시간에 따라 평가할 수 있도록 하는 방법이다.
2. 가정
- 시계열 A : 하루 동안의 온도 데이터
- 시계열 B : 하루 동안의 에어컨 사용량 데이터
3. 목적
- 온도 변화가 에어컨 사용량에 어떤 영향을 미치는지 알아본다.
- 온도 변화가 에어컨 사용량에 어떤 영향을 미치는지 알아본다.
4. 분석
1) 데이터 준비
- 시계열 A : 온도 데이터
A = [25, 26, 28, 30, 32, 31, 29, 27, 26, 25]
- 시계열 B : 에어컨 사용량 데이터
B = [5, 6, 7, 8, 10, 9, 8, 7, 6, 5]
1) 데이터 준비
- 시계열 A : 온도 데이터
A = [25, 26, 28, 30, 32, 31, 29, 27, 26, 25]
- 시계열 B : 에어컨 사용량 데이터
B = [5, 6, 7, 8, 10, 9, 8, 7, 6, 5]
2) 시간 지연(lag) 설정
- TLCC는 다양한 시간 지연을 사용하여 두 시계열의 상관관계를 분석한다.
- 예를 들어 -2 에서 +2까지의 지연을 고려한다.
3) 상관관계 계산
- 지연 0 : A와 B가 같은 시간에서 상관관계를 계산한다.
→ 상관관계(0) = corr([25, 26, 28, 30, 32, 31, 29, 27, 26, 25], [5, 6, 7, 8, 10, 9, 8, 7, 6, 5])
- 지연 1 : A가 한 시간 뒤의 B와 상관관계를 계산한다.
→ 상관관계(1) = corr([25, 26, 28, 30, 32, 31, 29, 27, 26], [6, 7, 8, 10, 9, 8, 7, 6, 5])
- 지연 -1 : A가 한 시간 앞의 B와 상관관계를 계산한다.
→ 상관관계(-1) = corr([26, 28, 30, 32, 31, 29, 27, 26, 25], [5, 6, 7, 8, 10, 9, 8, 7, 6])
4) Time Lag에 따른 상관계수 분석 결과
6) Lag에 따른 분석 결과
5. 결과해석
1) TLCC값이 가장 높은 지연을 찾는다. 이 값은 온도가 에어컨 사용량에 미치는 최대 영향을 나타내는 시간 지연이다.
2) 예를 들어, 지연 1에서 TLCC값이 가장 높다면, 온도가 1시간 뒤의 에어컨 사용량에 큰 영향을 미친다는 것을 의미한다.
2) 예를 들어, 지연 1에서 TLCC값이 가장 높다면, 온도가 1시간 뒤의 에어컨 사용량에 큰 영향을 미친다는 것을 의미한다.
댓글 없음:
댓글 쓰기