시계열 분석 - Time-series Analysis

시계열 분석 Time-series Analysis

횡단면 데이터(Cross Sectional Data)와 비교되는 개념으로 데이터의 변수에 시간에 대한 자취값이 있는 데이터를 시계열 데이터(Time-series)라고 한다. 횡단면 데이터는 시간 정보가 없거나 여러 시간대의 구간을 하로 합친 것을 말한다.

시계열 데이터는 보통의 데이터에 비해서 레코드(또는 로우)에 타임스탬프 또는 각 시간구간에 따른 집계 레벨(분별, 시간대별, 일별, 주별, 월별, 분기별, 년도별)에 대한 순서가 있는 시간값을 함께 가지고 있다.

시계열 데이터는 횡단면 데이터에 비해 고려해야 할 시간축이 하나 더 있는 것이 큰 문제이며 시간축이 선후관계를 가지는 것, 그리고 시간축에 대한 것을 드릴다운하거나 다시 롤업(roll-up)해서 집계 응집도를 높여야 할 수 있다.

시계열 분석의 학술 분야

시계열 분석은 응용 통계학, 계산 통계학, 응용 수학에서 다루며 이와 관련된 학과의 대학원 과정에서 집중적으로 가르친다. 시계열 분석을 전문으로 배우려면 통상 금용공학, 경제학, 통계학, 수학과의 대학원에서 배울 수 있다는 것이다.

시계열 분석으로 날씨 예측, 주가 예측, 자재값 예측 등의 시간에 따라 미래의 손실이나 리스크(위험, risk)를 미리 알고 싶을 때 사용하는 기술이지만 실제로 정확도가 크게 높지 않으며 매우 어려운 기술이다.