본문 바로가기

PC/시계열 데이터분석2

시계열데이터 분석(2) - statsmodels Hodrick -Prescott Hodrick -Prescott는 시계열 데이터에서 경향성과 순환성을 분리하는데 주로 사용된다. 다음은 hp필터를 사용해 트랜드와 사이클을 분리하고 트랜드와 실제 gdp 비교한 그래프이다. ETS Models 오차(E), 추세(T), 계절성(S) 지수평활법, 추세모형과 같은 다양한 모델을 포함하지만 ETS 분해에 대해 알아보자 각각의 요소들을 더하거나 곱하는 등 요소의 기반에 데이터에 맞는 일반화 모델을 만들 수 있다. * 덧셈모델 : 추세가 선형에 가깝고 계절성이 일정할때 * 곱셈모델 : 매년 승객수가 전년에 비해 증가하는 지수형일때 ETS분해 승객수의 시계열 데이터를 다음과 같이 분석해보자. 결측값음 dropna를 사용하여 처리하였고, 지수형으로 판단하여 Multipl.. 2023. 8. 22.
시계열 데이터분석(1) - datetime과 기본 시계열 데이터란 시간에 따라 일련의 순차적으로 정해진 데이터의 집합이다. 시계열 데이터 분석을 통해 시계열이 가지고 있는 법칙성을 발견해 모델링하고 추정한 모델을 통하여 미래의 값을 예측하는것까지 할 수 있다. 시계열 데이터는 주로 추세(Trend), 주기(Cycle), 계절성(Seasonality), 노이즈 (Noise)로 구성되어 있으며 이러한 성향을 파악하여 모델링을 할 수 있다. 대표적인 모델로 ARIMA 모델이 있으며 인공지능을 활용하여 데이터분석도 가능하다. Python을 이용하여 해보기전 datetime이라는 형태에 대해 알아야한다. Python datetime 다음과 같이 datetime을 지정할 수 있고 datetime형식을 사용해야 python은 시간에 관한 데이터라고 인식할 수 있다... 2023. 8. 22.