주식 시장 가격 예측을 위해 기능적 모티프 발견(Functional motif discovery)과 모티프 기반(MB) 예측이라는 새로운 방법을 소개한다. 핵심 아이디어는 반복되는 패턴(모티프)을 활용하고, FDA 프레임워크에 주가 데이터를 임베딩하며, probKMA 방법을 확장 적용하여 기능적 모티프를 발견하고, 이를 기반으로 주가를 예측하는 MB 예측 알고리즘을 제안하는 것이다. 시뮬레이션 연구와 실제 S&P 500 데이터 분석 결과, MB 예측 알고리즘은 기존 예측 모델보다 우수한 성능을 보였으며, 주가뿐 아니라 주식 수익률 예측에도 효과적이었다. 결론적으로, 이 논문은 주식 시장 가격 예측에 효과적인 새로운 접근 방식인 기능적 모티프 발견 및 MB 예측을 제시하며, 기존 방법보다 우수한 성능을 보인다.
"반복 패턴 (모티프, motif)"에 대해 설명하면 다음과 같다.
재발생: 모티프는 주가 시계열 데이터에서 여러 번 반복되어 나타난다.
가변성: 모티프는 완벽하게 동일하지는 않지만, 기본적인 형태와 움직임은 유사하다. (예: 크기, 시간 축소/확대 등이 다를 수 있음)
예시:
급격한 상승 후 하락하는 패턴,
V자형 반등 패턴 ,
삼각형 수렴 패턴
활용:
패턴 인식: 모티프는 주가 차트에서 특정 패턴을 식별하는 데 도움을 줄 수 있다.
미래 예측: 과거에 나타났던 모티프가 다시 나타날 경우, 해당 모티프의 일반적인 후속 움직임을 기반으로 미래 주가를 예측할 수 있다.
기능적 데이터 분석(FDA)을 사용하여 주가 데이터를 곡선 형태로 표현하고, probKMA-FMD 알고리즘을 통해 이러한 곡선에서 반복되는 모티프를 식별한다.
발견된 모티프를 사용하여 MB(Motif-Based) 예측 알고리즘을 통해 미래 주가를 예측한다.
FDA는 데이터를 연속적인 곡선으로 취급하여 복잡한 형태와 특징을 보존하고, 비모수적 모델링 접근 방식을 제공한다.
probKMA는 기능적 데이터에 적용되는 클러스터링 알고리즘으로, 확률적 멤버십과 로컬 정렬 기능을 통해 데이터의 불확실성을 고려하고 패턴의 유사성을 극대화한다.
MB 예측은 식별된 모티프 정보를 활용하여 미래 주가를 예측하는 알고리즘으로, 과거 데이터에서 모티프를 발견하고, 현재 데이터와 모티프를 정렬한 후, 선택된 모티프의 과거 움직임을 기반으로 미래 주가를 예측한다. 이러한 세 가지 요소를 결합하여 주가 예측 성능을 향상시키는 새로운 방법론을 제시한다.
이 세 가지 개념은 서로 연결되어 있다. FDA 프레임워크는 주가 데이터를 곡선 형태로 표현하는 기반을 제공하고, probKMA는 이러한 곡선에서 반복되는 모티프를 식별하는 데 사용되며, MB 예측은 식별된 모티프 정보를 활용하여 미래 주가를 예측한다.
* 대상 데이터: S&P 500 상위 구성 종목 주가 데이터를 사용.
* 분석 기간: 2021년 1월부터 2022년 12월까지의 기간을 사용.
* 비교 대상 모델: MB 예측 알고리즘을 ARIMA, FF, LSTM, NF와 같은 기존 예측 모델과 비교.
* 평가 지표: 예측 정확도를 평가하기 위해 RMSE (Root Mean Squared Error)를 사용.
* MB 예측 알고리즘의 우수한 성능: MB 예측 알고리즘이 분석 대상 51개 모든 주식에 대해 다른 방법보다 우수한 성능을 보였음.
* 성공적인 추세 예측: MB 예측 알고리즘은 복잡한 추세와 주가 형태를 성공적으로 예측.
전반적인 해석:
실증 분석 결과는 기능적 모티프 발견과 MB 예측 방법이 주식 시장 가격 예측에 효과적이며, 기존 방법보다 우수한 성능을 보인다는 것을 시사. 이는 과거 주가 데이터에서 반복되는 패턴을 식별하고 활용하는 것이 미래 주가를 예측하는 데 유용할 수 있음을 의미.