"Forecasting U.S. equity market volatility with attention and sentiment to the economy"
1. 연구 목적: 거시경제 변수가 주식 시장 변동성에 미치는 영향을 분석하고, 특히 발표 시점의 불확실성, 낮은 빈도, 점진적 가격 반영 등의 문제를 극복하기 위해 대중의 관심(attention)과 감성(sentiment) 지표를 활용하여 미국 주식 시장의 변동성 예측력을 높이고자 했다.
2. 데이터 및 방법:
* 10개의 주요 거시경제 발표(NFP, FOMC 등)를 선정했다.
* 소셜미디어(트위터), 뉴스 기사, 정보 소비 데이터(위키피디아), 검색 엔진(구글 트렌드) 등 다양한 출처에서 해당 거시경제 변수 및 일반 주식 시장에 대한 관심(검색량, 조회수, 게시글 수 등)과 감성(텍스트 분석 기반 긍정/부정) 지표를 구축했다.
* 404개의 주요 미국 주식을 대상으로, 표준적인 시계열 모델(HAR)과 머신러닝 모델(LASSO, Complete Subset Regression(CSR), Random Forest)을 사용하여 일별 변동성(Realized Volatility) 예측 모델을 구축하고 비교했다.
3. 주요 결과:
거시경제 발표와 관련된 *감성** 지표를 활용한 모델들이 벤치마크 모델(표준 HAR 등) 대비 변동성 예측력을 일관되게 개선했다.
* 관심 지표를 활용한 모델들도 예측력을 개선했지만, 감성 모델만큼 두드러지지는 않았다.
특히 *머신러닝 기법** (CSR, Adaptive LASSO)과 결합했을 때 예측력 향상 효과가 가장 컸다. CSR-S(감성) 및 ALA-S(감성) 모델이 MSE 기준 가장 우수한 성과를 보였다.
예측력 개선 효과는 *극단적인 가격 변동이 발생한 날**(상위 10% 변동성)에 더욱 두드러져, 벤치마크 대비 평균 최대 14.99%까지 예측 오차(MSE)가 감소했다.
반면, 변동성이 낮은 날에는 관심/감성 모델이 벤치마크 모델보다 약간 저조한 성과를 보이기도 하여, 이러한 지표가 *격동적인 시장 상황에서 특히 유용함**을 시사했다.
거시경제 변수 중에서는 *FOMC 회의**와 노동 시장 지표(실업수당 청구, 비농업고용지수) 관련 관심 및 감성이 변동성 예측에 가장 중요한 것으로 나타났다.
데이터 소스별로는 *구글 트렌드, 트위터, 뉴스 기사**가 유용한 정보를 제공한 반면, 위키피디아 조회수는 예측력이 낮았다.
4. 결론: 거시경제 발표 자체보다는 그에 대한 대중의 관심, 특히 감성을 측정하는 것이 미국 개별 주식의 변동성을 예측하는 데 매우 유용하다. 머신러닝 모델과 결합할 경우 그 효과가 극대화되며, 특히 시장 변동성이 클 때 예측 정확도를 크게 향상시킬 수 있다.
[Compliance Note]
• 셀스마트의 모든 게시글은 참고자료입니다. 최종 투자 결정은 신중한 판단과 개인의 책임 하에 이루어져야함을 알려드립니다.
• 게시글의 내용은 부정확할 수 있으며, 매매에 따른 수익과 손실은 거래 당사자의 책임입니다.
• 코어16은 본 글에서 소개하는 종목들에 대해 보유 중일 수 있으며, 언제든 매수 또는 매도할 수 있습니다.