"Multimodal Stock Price Prediction"
연구 배경
* 금융 시장은 다양한 정적, 동적 요인에 의해 영향을 받으며, 정확한 주가 예측을 위해 다양한 데이터 소스를 효과적으로 통합하는 것이 중요해졌다.
* 최근 챗GPT와 같은 대규모 언어 모델(LLM)이 금융 시장 데이터 분석에 활용되면서 새로운 가능성이 열리고 있다.
* 하지만 전통적인 재무 지표, 트윗, 뉴스 기사 등 다양한 데이터 소스를 결합하여 주가를 예측하는 멀티모달 접근 방식에 대한 연구는 아직 부족하다.
분석 방법
1. 월마트, 디즈니, 마이크로소프트 주식에 대한 과거 가격 데이터, 트위터 데이터, 뉴스 기사를 수집한다.
2. 챗GPT-4o와 FinBERT를 사용하여 트윗과 뉴스 기사의 감성 분석을 수행하고, 트윗의 좋아요, 리트윗, 댓글, 작성자 팔로워 수 등의 참여 지표를 통합하여 감성 점수를 가중한다.
3. 기술적 지표(RSI, SMA)를 포함하고, Min-Max 정규화를 통해 데이터를 0과 1 사이로 스케일링한다.
4. 수집된 데이터를 LSTM(Long Short-Term Memory) 모델에 입력하여 주가를 예측한다.
5. 데이터를 학습 데이터(2018-2022)와 테스트 데이터(2023)로 분할하고, 10번의 반복 학습을 통해 모델 성능을 평가한다.
6. 다양한 특성 조합에 대한 모델 성능을 평가하기 위해 R-제곱(R²)과 평균 절대 오차(MAE)를 사용한다.
주요 결과
* 트윗 및 뉴스 기사와 같은 소셜 미디어 데이터를 기술적 지표와 통합하면 모델의 예측 정확도가 크게 향상되었으며, 가격 데이터만 사용했을 때보다 성능이 향상되었다.
* FinBERT와 ChatGPT-4o를 사용한 감성 분석은 매우 유사한 결과를 생성하여 감성 통합의 견고성을 더욱 검증했다.
* 특정 주식의 경우, 트윗 및 뉴스 기사를 사용하여 얻은 가중 감성 점수를 결합한 모델이 최고의 예측 성능을 보였다.
* FinBERT를 사용한 분석에서 Walmart는 가격 및 뉴스 기사 기능이 가장 높은 점수를 얻었지만, Disney는 가중 감성 점수를 통해 개선되었고, Microsoft는 기술 지표와 트윗의 조합으로 최고 성능을 달성했다.
결론
멀티모달 데이터 분석 기법이 재무 데이터 분석의 정확도를 높이고 더 효과적인 거래 전략으로 이어질 수 있음을 보여준다. 감성 분석 도구는 주가 변동을 예측하는 데 유용할 수 있지만, 특정 모델과 주식에 따라 가장 효과적인 기능 조합이 달라질 수 있음을 강조한다.
[Compliance Note]
· 셀스마트의 모든 게시글은 참고자료입니다. 최종 투자 결정은 신중한 판단과 개인의 책임 하에 이루어져야함을 알려드립니다.
· 게시글의 내용은 부정확할 수 있으며, 매매에 따른 수익과 손실은 거래 당사자의 책임입니다.
· 코어16은 본 글에서 소개하는 종목들에 대해 보유 중일 수 있으며, 언제든 매수 또는 매도할 수 있습니다.