인공지능으로 주가 예측 수행
Linear Regression, MLP 모델 활용
NLP 기반 금융 감정 데이터 추가
평균 예측 오차 최대 1.83%
Amazon 주가 예측 정확도 최고(오차 0.12%)
Opinion
모델의 성능이 전반적으로 우수하며, 특히 Amazon과 Microsoft의 주가 예측이 정확하고 안정적이다. Linear 모델이 신경망 모델보다 안정적 성능을 보이며 실무에 더 적합하다. 뉴스 및 감정 데이터를 추가한 NLP 모델이 예측 정확도를 더욱 높이는 중요한 역할을 하고 있다. 예측된 30일 주가 흐름에서 Amazon은 압도적으로 긍정적이며 Google은 불확실성이 높아 신중한 접근이 요구된다. AI 기반의 모델은 향후 주가 예측 및 투자 전략 결정에 실질적으로 유용하다.
Core Sell Point
Linear 모델과 NLP 기반 금융 감정 분석을 결합한 AI 시스템은 실제 주식시장에 적용 가능한 정확한 예측과 전략적 우위를 제공한다.
다음은 『Artificial Intelligence in the Stock Market: Quantitative Technical Analysis, Model Weight Optimization, and Financial Sentiment Evaluation to Predict Stock Prices』(Cilingiroglu, 2023)에 대한 분석 및 주가 전망 보고서이다.
1. 논문 개요
본 논문은 인공지능(AI)을 활용하여 주식 시장의 가격을 예측하는 기법을 연구하였다. 연구 목적은 인공지능 및 기계학습(Machine Learning, ML) 알고리즘을 적용하여 투자자의 수익성을 극대화하고 위험을 줄이는 데 있다. 특히 선형회귀(Linear Regression) 모델과 다층 퍼셉트론(Multilayer Perceptron, MLP) 신경망(Neural Network) 모델을 개발하여 과거의 수치 데이터를 기반으로 주가를 예측하였다. 또한 자연어처리(NLP) 기반의 심층 학습 모델(transformer 기반)을 활용하여 뉴스와 같은 사회경제적, 정치적 사건의 영향을 반영하여 예측 정확도를 높였다. 결과적으로, Amazon, Google, Microsoft 주식 가격 예측의 평균 오차는 각각 0.12%, 0.13%, 0.07%로 매우 낮은 예측 오차를 달성하였다.
2. 연구 방법론
연구는 세 가지 주요 접근 방법을 통해 수행되었다.
첫째, 정량적 기술분석(Quantitative Technical Analysis)을 통해 주식의 역사적 데이터와 기술적 지표를 수치화하고 통계적으로 모델링하여 정확한 예측치를 산출하였다. 데이터는 Yahoo Finance에서 5년간의 주가 데이터(시가, 종가, 거래량, 배당금 등)를 수집하고, pandas, NumPy, yfinance 등의 Python 라이브러리를 이용하여 전처리하였다. 수집된 데이터는 훈련(training), 검증(validation), 테스트(testing) 세트로 무작위로 나누어 모델을 학습시켰다.
둘째, 모델 가중치 최적화(Model Weight Optimization) 기법으로 Multiplicative Weights Method 및 Boosting 모델을 활용하였다. 이를 통해 두 모델의 가중치를 데이터의 성능에 따라 반복적으로 수정하며 정확도를 최적화하였다. 선형회귀 모델은 최근 가격 데이터 간의 직접적 상관관계를 분석하고, 신경망 모델은 비선형 패턴과 계절성 및 주간 변동성을 탐지하며 백프로파게이션(Back-propagation)을 통해 가중치를 조정하였다.
셋째, 금융 감정 평가(Financial Sentiment Evaluation) 방법을 도입하였다. NLP 기술을 이용하여 사회적 감정(sentiment)을 평가하고 transformer 기반 모델로 뉴스 및 소셜 미디어에서 수집한 텍스트 데이터를 분석하였다. 약 6,000개의 문장으로 이루어진 뉴스 데이터를 사용하여 금융 감정(긍정, 부정, 중립)을 벡터화(vectorization)한 후, 주가 데이터와 결합하여 통합된 입력 매트릭스를 구성하였다.
3. 연구 결과
연구 결과, 선형회귀와 신경망 모델 모두 뛰어난 예측 성능을 나타냈다. 두 모델이 협력하여 Microsoft, Amazon, Google 등 주요 기업의 2주 동안의 주가를 예측한 결과, 실제 가격과의 오차가 매우 적었다.
선형회귀의 평균 예측 오차는 Microsoft 0.54%, Amazon 0.62%, Google 1.83%로 나타났다.
신경망 모델은 Microsoft 0.29%, Amazon 0.47%, Google 1.38%로 더욱 뛰어난 성능을 보였다.
연구는 추가적으로 게임 이론을 활용하여 Linear(선형회귀), Neural(신경망), AdaBoost_L(선형회귀 기반 AdaBoost), AdaBoost_N(신경망 기반 AdaBoost) 등 네 가지 모델 간의 페이오프(Payoff)를 분석하였다.
게임 이론 페이오프 매트릭스 분석을 통해 AdaBoost_N 및 Neural 모델이 모든 종목에서 일관되게 높은 손실을 보이는 등 성능 안정성이 매우 취약했다. 반면 Linear 모델과 AdaBoost_L 모델은 모든 종목에 걸쳐 안정적인 성과를 기록하여 실제 시장에 적용 가능한 전략적 우위를 나타냈다. 특히 Russell 2000 지수와 같은 종합 지수에서는 Linear 모델의 강력한 안정성과 예측력이 입증되었다.
4. 실증 주가 예측 (논문 기반 4종목 30일 예측 시스템)
본 연구에서 제안한 인공지능 모델을 바탕으로 Amazon, Google, Microsoft, Russell 2000 등 4종목의 향후 30일간 주가 흐름을 실증적으로 예측하였다.
Amazon (강력 매수 추천)
현재가: $210
30일 후 예측 중위값: $247(+17.6%)
상승 확률: 87.1%
30일 가격 분포:
75% 분위수 이상 가격이 꾸준히 현재가를 상회하며 최대 $300 부근까지 상승 가능성을 제시함.
위험 지표:
변동성 약 0.36%, 최대 낙폭 0.35%로 상대적으로 낮은 위험도를 보이며, 안정적 상승 가능성이 높음.
Google (중립 또는 보유)
현재가: $175
30일 후 예측 중위값: $174(-0.6%)
상승 확률: 49.2%
30일 가격 분포:
현재가 대비 변동 폭이 크지 않으며, 50% 분위수가 현재가와 거의 일치하는 정체된 흐름을 보임.
위험 지표:
변동성 0.44%, 최대 낙폭 13%로 상대적으로 높은 위험도가 나타나 주가 하락 위험이 존재함.
Microsoft (매수 추천)
현재가: $485
30일 후 예측 중위값: $533(+9.9%)
상승 확률: 79.2%
30일 가격 분포:
상승 추세가 명확하며, 상위 25% 분위수는 약 $550 이상으로 나타나 추가 상승 여력이 존재함.
위험 지표:
변동성 약 0.28%, 최대 낙폭 12% 수준으로 중간 정도의 위험을 보이며, 신중한 매수 전략이 유리함.
Russell 2000 지수 (매수 추천)
현재가: $2100
30일 후 예측 중위값: $2276(+8.4%)
상승 확률: 68.2%
30일 가격 분포:
상위 25% 분위수가 지속적으로 현재가보다 높게 유지되며 최대 $2400 수준까지 상승 여력 보유.
위험 지표:
변동성 0.22%, 최대 낙폭 13%로 비교적 안정적인 흐름 속에서 지수의 안정적 상승 전망이 기대됨.
종합 평가 및 전략적 제언
4종목 중 Amazon은 상승 확률과 기대 수익률 모두 높으며 위험 대비 수익 매력도가 뛰어나 강력한 매수 전략을 권장한다. Microsoft와 Russell 2000 지수 역시 명확한 상승 추세와 상대적 안정성으로 매수를 고려할 만하다. 반면, Google은 상승 확률과 기대 수익이 낮고 위험 지표가 높으므로 신중한 접근과 기존 보유자의 경우 보수적 대응을 추천한다.
이번 예측을 통해 본 연구에서 개발한 인공지능 모델의 실질적인 주가 예측 및 투자 전략 결정 지원 가능성을 입증하였다.
[Compliance Note]
• 셀스마트의 모든 게시글은 참고자료입니다. 최종 투자 결정은 신중한 판단과 개인의 책임 하에 이루어져야함을 알려드립니다.
• 게시글의 내용은 부정확할 수 있으며, 매매에 따른 수익과 손실은 거래 당사자의 책임입니다.
• 코어16은 본 글에서 소개하는 종목들에 대해 보유 중일 수 있으며, 언제든 매수 또는 매도할 수 있습니다.
본 보고서의 작성자는 보고서에 포함된 정보의 정확성과 신뢰성을 확보하기 위해 최선을 다하였으나, 제공된 정보의 오류, 누락 및 부정확성에 대해 어떠한 법적 책임이나 손해배상 책임을 지지 않습니다. 본 보고서를 이용하여 이루어진 모든 투자 결정과 그로 인해 발생하는 손실이나 이익에 대해서도 보고서 작성자는 책임을 지지 않습니다.