본 논문은 딥러닝 모델을 사용하여 차트 분석에 기반한 인간 주식 트레이더의 방법을 시뮬레이션하는 것을 목표로 한다. 효율적 시장 가설에도 불구하고, 주식 시장에는 비효율성이 존재하며, 딥러닝은 이러한 비효율성을 활용하여 시장 수익률을 능가하는 데 유용한 도구가 될 수 있다는 전제에서 출발한다.
1. 기본 아이디어:
* 차트 패턴 활용: 전문 기술 분석가들은 과거 주가 흐름을 나타내는 차트에서 특정 패턴을 식별하여 미래 주가를 예측한다. 본 논문에서는 딥러닝 모델이 이러한 차트 패턴을 학습하고 활용할 수 있다고 가정한다.
* 장기간 데이터: 모델은 과거 600일간의 주가 데이터를 사용하여 장기적인 추세를 파악한다.
* 이산화된 수익률: 모델은 향후 D일 이내에 주가가 10% 또는 20% 상승 또는 하락할지를 예측한다. 이처럼 수익률을 이산화함으로써 작은 가격 변동에 대한 민감도를 줄이고 모델 훈련을 용이하게 한다.
2. 데이터 전처리 (Dataset Preprocessing):
* OHLCV 데이터 수집: 한국(KOSPI, KOSDAQ)과 미국(NYSE, NASDAQ, AMEX) 주식 시장의 일별 시가(Open), 고가(High), 저가(Low), 종가(Close), 거래량(Volume) 데이터를 수집한다.
* 로그 가격 사용: 급격한 기울기 폭발을 방지하기 위해 일별 수익률 대신 로그 가격(base 10)을 사용한다.
* 레이블 할당: 모델은 주가 데이터를 세 가지 레이블 중 하나로 분류한다.
1. 10% (또는 20%) 상승: 향후 D일 이내에 최고가가 현재 종가보다 10% (또는 20%) 이상 상승할 경우
2. 10% (또는 20%) 하락: 향후 D일 이내에 최저가가 현재 종가보다 10% (또는 20%) 이상 하락할 경우
3. 횡보 (sideways): 최고가와 최저가가 모두 지정된 범위를 벗어나지 않은 경우
3. 모델 구조 (Proposed Model):
* ResNet 모델: ResNet의 skip connection을 활용하여 장기적인 추세를 효과적으로 학습한다. Wang et al. (2017)이 제안한 시계열 데이터에 적합하도록 수정된 ResNet 아키텍처를 사용한다.
* 입력: 5x600 크기의 텐서 (5는 OHLCV 데이터를 나타내고, 600은 과거 600일간의 데이터를 나타냄)
* 계층:
* 5개의 ResNet 블록 (각 블록은 7x1, 5x1, 3x1 크기의 컨볼루션 레이어 3개로 구성)
* 배치 정규화 (Batch Normalization) 및 ReLU 활성화 함수 (ReLU activation function) 적용
* 전역 평균 풀링 (Global Average Pooling, GAP) 레이어: 각 특징 맵의 평균값을 얻음
* 완전 연결 (Fully Connected) 레이어
* Softmax 함수: 10% 상승, 10% 하락, 횡보의 확률을 출력
4. 모델 훈련:
* 손실 함수: 이진 교차 엔트로피 (Binary Cross Entropy, BCE) 사용
* 최적화 알고리즘: 명시되지 않음
* 에포크: 50 epochs
* 배치 크기: 명시되지 않음
* 정밀도: 16-bit 정밀도
* 훈련 기간: 한국 주식은 1.5일, 미국 주식은 5일
제안하는 방법론을 바탕으로 실험한 결과, 다음과 같은 주요 결과를 얻을 수 있었다.
* 한국 시장에서 테스트한 결과, 제안하는 모델은 75.36%의 수익률과 1.57의 Sharpe 비율을 달성했다. 이는 단순히 시장에 투자하는 것보다 높은 수익률이며, Sharpe 비율 또한 월등히 높다. 즉, 시장 수익률을 능가하는 성과를 보였다.
* 미국 시장에서 테스트한 결과, 제안하는 모델은 27.17%의 수익률과 0.61의 Sharpe 비율을 달성했다. 이는 NASDAQ, S&P500, Dow Jones 지수와 같은 벤치마크를 능가하는 성과이지만, AMEX 지수를 능가하지는 못했다. 하지만 여전히 벤치마크 대비 우수한 성능을 입증했다.
* 소프트맥스 로짓 값의 임계값을 조정하는 것이 백테스팅 결과에 큰 영향을 미친다는 것을 확인했다. 적절한 임계값을 설정하면 모델의 정확도를 높이고, 위험을 줄일 수 있다.
종합적으로, 이러한 결과는 딥러닝 모델을 활용하여 주식 차트를 분석하고, 소프트맥스 로짓 값을 통해 확신도가 높은 거래를 선택하는 전략이 시장 수익률을 능가하는 데 효과적임을 시사한다.