해당 연구는 ChatGPT를 활용하여 주식 시장의 단기 매매 전략을 개발하고 평가한 것이다. 트위터 뉴스 데이터를 ChatGPT에 입력하여 매수 및 매도할 종목 목록을 생성하고, 이를 기반으로 한 거래 전략의 수익성을 분석한다. 주요 결과는 ChatGPT가 기업 특성 뉴스 외에 거시 경제 뉴스도 활용하여 수익성 있는 단기 거래 신호를 생성할 수 있다는 것을 보여준다. 또한, 전략의 성과는 차익 거래가 어려운 종목에서 더욱 두드러지게 나타나, ChatGPT가 텍스트 데이터에서 가격 왜곡 신호를 추출할 수 있음을 시사해준다.
챗GPT는 트위터(현재 X) 뉴스 데이터를 사용하여 주식 매수/매도 목록을 생성한다. 구체적으로, 블룸버그(Bloomberg)와 월스트리트 저널(Wall Street Journal)이 게시한 트윗을 사용한다.
데이터의 특징: 트위터 데이터는 간결하며, 트윗은 280자로 제한되어 있어 40~70단어 사이로 구성된다.
뉴스 유형: 챗GPT는 기업 특정적 정보와 거시 경제 뉴스 기사를 모두 포함하는 다양한 뉴스 기사를 입력으로 사용한다.
데이터 양: 챗GPT는 하루 평균 795개의 트윗을 처리한다.
정보 시점: 챗GPT는 시장 개장 전 24시간 동안 게시된 트윗을 사용하여 해당 날짜의 거래 전략을 생성한다. 예를 들어, 특정일의 데이 트레이딩 전략을 위해 전날 시장 개장 시점부터 해당일 시장 개장 직전까지의 트윗을 제공한다.
기업 특정적 뉴스: 챗GPT가 사용하는 트위터 뉴스 기사 중 약 7%만이 기업 특정적 정보를 포함하고 있습니다. 그럼에도 불구하고 챗GPT는 기업 특정적이지 않은 뉴스를 분석하여 관련 기업을 성공적으로 찾아낸다.
챗GPT가 매도 목록을 작성할 때 고려하는 사항은 다음과 같다.
섹터(sector) 또는 산업 수준의 분석: 챗GPT는 매도할 주식을 선정할 때 개별 기업의 특성보다는 섹터 또는 산업 수준의 정보를 중요하게 고려합니다. 이는 챗GPT가 특정 산업 전반의 하락세나 위험 요소를 감지하고, 해당 산업에 속한 주식을 매도 목록에 포함하는 경향이 있음을 시사한다.
소매 투자자들의 야간 매수 압력: 챗GPT의 매도 목록에 있는 주식을 매도하는 전략은 소매 투자자들의 야간 매수 압력과 관련이 있습니다. 이러한 매수 압력은 해당 전략의 야간 반전을 유도하며, 이는 챗GPT가 소매 투자자들의 관심이 집중된 주식을 매도 대상으로 선정할 수 있음을 의미한다.
미스프라이싱(mispricing) 신호 추출: 챗GPT는 뉴스 데이터에서 미스프라이싱 관련 신호를 추출하여 매도 목록을 생성합니다. 특히, 차익 거래가 어려운(limits-to-arbitrage) 주식에서 이러한 경향이 강하게 나타난다. 이는 챗GPT가 시장의 비효율성을 이용하여 단기적으로 하락할 가능성이 높은 주식을 식별하고, 이를 매도 목록에 포함하는 데 활용할 수 있음을 시사한다.
뉴스 기사 분석: 챗GPT는 기업 특정적 정보가 아닌 뉴스 기사를 분석하여 관련 주식을 선택한다. 이는 챗GPT가 광범위한 텍스트 데이터를 처리하고, 기업 특정적이지 않은 뉴스에서도 기업 관련 미스프라이싱 신호를 생성할 수 있음을 의미한다. 예를 들어, 특정 산업에 대한 부정적인 전망이나 거시경제 지표의 악화와 같은 뉴스를 분석하여 해당 산업에 속한 기업의 주식을 매도 목록에 포함할 수 있다.
키워드 분석: 챗GPT는 규제(regulatory) 관련 이슈, 불확실성(uncertainty), 실적(performance) 부진, 경제(economic)적 우려와 관련된 키워드를 포함하는 경향이 있다. 이는 챗GPT가 기업의 펀더멘털 또는 외부 환경의 변화를 감지하고, 부정적인 요인이 있는 주식을 매도 목록에 포함하는 데 활용할 수 있음을 의미한다.
챗GPT가 매도 목록을 작성하는 구체적인 방법론은 다음과 같다.
트위터 뉴스 데이터 활용: 챗GPT는 블룸버그와 월스트리트 저널이 트위터(현재 X)에 게시한 뉴스 데이터를 입력으로 사용한다. 트위터 데이터의 간결성은 챗GPT가 분석하기에 적합하다.
뉴스 기사 분석: 챗GPT는 기업 특정적 정보와 거시 경제 뉴스 기사를 모두 포함하는 다양한 뉴스 기사를 분석한다.
미스프라이싱 신호 추출: 챗GPT는 뉴스 데이터에서 미스프라이싱 관련 신호를 추출하여 매도 목록을 생성한다. 특히, 차익 거래가 어려운 주식에서 이러한 경향이 강하게 나타난다.
섹터 또는 산업 수준 분석: 챗GPT는 개별 기업의 특성보다는 섹터 또는 산업 수준의 정보를 중요하게 고려하여 매도할 주식을 선정한다.
키워드 분석: 챗GPT는 특정 키워드를 포함하는 뉴스 기사에 주목합니다. 예를 들어, 규제 관련 이슈, 불확실성, 실적 부진, 경제적 우려와 관련된 키워드를 포함하는 뉴스 기사를 분석하여 매도 목록을 작성한다.
소매 투자자들의 야간 매수 압력: 챗GPT는 소매 투자자들의 야간 매수 압력과 관련된 주식을 매도 대상으로 선정합니다. 이러한 매수 압력은 해당 전략의 야간 반전을 유도한다.
프롬프트 엔지니어링: 챗GPT에게 "뉴스 트레이딩" 전략을 실행하기 위해 뉴스를 분석하고 주식을 선택하도록 지시하는 프롬프트를 사용합니다. 또한, "돈을 벌기 위해" 특정 주식을 매수 또는 매도하도록 지시하여 투자 수익을 최대화하는 방향으로 목록을 생성하도록 유도한다.
데이터 배치 처리: 챗GPT가 한 번에 처리할 수 있는 토큰 수의 제한으로 인해, 뉴스 데이터를 여러 배치로 나누어 처리합니다. 특히, 야간 뉴스의 경우 토큰 수가 많아 여러 배치로 분할한다.
반복 실행: 챗GPT에게 매수 및 매도할 주식 목록을 30번 반복하여 생성하도록 요청한다. 이는 신호를 강화하고, 포트폴리오가 자산 가격 문헌에서 일반적으로 논의되는 10분위 포트폴리오와 유사한 수의 주식을 갖도록 하기 위함이다.
종합적 신호: 챗GPT는 기업 특정적 정보뿐만 아니라 비기업 특정적 뉴스도 함께 고려하여 종합적인 신호를 생성한다. 이는 챗GPT가 광범위한 텍스트 데이터를 처리하고, 기업 특정적이지 않은 뉴스에서도 기업 관련 미스프라이싱 신호를 생성할 수 있음을 의미한다.
과정:
트위터 데이터를 수집한다.
프롬프트를 작성하여 챗GPT에 입력한다.
뉴스 데이터를 토큰 수 제한에 맞춰 배치로 나눈다.
매수 및 매도 목록을 30회 반복하여 생성한다.
생성된 목록을 바탕으로 매도 신호를 생성한다.
숏 포지션 전략을 실행한다.
챗GPT 신호를 사용한 포트폴리오 구성 방법은 다음과 같다.
BUY 및 SELL 신호 생성:
트위터 뉴스 활용: 블룸버그와 월스트리트 저널이 게시한 트윗을 기반으로 챗GPT에게 매수 및 매도할 주식을 선택하도록 요청한다.
데이터 배치 처리: 챗GPT가 처리할 수 있는 토큰 수 제한으로 인해 트윗을 여러 배치로 나누어 입력한다.
신호 강도 강화: 각 트윗 배치에 대해 30번 반복하여 매수 및 매도 목록을 생성하여 신호 강도를 강화한다.
BUY 및 SELL 포트폴리오 구성:
기본 포트폴리오: BUY 신호가 있는 주식은 BUY 포트폴리오에, SELL 신호가 있는 주식은 SELL 포트폴리오에 동일한 비중으로 편입한다.
SUM_BUY 및 SUM_SELL 포트폴리오: SUM_BUY 신호와 SUM_SELL 신호를 사용하여 각각 포트폴리오를 구성한다. SUM 신호는 챗GPT가 특정 주식을 매수 또는 매도 목록에 포함한 횟수를 합산한 것이다.
NET_BUY 및 NET_SELL 포트폴리오: NET_BUY 신호와 NET_SELL 신호를 사용하여 각각 포트폴리오를 구성한다. NET 신호는 BUY 신호에서 SELL 신호를 차감한 것으로, 순수한 매수 또는 매도 신호를 나타낸다.
롱-숏 포트폴리오 구성:
BMS (BUY minus SELL): BUY 포트폴리오 수익률에서 SELL 포트폴리오 수익률을 차감하여 롱-숏 포트폴리오를 구성한다.
SUM_BMS: SUM_BUY 포트폴리오 수익률에서 SUM_SELL 포트폴리오 수익률을 차감한다.
NET_BMS: NET_BUY 포트폴리오 수익률에서 NET_SELL 포트폴리오 수익률을 차감한다.
포트폴리오 성과 측정:
Intraday (Open-to-Close) 수익률: 시장 개장 시점에 포트폴리오를 구성하여 시장 마감 시점까지 보유하는 intraday 수익률을 측정한다.
CAPM (자본자산가격결정모형) 알파: 포트폴리오의 위험 조정 수익률을 측정하기 위해 CAPM 알파를 계산한다.
고려 사항
산업 집중도: 챗GPT가 생성한 포트폴리오는 일반적으로 산업 집중도가 낮은 경향이 있다.
경제적 연관성: 챗GPT는 공급망을 통해 경제적으로 연결된 주식을 선택할 수 있다.
차익 거래 제한: 챗GPT 신호는 차익 거래가 어려운 주식에서 더 강력한 성과를 보이는 경향이 있다.
챗GPT가 생성한 매수(BUY) 및 매도(SELL) 목록에 기반한 거래 전략은 시장 요인을 조정한 후 월 0.546%의 수익을 얻었으며 , 매수 및 매도 신호를 결합하여 강화했을 때 월 3.717%의 수익을 달성했다 . 이러한 수익은 대부분 차익 거래가 제한된(limits-to-arbitrage) 주식의 숏(매도) 포지션에서 발생했다 .
챗GPT는 기업 특성보다는 섹터 또는 산업 수준의 정보를 고려하여 매도할 주식을 선정하는 경향이 있으며, 이는 챗GPT가 개별 주식의 미스프라이싱을 식별하는 데 도움이 된다.