제 2의 네로 (AI)

머신러닝으로 주식투자하기 - 3편 데이터 수집하기

Dr. 네로 2025. 8. 27. 17:54
반응형

이 글은 닥터 네로가 아닌, 개조된 GPT가 작성했습니다.🐾


📈 주가 예측 머신러닝에 꼭 필요한 핵심 지표와 데이터 수집 방법

주식 시장을 머신러닝으로 예측하려는 분들이라면, 반드시 고민해야 할 것이 있습니다:

✅ 어떤 지표를 모델에 넣어야 하나요?
✅ 그 데이터를 어디서 구할 수 있나요?

이 두 가지가 제대로 준비되지 않으면, 아무리 좋은 모델이라도 **'쓰레기를 넣으면 쓰레기가 나온다'**는 말처럼 정확한 예측은 불가능합니다.

이번 글에서는 주가 예측에 자주 쓰이는 핵심 지표들그 지표를 만들기 위한 데이터 수집 방법을 깔끔하게 정리해드립니다.


🧩 PART 1: 주가 예측에 꼭 쓰이는 핵심 지표들


1️⃣ 이동 평균 (Moving Average, MA)

  • 일정 기간 동안의 평균 가격
  • 가격 추세 파악에 유용

수식:

활용:

  • 20일, 50일, 200일 이동 평균을 많이 사용
  • 단기 MA가 장기 MA를 위로 뚫을 때 → 골든 크로스 (매수 신호)

2️⃣ 상대강도지수 (RSI: Relative Strength Index)

  • 주가 상승과 하락의 강도를 비교
  • 과매수 / 과매도 판단

수식:

 

활용:

  • RSI > 70: 과매수 상태
  • RSI < 30: 과매도 상태

3️⃣ 볼린저 밴드 (Bollinger Bands)

  • 가격의 표준편차 기반 상/하한 밴드 계산

수식:

활용:

  • 가격이 밴드 상단을 돌파 → 단기 고점 시사
  • 하단에서 반등 → 단기 매수 기회로 간주되기도

4️⃣ MACD (Moving Average Convergence Divergence)

  • 빠른 이동평균선과 느린 이동평균선의 차이

수식:

활용:

  • MACD가 Signal 위로 돌파 → 매수 신호
  • MACD가 Signal 아래로 하락 → 매도 신호

5️⃣ EMA (Exponential Moving Average)

  • 최근 데이터에 더 많은 가중치를 둔 이동평균

수식:

활용:

  • 빠른 반응을 원할 때 단기 EMA(10, 20) 사용
  • 추세 확인용으로 장기 EMA(50, 100, 200) 사용

6️⃣ 거래량 기반 지표 (OBV 등)

  • 거래량에 가격 움직임을 더해 추세 판단
  • On-Balance Volume(OBV), Volume Moving Average 등

활용:

  • 가격 상승과 함께 거래량 증가 → 강한 추세
  • 거래량 급감 → 추세 약화 신호

🧭 PART 2: 주가 데이터를 얻는 주요 방법 (API 중심)

모델에 지표를 넣기 위해선 주가 데이터가 필수죠! 다행히 다양한 API를 통해 자동으로 데이터를 가져올 수 있습니다.


🔹 1. yfinance (야후 파이낸스)

  • 전 세계 주식 및 ETF 데이터
  • 라이브러리: yfinance
import yfinance as yf
tsla = yf.download("TSLA", start="2022-01-01", end="2023-01-01")
tsla[['Close', 'Volume']].plot()

✅ 장점: 간편, 무료, 다양한 지표 포함
❌ 단점: 한국 종목은 일부만 지원


🔹 2. Alpha Vantage

  • 미국 주식, 환율, 암호화폐 등 다양한 금융 데이터 제공
  • API 키 필요 (무료)
from alpha_vantage.timeseries import TimeSeries

ts = TimeSeries(key='YOUR_API_KEY', output_format='pandas')
data, meta = ts.get_daily(symbol='AAPL', outputsize='full')

✅ 장점: 풍부한 메타데이터, 신뢰도 높음
❌ 단점: 호출 횟수 제한 (1분당 5회)


🔹 3. FRED (미국 연방준비은행 경제지표)

  • 금리, GDP, 실업률 등 매크로 지표에 강함
  • API 키 발급 필요, fredapi로 사용

✅ 머신러닝 보조 지표로 적합 (시장 흐름 판단)


🔹 4. 키움증권 OpenAPI+ (국내 주식)

  • 국내 주식 데이터를 수집하기 위한 대표적인 공식 API입니다.
  •  
    키움증권 계좌 보유자만 사용 가능하며, **Windows 환경 + ActiveX 기반**입니다.
    금리, GDP, 실업률 등 매크로 지표에 강함
✅ 장점: 국내 시장 데이터를 정밀하게 수집 가능
❌ 단점: 윈도우 전용, 설치 복잡, 실시간 요청 수 제한

🧠 정리하자면

지표 기능 머신러닝 효과
MA 추세 확인 단기/장기 예측에 안정성 부여
RSI 과매수/과매도 판단 예측 방향 필터링
Bollinger Bands 변동성 판단 진입/이탈 시점 탐색
MACD 모멘텀 분석 방향성 강화
EMA 민감한 추세 반응 최근 흐름 반영 강화
OBV 거래량 기반 추세 판단 신뢰도 상승 필터링

그리고 이 모든 지표를 적용하려면
yfinance, Alpha Vantage, FRED, 네이버 API 등을 통해 데이터를 잘 준비하는 것이 무엇보다 중요합니다.


여기서 끝이 아닙니다.
다음 글에서는 이 지표들을 조합한 머신러닝 모델 구축 실습을 Colab에서 직접 해볼게요.
지금은 “데이터와 지표”라는 도구함을 잘 챙겨두세요.
이제 본격적인 투자 모델링의 세계로 출발합니다 😼💼

반응형