제 2의 네로 (AI)
머신러닝으로 주식투자하기 - 3편 데이터 수집하기
Dr. 네로
2025. 8. 27. 17:54
반응형
이 글은 닥터 네로가 아닌, 개조된 GPT가 작성했습니다.🐾
📈 주가 예측 머신러닝에 꼭 필요한 핵심 지표와 데이터 수집 방법
주식 시장을 머신러닝으로 예측하려는 분들이라면, 반드시 고민해야 할 것이 있습니다:
✅ 어떤 지표를 모델에 넣어야 하나요?
✅ 그 데이터를 어디서 구할 수 있나요?
이 두 가지가 제대로 준비되지 않으면, 아무리 좋은 모델이라도 **'쓰레기를 넣으면 쓰레기가 나온다'**는 말처럼 정확한 예측은 불가능합니다.
이번 글에서는 주가 예측에 자주 쓰이는 핵심 지표들과 그 지표를 만들기 위한 데이터 수집 방법을 깔끔하게 정리해드립니다.
🧩 PART 1: 주가 예측에 꼭 쓰이는 핵심 지표들
1️⃣ 이동 평균 (Moving Average, MA)
- 일정 기간 동안의 평균 가격
- 가격 추세 파악에 유용
수식:
활용:
- 20일, 50일, 200일 이동 평균을 많이 사용
- 단기 MA가 장기 MA를 위로 뚫을 때 → 골든 크로스 (매수 신호)
2️⃣ 상대강도지수 (RSI: Relative Strength Index)
- 주가 상승과 하락의 강도를 비교
- 과매수 / 과매도 판단
수식:
활용:
- RSI > 70: 과매수 상태
- RSI < 30: 과매도 상태
3️⃣ 볼린저 밴드 (Bollinger Bands)
- 가격의 표준편차 기반 상/하한 밴드 계산
수식:
활용:
- 가격이 밴드 상단을 돌파 → 단기 고점 시사
- 하단에서 반등 → 단기 매수 기회로 간주되기도
4️⃣ MACD (Moving Average Convergence Divergence)
- 빠른 이동평균선과 느린 이동평균선의 차이
수식:
활용:
- MACD가 Signal 위로 돌파 → 매수 신호
- MACD가 Signal 아래로 하락 → 매도 신호
5️⃣ EMA (Exponential Moving Average)
- 최근 데이터에 더 많은 가중치를 둔 이동평균
수식:
활용:
- 빠른 반응을 원할 때 단기 EMA(10, 20) 사용
- 추세 확인용으로 장기 EMA(50, 100, 200) 사용
6️⃣ 거래량 기반 지표 (OBV 등)
- 거래량에 가격 움직임을 더해 추세 판단
- On-Balance Volume(OBV), Volume Moving Average 등
활용:
- 가격 상승과 함께 거래량 증가 → 강한 추세
- 거래량 급감 → 추세 약화 신호
🧭 PART 2: 주가 데이터를 얻는 주요 방법 (API 중심)
모델에 지표를 넣기 위해선 주가 데이터가 필수죠! 다행히 다양한 API를 통해 자동으로 데이터를 가져올 수 있습니다.
🔹 1. yfinance (야후 파이낸스)
- 전 세계 주식 및 ETF 데이터
- 라이브러리: yfinance
import yfinance as yf
tsla = yf.download("TSLA", start="2022-01-01", end="2023-01-01")
tsla[['Close', 'Volume']].plot()
✅ 장점: 간편, 무료, 다양한 지표 포함
❌ 단점: 한국 종목은 일부만 지원
🔹 2. Alpha Vantage
- 미국 주식, 환율, 암호화폐 등 다양한 금융 데이터 제공
- API 키 필요 (무료)
from alpha_vantage.timeseries import TimeSeries
ts = TimeSeries(key='YOUR_API_KEY', output_format='pandas')
data, meta = ts.get_daily(symbol='AAPL', outputsize='full')
✅ 장점: 풍부한 메타데이터, 신뢰도 높음
❌ 단점: 호출 횟수 제한 (1분당 5회)
🔹 3. FRED (미국 연방준비은행 경제지표)
- 금리, GDP, 실업률 등 매크로 지표에 강함
- API 키 발급 필요, fredapi로 사용
✅ 머신러닝 보조 지표로 적합 (시장 흐름 판단)
🔹 4. 키움증권 OpenAPI+ (국내 주식)
-
국내 주식 데이터를 수집하기 위한 대표적인 공식 API입니다.
-
키움증권 계좌 보유자만 사용 가능하며, **Windows 환경 + ActiveX 기반**입니다.금리, GDP, 실업률 등 매크로 지표에 강함
✅ 장점: 국내 시장 데이터를 정밀하게 수집 가능
❌ 단점: 윈도우 전용, 설치 복잡, 실시간 요청 수 제한
🧠 정리하자면
지표 | 기능 | 머신러닝 효과 |
MA | 추세 확인 | 단기/장기 예측에 안정성 부여 |
RSI | 과매수/과매도 판단 | 예측 방향 필터링 |
Bollinger Bands | 변동성 판단 | 진입/이탈 시점 탐색 |
MACD | 모멘텀 분석 | 방향성 강화 |
EMA | 민감한 추세 반응 | 최근 흐름 반영 강화 |
OBV | 거래량 기반 추세 판단 | 신뢰도 상승 필터링 |
그리고 이 모든 지표를 적용하려면
yfinance, Alpha Vantage, FRED, 네이버 API 등을 통해 데이터를 잘 준비하는 것이 무엇보다 중요합니다.
여기서 끝이 아닙니다.
다음 글에서는 이 지표들을 조합한 머신러닝 모델 구축 실습을 Colab에서 직접 해볼게요.
지금은 “데이터와 지표”라는 도구함을 잘 챙겨두세요.
이제 본격적인 투자 모델링의 세계로 출발합니다 😼💼
반응형