티스토리 뷰

반응형

금융 데이터 강좌를 찾아보다 한국 은행 금요강좌에

'효과적인 금융경제 데이터 분석 방법'

이라는 강좌가 있어 들어보았다.

강의 자료 및 개인적으로 남는 내용을  정리해보고자 한다. 

 

1. 금융데이터는 크게 시계열 데이터, 패널 데이터로 나뉨.

이때 시계열 데이터는 주기(Frequency), 단위(Unit)이 꼭 명시되어 있어야함

 

2. 금융데이터 분석은 아래 4과정을 따르게 됨.

데이터분석 4과정

3. 입수 저장

데이터를 가지고 올 곳을 소개함.

- DB NOMICS

: 프랑스 중앙은행에서 무료로 제공 중인 금융경제 데이터 베이스. 

 IMF, BIS 등 전세계 87개 데이터베이스 취합 및 제공

 

DBnomics

DBnomics – The world's economic database

db.nomics.world

3. 전처리 

 

4. 분석 

 

5. 실습

                                                          <FRED 데이터 베이스를 이용한 일일 환율데이터 분석 >
          FRED : 미 세인트루이스 연방 준비은행이 제공하는 금융경제 데이터 서비스 (https://fred.stlouisfed.org/)

실습한 colab

 

 

6. 배운점 

  • 금융데이터는 frequency 와 unit 이 중요.
  • daterange 를 사용했는데, period range 가 있다는 것을 처음 알게 되었다. 파이썬의 period 관련 더 스터디 해봐야겠다.
  • 이전 값과의 데이터 편차를 자동 계산하는 함수 pct_change 를 알게 되었다.
  • 아래 코드는 자주 쓸 것 같아서 keep 해둬야겠다.
 
tscodes = [f'DEX{cc}US' for cc in ['KO','JP','CH']]

 _data.index = _data.index.to_period(freq='D') # 일 주기 명시

_data = tseries.dropna().resample('Q').mean() # 결측 치 제거 후 분기 변환 (평균치)

# 분기 편차 히스토그램
emon.plot.hist(bins=100)

# 1997Q4 - 1998Q1 기간 일 데이터 기간 확인
base_qq= emon[emon > 0.3].index[0]
pd.period_range(start=base_qq - 2, end=base_qq, freq='D')

# 1997Q4 - 1998Q1 기간 일 데이터 차트
base_dd = pd.period_range(start=base_qq - 2, end=base_qq, freq='D')
tsdata['DEXKOUS'][tsdata['DEXKOUS'].index.isin(base_dd)].plot()
  • 참고할 만한 자료 소개(한글 교재) Jump to Python – 링크 (기초 학습 4장까지)
    (영문) 금융경제를 위한 파이썬 프로그래밍 – 링크
    (영문) 시계열 분석에 대한 모든 것 - 링크
 
 
반응형