studying data

문제의 본질을 꿰뚫어 해결책을 찾는 법을 공부합니다

콤퓨타 공부/증권데이터 분석

[증권데이터] 신호와 소음 찾기 강의소개

study_data 2021. 9. 9. 19:47

수집과정

FinanceDataReader, requests로 원하는 정보를 수집하고 Beautifulsoup5으로 분석하고 복잡한 데이터의 경우 tqdm을 활용할 수 있습니다. 그리고 pandas를 통해서 다양한 테이블을 수집하고 크롬개발자도구를 이해하면 복잡한 데이터도 간단하게 수집할 수 있습니다.

전처리와 분석

판다스의 필터 기능을 이용해 여러 칼럼을 한번에 전처리하고 판다스의 melt를 통해 tidy data를 만들 수 있습니다. merge와 concat의 차이점과 활용방법을 알아보기도 합니다. 그리고 groupby와 pivot_table, crosstab, value_counts를 통한 통계적인 계산도 가능합니다. 

시각화

시각화에서는 동적, 정적인 도구를 모두 사용합니다. Matplotlib, Pandas, Seaborn, Plotlym Cufflinks를 사용하기도 합니다.


강의에서 다루는 내용들

한국거래소 전체 상장종목 목록을 수집하고 전처리하고 분석까지 합니다. 그리고 etf전체 종목을 수집하고 분석합니다. 업종, 테마별 투자정보를 수집해서 단 하나의 데이터 프레임으로 만들고 전처리해서 시각화하는 방법도 알아봅니다. 수집한 데이터를 통해 코스피에서 전체 종목과 업종 테마도 수집하고 분석합니다. 실습해본 내용은 코스피 200 종목에 대해 수집해보거나 다른 종목에 대해서도 수집해서 적용할 수 있습니다. HTS나 MTS는 다양한 기술적 지표를 제공하는데 이 원리도 이해합니다. 동적 시각화도구와 정적인 시각화도구도 모두 활용해서 다양한 시각화 툴의 특징과 원리를 이해하고 적용합니다. 

설명과 함께 입력되지 않은 파일과 입력된 파일 제공으로 코드 연습이 가능합니다. 입력되지 않은 파일에 실습을 하고도 제대로 활용했는지 알아볼 수 있습니다. 쓰레기 데이터를 넣어주면 결국 좋은 결과가 나올 수 없습니다. 좋은 데이터를 넣어주기 위해서 전처리가 무엇보다도 중요합니다. 업종, 테마주 등 이런 데이터들을 수집, 분석, 시각화하는 수업입니다. 

 

- 해당 내용은 인프런 사이트의 박조은 강사님이 진행하는 '증권데이터 수집과 분석으로 신호와 소음찾기' 미리보기 강의 내용입니다-