studying data

문제의 본질을 꿰뚫어 해결책을 찾는 법을 공부합니다

콤퓨타 공부/증권데이터 분석 2

[증권데이터] 판다스는 뉴욕 증권가에서 일하는 퀀트에 의해 개발됐다

판다스는 계량 경제에 도움을 주기 위해 만들어졌습니다. 우리가 금융 데이터를 연구할 때는 공통적인 task를 가지는데 통계적인 추정을 하는 일들을 공통적으로 하게 됩니다. 쉽게 쓸 수 있게 되기 때문에 어떤 기술을 사용할 것인지 광범위한 기술이 있습니다. Numpy는 중심적인 역할을 합니다. pandas도 numpy를 가지고 있고 여러 도구들을 가지고 있기 때문에 재사용이 가능한 API를 제공합니다. 그리고 파이썬은 접착제 언어라는 특징이 있습니다. 다른 언어와 호환성이 좋기 때문입니다. bridge performance gap이 있는데 API만 파이썬으로 개발하면 다른 빠른 언어의 장점과 파이썬의 쉽고 빠른 속도가 결합될 수 있습니다. 파이써니스타라고 부르는데 이들은 필요한 툴이 있으면 직접 만들거나 ..

[증권데이터] 신호와 소음 찾기 강의소개

수집과정 FinanceDataReader, requests로 원하는 정보를 수집하고 Beautifulsoup5으로 분석하고 복잡한 데이터의 경우 tqdm을 활용할 수 있습니다. 그리고 pandas를 통해서 다양한 테이블을 수집하고 크롬개발자도구를 이해하면 복잡한 데이터도 간단하게 수집할 수 있습니다. 전처리와 분석 판다스의 필터 기능을 이용해 여러 칼럼을 한번에 전처리하고 판다스의 melt를 통해 tidy data를 만들 수 있습니다. merge와 concat의 차이점과 활용방법을 알아보기도 합니다. 그리고 groupby와 pivot_table, crosstab, value_counts를 통한 통계적인 계산도 가능합니다. 시각화 시각화에서는 동적, 정적인 도구를 모두 사용합니다. Matplotlib, P..