studying data

문제의 본질을 꿰뚫어 해결책을 찾는 법을 공부합니다

전체 글 46

[2024년 연구원정 부트캠프] 3주차 후기. 문제분석에세이 트랙밋업

3주차는 글쓰기 타임1주차와 2주차에서 작성한 내용을 기반으로 줄글로 엮어내는 시간이었습니다단발적인 생각들을 문장으로 엮는 것은 또 다른 어려운 작업이잖아요아우 너무 하기 싫은 거 있죠아무리 짧은 글이라도 글을 쓰려면 집중해야 하고 잠시 침잠하지 않으면 불가하니까요그래서 미루고 미루다가 결국 마지막에 완성해서 빠띠 캠페인즈에 업로드!https://campaigns.do/discussions/1760https://campaigns.do/discussions 토론 | 시민활동플랫폼 빠띠이슈에 대해 마음껏 토론해 보세요.campaigns.do 디지털 시민 광장 토론에 업로드를 하고요 이걸 기반으로 각자 5분씩 발표를 했습니다 ​ 사실 같은 팀이 아니면 다른팀이 뭐하..

[2024년 연구원정 부트캠프] 2주차 후기. 문제분석 리서치

1주차 과제는 온전히 '뇌피셜'로만 작성해야했는데요내가 알고 있는 것을 글로 적는 것으로부터 시작이 될 수 있어서 그렇다고 하시더라구요처음에는 '그런가..?' 생각이 들기도 했었는데요​2주차 과제를 수행하면서 보니까 이 뇌피셜이 연구에서의 '직관'을 의미하는 것같다고 생각했어요.연구의 촉 같은 것이 아닐까 싶더라고요​연구를 거듭할수록 자료에 매몰되다보면 이 촉이 무엇이었는지, 내가 연구를 왜 시작한 것인지 그 초심을 잃기 쉽잖아요.그래서 이런 기록 활동이 굉장히 중요하구나 느꼈습니다.2주차 학습가이드와 미션은 문제분석 리서치​2주차 팀 밋업을 하면서 관심있는 토픽들을 잘 분류해야겠구나 새삼 느꼈답니다.밋업이 그냥 허례허식처럼 보일수도 있지만 연구자들은 좀.. 말을 할 필요가 있잖아요말을 하면서 자기 생각..

[2024 연구원정 부트캠프] 1주차 후기. 문제 소개

연구원정 부트캠프가 닻을 올렸습니다.드디어 1주차 밋업 완료!​1주차 미션은 문제를 소개하는 시간이었어요내가 연구를 하고 싶은 주제에 대해서 개괄적으로 작성해보기!'뇌피셜'로 쓰라고 하시더라구요!나이오트에서 문제를 분석할 수 있는 템플릿을 제공해주시는데요문제소개, 문제 배경, 문제의 장, 왜 문제인가, 결론을 주제로 썼습니다.저는 제가 궁금했던 주제를 쭈욱 소개하는 글을 써보았구요.​처음으로 하는 온라인 줌미팅!어떤 느낌일까, 얼마나 많이 오실까 기대하면서 줌으로 바로 접속해봅니다​전체 공지가 끝나고 팀별로 밋업을 시작했는데요간단하게 서로 작성해온 내용을 나누고 어떤 고민지점들이 있었는지 생각을 공유했답니다​ 다 같이 1주차를 표시하면서 마무리!2주차 과제도 기다려봐야겠어요.아직은 얼렁뚱땅 조금 어색해요..

[2024 연구원정 부트캠프] 하반기 사회문제해결형 연구자를 위한 연구성장플랫폼 연구탐사대 OT 참석 후기

올 해는 게재 논문 하나 마쳐야지 말만 하다가 결국 9월을 맞이하였더랬죠​이래선 안되겠다 싶었습니다​게으른 나를 움직여야겠다 하던 시점, 인스타에 뜬 광고를 보고 바로 결정​바로 연구원정 부트캠프입니다근데 부트캠프라는 용어 자체가 원체 데이터 쪽에서 많이 쓰는 용어잖아요​근데 그만큼 모듈화와 시스템을 짚는다는 얘기같기도 하더라고요​사실 대학원 끝내고 느낀 건 '대학원이 정말 순환형 연구 프로세스를 배우는 과정이구나' 였거든요근데 사실 이건 옆에서 바짝 알려주는 사람만 있으면 따라가기 어려운 과정은 아닌 것 같아요​선행연구로 연구 지형을 탐색하는 건 개인 몫이어도 이 시스템은 사실 다 알려줄 수 있는 부분이라고 생각.​근데 이제 이걸 해주는 사람이 대학원에는 아무도 없단 사실왜냐면 각자 읽을 거 많고 각자..

[강사역량강화워크샵] 찾아가는 폭력예방교육 1회차 후기

찾폭교육, 이제 3주간 달려봅니다. 가보자고~ 오늘부터 젠더교육플랫폼효재에서 진행하는 폭력예방통합교육이 시작됐습니다. 효재는 '여성가족부·서울특별시 지정 서울특별시 폭력예방교육지원기관'이에요. 이번 워크샵은 3주간 일주일에 2번씩 만나 3시간 강의를 수강하는 과정인데요. 저는 한국양성평등교육진흥원에서 전문강사 자격을 획득한 뒤 권수현 선생님의 권유로 이 과정을 신청했답니다. 저는 이미 찾아가는 폭력예방교육을 여러 학교에 다녀왔어요. 전국 여기저기를 다니면서 교육을 다니는게 전 너무너무 재미있었어요. ENTP인 제 성향과 완벽하게 일치했달까요! 새로운 사람들을 만나 재미있는 교육을 하는게 너무 재밌었는데, 이번에 전문성을 한층 업그레이드해보려고요. 현장에서 강의를 하면서, 대상자별 교육안이 생기면 좋겠다고..

[딥러닝] 프레임워크

딥러닝 프레임워크 한창 딥러닝이 핫할 때, 많은 기업들에서 프레임워크를 발표했습니다. 그런데 초기에는 사용도 어렵고 여기저기 난립하다 보니, 든든한 뒷백을 가지고 있는 텐서플로 이외에 다른 프레임워크는 생겼다가 사라졌다가 했죠. 아래는 다양한 딥러닝 프레임워크의 종류 중 살아남은 것들을 정리한 것입니다. 프레임워크의 종류 - 텐서플로: 구글이 개발하고 가장 높은 점유율을 보임. 기업용 기능이 많음. - 케라스: 여러 딥러닝 프레임워크를 같은 방법으로 편하게 사용하라 수 있도록 하는 라이브러리. 텐서플로 2.X부터 케라스 API를 기본 사용법으로 채택함. -파이토치: 페이스북이 개발했고 새로운 모형을 만들기 편리해서 학계에서 인기를 끔. 텐서플로 설치 pip install tensorflow GPU 지원을..

[증권데이터] 판다스는 뉴욕 증권가에서 일하는 퀀트에 의해 개발됐다

판다스는 계량 경제에 도움을 주기 위해 만들어졌습니다. 우리가 금융 데이터를 연구할 때는 공통적인 task를 가지는데 통계적인 추정을 하는 일들을 공통적으로 하게 됩니다. 쉽게 쓸 수 있게 되기 때문에 어떤 기술을 사용할 것인지 광범위한 기술이 있습니다. Numpy는 중심적인 역할을 합니다. pandas도 numpy를 가지고 있고 여러 도구들을 가지고 있기 때문에 재사용이 가능한 API를 제공합니다. 그리고 파이썬은 접착제 언어라는 특징이 있습니다. 다른 언어와 호환성이 좋기 때문입니다. bridge performance gap이 있는데 API만 파이썬으로 개발하면 다른 빠른 언어의 장점과 파이썬의 쉽고 빠른 속도가 결합될 수 있습니다. 파이써니스타라고 부르는데 이들은 필요한 툴이 있으면 직접 만들거나 ..

[증권데이터] 신호와 소음 찾기 강의소개

수집과정 FinanceDataReader, requests로 원하는 정보를 수집하고 Beautifulsoup5으로 분석하고 복잡한 데이터의 경우 tqdm을 활용할 수 있습니다. 그리고 pandas를 통해서 다양한 테이블을 수집하고 크롬개발자도구를 이해하면 복잡한 데이터도 간단하게 수집할 수 있습니다. 전처리와 분석 판다스의 필터 기능을 이용해 여러 칼럼을 한번에 전처리하고 판다스의 melt를 통해 tidy data를 만들 수 있습니다. merge와 concat의 차이점과 활용방법을 알아보기도 합니다. 그리고 groupby와 pivot_table, crosstab, value_counts를 통한 통계적인 계산도 가능합니다. 시각화 시각화에서는 동적, 정적인 도구를 모두 사용합니다. Matplotlib, P..

[AWS 멘토링] AWS x 걸스인텍 멘토링 후기

5주간의 멘토링이 막을 내렸습니다. 오래 자주 만난 것은 아니었지만, 부담없이 서로에게 지지와 응원이 되는 시간이었어요. 특히나 저는 IT업계 현장에서 일할 수 있는 분들과 이야기할 수 있는 기회라 굉장히 좋았습니다. 몇년 차에 어떤 고민을 하게 되는지 현실적인 경로를 그릴 수 있었거든요. 멘토 한 분에 멘티 3명이었지만, 저에겐 멘토 3명같은 느낌이었어요. 저희 팀의 메인멘토는 AWS에서 클라우드 교육을 담당하고 있는 지선님이셨어요. 국내 대기업에서 일하다가 외국계 대기업에서 일하는 경험의 전환이 어떤 의미를 가지는지, 일하는 분위기나 연봉계산방법 등 다양한 이야기를 들을 수 있었죠. 물론 이런 이야기들도 좋았지만, 지선님께서 고민했던 갈래들을 들을 수 있어서 저에겐 정말 큰 도움이 됐습니다. 이 멘토..

[머신러닝 공부] Overview of Colaboratory Features, 머신러닝과 딥러닝 정의

Cells A notebook is a list of cells. cells contain either explanatory text or executable code and its output. 머신러닝의 정의 _ 톰 미첼(Tom Mitchell) 만약 어떤 작업 T에서 경험 E를 통해 성능측정방법인 P로 측정했을 때 성능이 향상된다면 이런 컴퓨터 프로그램은 학습을 한다. 어떤 게 정말 좋은 것인지 말할 수 있는 지에 대한 척도가 정말 좋아진다면 이것은 학습을 하고 있는 것이고 인공지능이라고 말할 수 있다고 봅니다. 예를 들어 어떤 선생님이 있다고 해볼까요? 10년간 열심히 초등학생들을 가르쳤다고 해봅시다. 아이들이 어떤 형태를 보이면 모범생에 속한다거나, 어떤 학생은 그림을 잘 그린다는 패턴이 있을것..