studying data

문제의 본질을 꿰뚫어 해결책을 찾는 법을 공부합니다

콤퓨타 공부 28

[python 공부] 배열의 데이터 타입 dtype

array는 파이썬 리스트와 달리 같은 단일 데이터 타입만 저장이 가능합니다. 파이썬 리스트의 경우는 [1,14, Tme, "S"] 등 다양한 형태의 데이터가 들어갈 수 있습니다. 그런데 numpy에서는 여러 데이터를 함께 쓸 수 없고, 하나의 형식만 저장할 수 있습니다. arr = np.array([0, 1, 2, 3, 4], dtype= float) print(arr) #[0. 1. 2. 3. 4.] print(arr.dtype) #'float64' print(arr.astype(int)) #[0 1 2 3 4] float는 실수형을 뜻하는데 정수형이 아니라 실수의 형태로 0.0 , 1.0의 형태로 나타납니다. 다른 데이터 타입으로 바꾸기 위해서는 'astype'을 쓸 수 있습니다. 맨 아래 줄 처럼..

[python 공부] numpy와 list

Numpy란 파이썬에서 대규모 다차원 배열을 다룰 수 있게 도와주는 라이브러리입니다. 데이터의 대부분은 숫자의 배열이기 때문에 중요합니다. 하나의 이미지 파일엔 픽셀이 있고, 밝고 어두운 명암도 숫자로 나타낼 수 있습니다. 이 경우에는 세로인 1차원과 가로인 1차원의 곱으로 이뤄져있어서 결국은 2차원 데이터가 됩니다. 그리고 사운드 데이터를 생각해보면, 가로축은 시간이고 세로축은 소리입니다. 각각 점을 찍어 숫자로 나타낼 수 있는데 숫자의 배열인 1차원 자료로 나타낼 수 있습니다. 이미지, 소리도 숫자로 나타낼 수 있기 때문에 실생활 데이터도 숫자의 배열로 볼 수 있죠. 그래서 우리는 숫자 배열로 처리하기 위해 numpy를 사용합니다. Numpy는 반복문 없이 배열 처리가 가능한데, 빠른 연산을 지원하고..

[python 공부] 웹페이지 방문

from-import를 이용해서 urllib패키지 안 request 모듈에서 urlopen 함수를 불러오는 코드를 작성해봅시다. 다음 주소를 urlopen하고, read() 한 다음, 이를 utf-8으로 decode 한 결과를 변수 webpage에 넣어봅시다.https://en.wikipedia.org/wiki/Lorem_ipsum 변수 webpage를 출력해봅시다. 무엇이 나오나요? Lorem ipsum - Wikipedia In publishing and graphic design, Lorem ipsum is a placeholder text commonly used to demonstrate the visual form of a document or a typeface without relying ..

[python 공부] import vs. from-import

from a import b를 이용해서 random의 randrange()를 불러와봅시다. import a를 이용해서 math 모듈을 불러와봅시다. 변수 var1에 randrange 함수를 이용해 1이상 10이하의 임의의 정수를 넣어봅시다. 변수 var2에 math.log 함수를 이용해 log_{72}{5184}log72​5184의 값을 넣어봅시다. var1, var2를 출력하여 결과값을 확인해봅시다. 내가 만들고 통과한 코드 from random import randrange import math as m var1 = int(randrange(1,10)) var2 = m.log(5184, 72) print(var1, var2) 정답코드 from random import randrange import m..

[python 공부] 패키지

패키지란 모듈을 폴더(Directory)로 구분해 관리하는 것입니다. 폴더 안에는 .py라고 쓰인 여러 파일이 들어있다면 이 파일은 모듈이 됩니다. 패키지가 필요한 이유는 모듈을 편리하게 관리하기 위해서에요. 어떤 것은 이미지가 들어있고, 공지나 뉴스같은 종류별로 묶기 위해서입니다. 찾기 쉽도록 관리하기 위해 패키지를 사용합니다. 예를 들어 user라는 폴더에 cal이라는 모듈이 있고 함수 plus가 있다면 import를 이용해 폴더를 불러온 후 함수를 실행할 수 있습니다. import user.cal print(cal.plus(3,4)) 폴더와 칼 사이에 온점(dot, .)이 쓰여서 실행할 수 있습니다. 아래 코드처럼 cal모듈의 plus함수를 쓰라는 뜻이죠. 두번째 방법은 from-import를 사용..

[python 공부] 웹 서버-클라이언트 구조와 라이브러리

웹, HTML, CSS, JS, 브라우저 우리가 인터넷 웹 서비스를 사용할 때 서버는 항상 답을 주는 구조라는 걸 유념해야 합니다. HTML은 사이트를 만드는 뼈대와 같고 JS는 어떻게 상호작용해야하는지 알려주는 역할을 합니다. 그리고 CSS는 보이는 모습을 단정하게 구현해줍니다. 웹 크롤러는 스파이더링(spidering)이라고 하기도 합니다. 검색엔진에서 굉장히 많이 진행하죠. 구글의 크롤러가 열심히 돌아다니면서 크롤링을 하고 타고타고 가다가 네이버의 블로그도 수집을 해오는것이죠. 검색결과가 위로 올라온다는 것은 사람들이 많이 찾거나, 정확하거나, 광고를 붙인 경우인데요 구글은 이런 정보검색에 최적화되어있습니다. 구글은 상위에 보여지는 알고리즘이 잘 되어있는데, rank가 위에 있는 것을 띄워줍니다. ..

[Git 공부] branch

(참고) 본 게시글은 다른 블로그들의 정보와 수업 내용을 짜집기해 재구성한 것입니다 소프트웨어 개발을 할 때 개발자들은 동일한 소스코드를 공유하죠. 동일한 소스코드 위에서 누군가는 버그를 수정하고, 또 누군가는 새로운 코드를 만들어냅니다. 여러 사람이 같은 소스로 작업하기 때문에 다양한 버전의 코드가 만들어질 수 있습니다. 이렇게 여러 개발자가 동시에 다양한 작업을 할 수 있도록 만들어 주는 것이 브랜치의 가장 큰 기능입니다. 작업을 분리하기 때문에 변경한 내용을 쉽게 확인할 수 있고 원래 버전과 비교해서 전혀 다른 새로운 버전을 만들 수 있죠. 동시에 이렇게 만들어진 브랜치는 다른 브랜치와 병합(merge)해서 새로운 브랜치로 모을수도 있습니다. 여러 명이 작업할 때는 메인 브랜치를 하나 만들고, 여기..

[데잇걸즈 5기 후기] 데잇걸즈 5기 2달 수강 후 느낀 점들

오지선다에서 답을 고르고, 풀이과정을 외우는 한국의 교육과정에 지친 저에게 사회학은 새로운 세계와도 같았어요. (MBTI신봉자는 아니지만 ENTP들은 주어진 형식적 수업보다 토론식 수업에서 더 두각을 나타낸다고...! 맞다!! 정말 그렇다!!) 아무도 정답을 요구하지 않고, 이론의 큰 흐름을 정확하게 이해해서 나의 문제로 당겨오는데 주안점이 있는 학문이 사회학이라 더 마음이 갔던 것 같습니다. 그렇게 사회학의 매력에 푹 빠져서 대학원을 진학했는데, 진학하고 보니 가이드라인없이 굴러가는 논문 쓰기가 참 어려웠어요. 가이드라인이 없다는건 창의력을 극대로 발휘할 수 있지만 동시에 길을 찾기 위한 감은 알아서 획득해야한다는 이야기니까요. 박사과정을 준비하다가 회의감을 느낀 건 이 지점에서였어요. 뚜렷하게 내가 ..