studying data

문제의 본질을 꿰뚫어 해결책을 찾는 법을 공부합니다

콤퓨타 공부/통계

[통계 공부] 상관분석: 피부암과 위도의 상관관계

study_data 2021. 8. 23. 11:50

1. Mort 변수는 천만명 당 피부암 사망자 수 입니다. Lat는 위도(latitude)를 나타냅니다. 피부암 사망자 수와 위도의 피어슨 상관 계수를 구해보세요.

import pandas as pd
import pingouin as pg

sc = pd.read_excel('skincancer.xlsx')
pg.corr(sc.Mort, sc.Lat)

# 피어슨 상관계수(r) = -0.824518

 

2. 위의 상관계수의 95% 신뢰구간은 무엇입니까?

정답: -0.9, -0.71

 

3. 모집단에서 상관계수는 어떤 범위에 있습니까?

정답: - ~ -

 

4. 위의 상관계수의 p-value는 얼마입니까?

정답: 0.05보다 작다(p < .05) / 해설: 분석 결과에서 p-val이 p-value입니다. e-13은 10의 -13승이라는 뜻입니다. 즉, 앞에 0.00... 식으로 0이 13개 붙어 있다는 뜻입니다.

 

5. 위의 p-value 또는 신뢰구간으로 볼 때 어떤 결론을 내릴 수 있습니까(유의수준 5%)?

정답: 모집단에서 상관계수는 -이다 / 해설: 상관 분석에서 귀무가설은 "두 변수의 상관계수 = 0"입니다. 유의수준 5%에서는 p-value가 .05보다 작으면 귀무가설을 기각합니다. 이 경우 모집단의 상관계수는 + 또는 -라고 할 수 있습니다. 표본에서 상관계수가 -이므로 이때는 -라고 결론 내릴 수 있습니다. 신뢰구간을 보아도 동일한 결론을 내릴 수 있습니다. 95% 신뢰구간이 - ~ - 범위에 있다면, 모집단에서 상관계수는 -라고 할 수 있습니다.

 

6. 위의 분석 결과를 종합할 때 위도가 높아질 수록 피부암 사망자 수는 어떻게 된다고 볼 수 있습니까?

정답: 줄어든다 / 해설: 상관계수가 -이면, 한 변수가 증가할 때 다른 변수는 감소합니다.

skincancer.xlsx
0.01MB

자료를 다운받아 문제를 풀 수 있습니다