1. Mort 변수는 천만명 당 피부암 사망자 수 입니다. Lat는 위도(latitude)를 나타냅니다. 피부암 사망자 수와 위도의 피어슨 상관 계수를 구해보세요.
import pandas as pd
import pingouin as pg
sc = pd.read_excel('skincancer.xlsx')
pg.corr(sc.Mort, sc.Lat)
# 피어슨 상관계수(r) = -0.824518
2. 위의 상관계수의 95% 신뢰구간은 무엇입니까?
정답: -0.9, -0.71
3. 모집단에서 상관계수는 어떤 범위에 있습니까?
정답: - ~ -
4. 위의 상관계수의 p-value는 얼마입니까?
정답: 0.05보다 작다(p < .05) / 해설: 분석 결과에서 p-val이 p-value입니다. e-13은 10의 -13승이라는 뜻입니다. 즉, 앞에 0.00... 식으로 0이 13개 붙어 있다는 뜻입니다.
5. 위의 p-value 또는 신뢰구간으로 볼 때 어떤 결론을 내릴 수 있습니까(유의수준 5%)?
정답: 모집단에서 상관계수는 -이다 / 해설: 상관 분석에서 귀무가설은 "두 변수의 상관계수 = 0"입니다. 유의수준 5%에서는 p-value가 .05보다 작으면 귀무가설을 기각합니다. 이 경우 모집단의 상관계수는 + 또는 -라고 할 수 있습니다. 표본에서 상관계수가 -이므로 이때는 -라고 결론 내릴 수 있습니다. 신뢰구간을 보아도 동일한 결론을 내릴 수 있습니다. 95% 신뢰구간이 - ~ - 범위에 있다면, 모집단에서 상관계수는 -라고 할 수 있습니다.
6. 위의 분석 결과를 종합할 때 위도가 높아질 수록 피부암 사망자 수는 어떻게 된다고 볼 수 있습니까?
정답: 줄어든다 / 해설: 상관계수가 -이면, 한 변수가 증가할 때 다른 변수는 감소합니다.
자료를 다운받아 문제를 풀 수 있습니다
'콤퓨타 공부 > 통계' 카테고리의 다른 글
[통계 공부] 상호작용(interaction) (0) | 2021.09.08 |
---|---|
[통계 공부] 회귀분석을 통한 예측 (0) | 2021.08.23 |
[통계 공부] 회귀분석: 임신기간과 신생아 체중 (0) | 2021.08.23 |
[통계 공부] 분산 분석: 우울증의 치료효과 (0) | 2021.08.23 |
[통계 공부] 두 집단의 평균 비교: 흡연과 신생아 체중 (0) | 2021.08.23 |