1. Wgt는 신생아의 체중(g), Gest는 임신 기간(주)을 나타냅니다. 임신기간을 독립변수, 신생아의 체중을 종속변수로 회귀분석을 하려면 관계식을 어떻게 써야 합니까?
정답: Wgt ~ Gest / 설명: 관계식은 '종속변수 ~ 독립변수'와 같이 씁니다. 종속변수는 독립변수에 따라 달라지는 변수를 말합니다.
2. 임신기간을 독립변수, 신생아의 체중을 종속변수로 회귀분석을 실시해보세요. 절편은 얼마입니까? 아래 표는 이하 질문들의 답변도 되기 때문에 색깔별로 표기해뒀습니다.
import pandas as pd
bs = pd.read_excel('birthsmokers.xlsx')
from statsmodels.formula.api import ols
ols('Wgt ~ Gest', bs).fit().summary()
#-2037.0050
# 분석 결과에서 두 번째 표의 Intercept 행, coef 열의 값이 절편입니다.
3. 위의 분석 결과에서 Gest의 기울기는 얼마입니까?
정답: 130.8166 / 해설: 분석 결과에서 두 번째 표의 Gest 행, coef 열의 값이 기울기입니다.
4. 기울기의 p-value는 얼마입니까?
정답: 0.05보다 작다(p<0.5) / 해설: 분석 결과에서 두 번째 표의 Gest 행, P>|t| 열의 값이 p-value입니다.
5. 기울기의 95% 신뢰구간은 얼마입니까?
정답: 104.547, 157.086 / 해설: 분석 결과에서 두 번째 표의 Gest 행, [0.025 0.975] 열의 값이 95% 신뢰구간입니다.
6. 위의 p-value 또는 신뢰구간으로 볼 때 Gest의 기울기에 대해 어떤 결론을 내릴 수 있습니까(유의수준 5%)?
정답: 모집단에서 Gest의 기울기는 +이다 / 해설: 회귀 분석에서 기울기의 귀무가설은 "기울기 = 0"입니다. 유의수준 5%에서는 p-value가 .05보다 작으면 귀무가설을 기각합니다. 이 경우 모집단의 기울기는 + 또는 -라고 할 수 있습니다. 표본에서 기울기가 +이므로 이때는 +라고 결론 내릴 수 있습니다. 신뢰구간을 보아도 동일한 결론을 내릴 수 있습니다. 95% 신뢰구간이 + ~ + 범위에 있다면, 모집단에서 상관계수는 +라고 할 수 있습니다.
7. 위의 분석 결과를 종합할 때 임신기간 Gest가 길어질 수록, 신생아의 체중은 어떻게 된다고 볼 수 있습니까?
정답: 늘어난다 / 해설: 기울기가 +이면, 독립변수가 증가할 때 종속변수도 증가합니다.
파일을 다운받아 문제를 풀 수 있습니다
'콤퓨타 공부 > 통계' 카테고리의 다른 글
[통계 공부] 상호작용(interaction) (0) | 2021.09.08 |
---|---|
[통계 공부] 회귀분석을 통한 예측 (0) | 2021.08.23 |
[통계 공부] 상관분석: 피부암과 위도의 상관관계 (0) | 2021.08.23 |
[통계 공부] 분산 분석: 우울증의 치료효과 (0) | 2021.08.23 |
[통계 공부] 두 집단의 평균 비교: 흡연과 신생아 체중 (0) | 2021.08.23 |