studying data

문제의 본질을 꿰뚫어 해결책을 찾는 법을 공부합니다

콤퓨타 공부/통계

[통계 공부] 회귀분석: 임신기간과 신생아 체중

study_data 2021. 8. 23. 14:08

1. Wgt는 신생아의 체중(g), Gest는 임신 기간(주)을 나타냅니다. 임신기간을 독립변수, 신생아의 체중을 종속변수로 회귀분석을 하려면 관계식을 어떻게 써야 합니까?

정답: Wgt ~ Gest / 설명: 관계식은 '종속변수 ~ 독립변수'와 같이 씁니다. 종속변수는 독립변수에 따라 달라지는 변수를 말합니다.

 

2. 임신기간을 독립변수, 신생아의 체중을 종속변수로 회귀분석을 실시해보세요. 절편은 얼마입니까? 아래 표는 이하 질문들의 답변도 되기 때문에 색깔별로 표기해뒀습니다.

import pandas as pd
bs = pd.read_excel('birthsmokers.xlsx')

from statsmodels.formula.api import ols
ols('Wgt ~ Gest', bs).fit().summary()

#-2037.0050
# 분석 결과에서 두 번째 표의 Intercept 행, coef 열의 값이 절편입니다.

 

3. 위의 분석 결과에서 Gest의 기울기는 얼마입니까?

정답: 130.8166 / 해설: 분석 결과에서 두 번째 표의 Gest 행, coef 열의 값이 기울기입니다.

 

4. 기울기의 p-value는 얼마입니까?

정답: 0.05보다 작다(p<0.5) / 해설: 분석 결과에서 두 번째 표의 Gest 행, P>|t| 열의 값이 p-value입니다.

 

5. 기울기의 95% 신뢰구간은 얼마입니까?

정답: 104.547, 157.086 / 해설: 분석 결과에서 두 번째 표의 Gest 행, [0.025 0.975] 열의 값이 95% 신뢰구간입니다.

 

6. 위의 p-value 또는 신뢰구간으로 볼 때 Gest의 기울기에 대해 어떤 결론을 내릴 수 있습니까(유의수준 5%)?

정답: 모집단에서 Gest의 기울기는 +이다 / 해설: 회귀 분석에서 기울기의 귀무가설은 "기울기 = 0"입니다. 유의수준 5%에서는 p-value가 .05보다 작으면 귀무가설을 기각합니다. 이 경우 모집단의 기울기는 + 또는 -라고 할 수 있습니다. 표본에서 기울기가 +이므로 이때는 +라고 결론 내릴 수 있습니다. 신뢰구간을 보아도 동일한 결론을 내릴 수 있습니다. 95% 신뢰구간이 + ~ + 범위에 있다면, 모집단에서 상관계수는 +라고 할 수 있습니다.

 

7. 위의 분석 결과를 종합할 때 임신기간 Gest가 길어질 수록, 신생아의 체중은 어떻게 된다고 볼 수 있습니까?

정답: 늘어난다 / 해설: 기울기가 +이면, 독립변수가 증가할 때 종속변수도 증가합니다.

birthsmokers.xlsx
0.01MB

파일을 다운받아 문제를 풀 수 있습니다