거짓말대회 데이터를 다운받아 회귀분석을 해보세요. 대회 순위(Position)를 종속변수로 하고 창의성(Creativity)과 초보 여부(Novice)를 독립변수로 하여 회귀분석을 해보세요. 이때 상호작용항을 포함시켜 분석하십시오.
1. 상호작용을 고려했을 때 경험자(Novice == 0)는 창의성의 기울기가 얼마입니까?
정답: -0.0349
해설: Position = 3.5618 - 0.0349*Creativity + 1.4920*Novice - 0.0366*Creativity*Novice
Novice에 0을 대입하는 경우(경험자), Position = 3.5618 - 0.0349*Creativity
따라서 기울기는 -0.0349
import pandas as pd
df = pd.read_excel('liar.xlsx')
from statsmodels.formula.api import ols
ols('Position ~ Creativity * Novice==0', df).fit().summary()
# Position ~ Creativity + Novice + Creativity:Novice
# 축약해서 표현하면 Position ~ Creativity * Novice
2. 상호작용을 고려했을 때 초보자(Novice == 1)는 창의성의 기울기가 얼마입니까?
정답: -0.0715
해설: Novice가 1인 경우(초보자)
Position = (3.5618+1.4920) -0.0715*Creativity
ols('Position ~ Creativity * Novice == 1', df).fit().summary()
#Novice에 1을 대입하기
3. 상호작용의 신뢰구간(또는 p-value)를 참고할 때 경험자와 초보자 중 누가 창의성에 따라 대회 순위가 많이 변합니까(유의수준 5%)?
정답: 어느 쪽으로 결론 내릴 수 없다
해설: 두 집단의 기울기 차이는 유의수준 5%에서 통계적으로 유의한지 살펴보기
'콤퓨타 공부 > 통계' 카테고리의 다른 글
[통계 공부] 비지도 학습(unsupervised learning) (0) | 2021.09.08 |
---|---|
[통계 공부] 로지스틱 회귀분석과 상호작용 (0) | 2021.09.08 |
[통계 공부] 상호작용(interaction) (0) | 2021.09.08 |
[통계 공부] 회귀분석을 통한 예측 (0) | 2021.08.23 |
[통계 공부] 회귀분석: 임신기간과 신생아 체중 (0) | 2021.08.23 |