studying data

문제의 본질을 꿰뚫어 해결책을 찾는 법을 공부합니다

콤퓨타 공부/통계

[통계 공부] 상호작용 - 거짓말 대회

study_data 2021. 9. 8. 10:50

거짓말대회 데이터를 다운받아 회귀분석을 해보세요. 대회 순위(Position)를 종속변수로 하고 창의성(Creativity)과 초보 여부(Novice)를 독립변수로 하여 회귀분석을 해보세요. 이때 상호작용항을 포함시켜 분석하십시오.

liar.xlsx
0.01MB

 

1. 상호작용을 고려했을 때 경험자(Novice == 0)는 창의성의 기울기가 얼마입니까?

정답: -0.0349
해설: Position = 3.5618 - 0.0349*Creativity + 1.4920*Novice - 0.0366*Creativity*Novice
       Novice에 0을 대입하는 경우(경험자), Position = 3.5618 - 0.0349*Creativity
       따라서 기울기는 -0.0349
import pandas as pd
df = pd.read_excel('liar.xlsx')

from statsmodels.formula.api import ols
ols('Position ~ Creativity * Novice==0', df).fit().summary()

# Position ~ Creativity + Novice + Creativity:Novice
# 축약해서 표현하면 Position ~ Creativity * Novice

2. 상호작용을 고려했을 때 초보자(Novice == 1)는 창의성의 기울기가 얼마입니까?

정답: -0.0715
해설: Novice가 1인 경우(초보자)
        Position = (3.5618+1.4920) -0.0715*Creativity
ols('Position ~ Creativity * Novice == 1', df).fit().summary()

#Novice에 1을 대입하기

3. 상호작용의 신뢰구간(또는 p-value)를 참고할 때 경험자와 초보자 중 누가 창의성에 따라 대회 순위가 많이 변합니까(유의수준 5%)?

정답: 어느 쪽으로 결론 내릴 수 없다
해설: 두 집단의 기울기 차이는 유의수준 5%에서 통계적으로 유의한지 살펴보기