-
Notifications
You must be signed in to change notification settings - Fork 0
06. '종속 변수 : 트랙 사용 수' 회귀 분석
HoeJeongJang edited this page Nov 28, 2022
·
3 revisions
-
유저가 선호하는 트랙을 출시하기 위해서는 어떤 특성을 고려해야할까요?
-
트랙 사용 수에 영향을 미치는 변수들을 알아보기 위해 트랙 사용 수를 종속변수로 두고 회귀분석을 진행했습니다.
- 유의수준 0.05하에서 OLS 다중 회귀 분석 진행
- 종속변수와 상관관계가 높은 변수들을 위주로 먼저 회귀모형 적합 후, 변수를 추가하며 모형을 확인함
- 다중공선성 고려함, vif(분산팽창계수)방식을 사용하여 팽창계수가 10보다 큰 것은 제외.
- 각 지표마다 왜도를 확인하여 -2 미만 혹은 2 이상인 지표는 log를 취해 데이터간 편차를 줄이고 정규성을 높임 (
※평균 주행시간은 왜도가 -2 미만 혹은 2 이상이어서 log를 취해줬습니다
.)
- 총 3개의 변수를 포함하는 30.9% 설명력의 회귀식을 발견하였습니다. 설문조사를 통해 알게 된 유저들의 관심 지표보다, 트랙 사용 수는 평균 주행시간이 짧은 (빠르게 끝낼 수 있는) 트랙이나 자연 테마, 난이도가 유의하다는 결과를 얻었습니다.
- 특히 그 중에서 'log 평균 주행 시간'은 단일 회귀만으로 21%의 설명력을 보이며 트랙 사용수에 큰 영향을 주는 요소였습니다. 사용이 많이 되는 트랙을 만들려면, 평균 주행시간을 낮춰야하는 것을 알 수 있는 결과입니다.