Skip to content

wlsisl/23BDA_CJ_contest

Repository files navigation

23BDA_CJ_contest

대기업 cj 더마켓 사이트 이용자 로그 데이터를 활용하여, the 프라임 회원 예측 및 마케팅 방안 공모전

🪜Introduction

성공적인 유료 멤버십을 통해 수익을 극대화하기 위해서는, 기존 멤버십 가입자들의 유지뿐만 아니라 새로운 멤버십 가입자를 확보해야 한다. 멤버십 가입자가 될 잠재력을 지닌 고객을 예측하기 위해서는 일반 회원들과 차별화되는 멤버십 회원들의 특징에 대한 심도 있는 분석이 필요하다. 본 팀에서는 멤버십 회원과 일반 회원을 구분 짓는 데 가용한 변수를 최대한으로 고려하고자 노력하였다. 또한 본 팀에서 제안하는 파생 변수들은 새로운 프라임 멤버십 회원 확보에 효과적으로 사용될 수 있다. 타당한 근거를 바탕으로 변수를 생성하고자 노력하였기 때문에, 기존 멤버십 회원을 예측하는 것뿐만 아니라 새로운 멤버십 회원을 유치하는 데 큰 도움이 될 것이다.


💾 Dataset

제공 받은 이용자 로그 데이터: 주문 상품, 주문날짜, 주문 수량, 주문 금액, 연령대, 임직원 여부, 프라임 회원 여부(타겟칼럼)


📑Project Summary

파생 변수

  1. non_main_yn(비주력 상품 여부) -> product_name(상품명)에서 파생된 변수. 비주력 상품의 구매 여부는 프라임 회원의 구매 행태를 반영한다고 판단하여 생성한 변수

  2. net_order_type(동시 주문 상품 개수) -> 동일한 주문번호 기준, 구매한 상품의 가짓수를 나타내는 변수. 프라임/일반 회원 간 동시 주문 상품 개수가 다르게 나타나겠다고 판단하여 생성한 변수

3.event_yn(설날 및 cj더마켓 내 이벤트 기간 내 주문) -> 상품 구매 시기가 이벤트 기간 내 포함되어 있는지를 나타내는 변수. 프라임/ 일반 회원 간 이벤트의 영향이 다르게 나타나겠다고 판단하여 생성한 변수 <선택되지 않은 변수>

4.product_name(상품명) -> 상품명을 그대로 반영하는 것은 의미 없다고 판단하여 non_main(비주력 상품 여부) 변수를 생성한 뒤, 최종 모델링에서는 제외

5.net_order_qty(주문 수량) -> 변수에서 수량 관련 '입', '개', '묶음', 'box'추출 후 제거하고, 숫자만 저장하여 갯수 칼럼 따로 생

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published