[설명]
해외에서 급성장 하고있는 K드라마.
오징어게임의 흥행 이후 OTT 플랫폼을 바탕으로 K드라마는 급속도로 성장 중이며 올해 4월에는 넷플릭스는 한국에 향후 4년간 25억 달러를 투자하겠다고 발표했다.
급속도로 성장하는 K드라마의 특징 등을 다방면적으로 분석한다.
[주의사항]
MyDramaList는 국제 사이트 중 한국 드라마의 정보를 가장 많이 담고 있는 사이트이지만 동아시아, 동남아시아 문화권의 커뮤니티임을 유의해야한다.
[목표]
K드라마에 대해 전반적으로 분석하여 어떤 특징의 드라마가 흥행하는지 알아본다. 가능하면 추천 시스템 제작까지 진행.
[수집정보]
ID, 영문명, 한글명, 출시년도, 디렉터, 작가, 제작국가, 영상타입, 에피소드수, 플레이타임(초), 방영시작일, 방영종료일, 방영요일, 중계플랫폼, 제한연령, 시놉시스, 순위, 인기순위, 장르, 시청자수, 평점, 기여자수
총 22종
[분석방식]
- 수집한 정보를 토대로 Feature별 인기도, 빈도수 분석.
- Feature별 상관관계 분석.
[결과물]
ㅁㄴㅇㄹ
[결론]
- 동아시아, 동남아시아에서 한국 드라마의 인기에 큰 영향을 준 요소는 다음과 같다.
- 작가와 감독은 작품 인기에 긍정적 영향을 준다
- 액션, 판타지 장르는 전반적으로 많은 인기를 끌었다.
- 로맨스 장르는 꾸준히 인기를 끌어 흥행의 보증수표 같은 장르이다.
- 스토리성을 좋게 평가 받은 작품은 많은 인기를 끌었다.
- 방영요일은 인기에 영향을 주지 않는 요소이다.
- 청춘 드라마는 대체로 부진하며 흥행에 부정적인 영향을 준다.
- 빨간색 박스는 고정적으로 있는 정보
- 파란 박스는 유동적으로 존재하는 정보
[주요 라이브러리]
Python 3.10.12
Pandas 2.0.3
Matplotlib 3.7.2
Seaborn 0.12.2
BeautifulSoup 4.12.2
PyQt5 5.15.9
NLTK 3.7
scikit-learn 1.2.1
WordCloud 1.9.2
[부가 라이브러리]
missingno
koreanize_matplotlib
user-agent
tqdm
mysql
- Datas from MyDramaList and Kaggle
MyDramaList
korean-drama-2015-23-actor-and-review(Kaggle)
kdrama_2015_2023_ChoHongKi.ipynb
- 조홍기
각자 데이터를 분석한 코드
kdrama_2015_2023_SeoYoungMoon.ipynb
- 문서영
각자 데이터를 분석한 코드
kdrama_2015_2023_HanSeungJun.ipynb
- 한승준
각자 데이터를 분석한 코드
mydramalist_crawling.ipynb
- 조홍기
MyDramaList 사이트에서 크롤링 하여 excel로 저장하는 코드
kdrama_preprocessing.ipynb
- 조홍기
mydramalist_crawling.ipynb
파일로 크롤링한 데이터를 전처리하는 코드
upload_to_aws.ipynb
- 조홍기
kdrama_preprocessing.ipynb
파일로 전처리까지 완료한 excel 파일을 aws에 업로드하는 코드
create_table_kdrama.sql
- 문서영
데이터 업로드 할 MySQL 테이블 제작 쿼리
kinolights_crawling_pyqt.ipynb
- 한승준
Kinolights 의 한국 드라마 랭킹을 크롤링 하여 GUI로 보여주는 코드
recommender_systems.ipynb
- 한승준
드라마, 영화 추천 GUI 시스템 (with TF-IDF, Vader)
각자의 노력이 담겨있는 코드, 데이터들의 무덤
한국드라마분석_7조(칠면조).pptx
2023.09.14에 발표한 PPT