HnG_highway_yolov8_repo

고속도로 CCTV 영상 데이터를 활용한 차량 인식 프로젝트

🚗🚌🚛 Demo

🤗 Best model validation result

How to run

!git clone https://github.com/sesac-google-ai-1st/HnG_highway_yolov8_repo.git
%cd HnG_highway_yolov8_repo
!pip install -r requirements.txt

# models dir 하위 모든 모델로 변경 가능
model_path = "./models/train_back_x100/weights/best.pt"
# test를 원하는 이미지/동영상 경로
test_src_path = "test_image.png"

!yolo task=detect mode=predict model={model_path} conf=0.25 source={test_src_path}

📃 Contents

1. 프로젝트 소개

목표
수행 기간 및 팀원
repo structure
모델 학습 환경
Project Workflow

2. 데이터

EDA 요약

3. 실험

baseline
실험 1 : model size & epoch up
실험 2 : class imbalance
실험 3 : add background data

4. 결과

5. 프로젝트 회고

어려웠던 점
배운 점

1. 프로젝트 소개

목표

"고속도로 CCTV 교통 영상" 데이터를 활용하여 YOLOv8로 Vehicle Object detection
- COCO dataset으로 pretrained 된 YOLOv8 모델을
  AI Hub "고속도로 CCTV 교통 영상" 데이터셋으로 fine tuning
객체 검출 정확도 평가 metric : mAP50-95
- IoU (Intersection over Union = $\frac{교집합}{합집합}$) : 정답과 예측값의 바운딩 박스가 얼마나 겹치는가를 0 ~ 1 사이의 값으로 나타낸 것
- Precision (= $\frac{TP}{TP+FP}$) : 검출된 결과들 중 옳게 검출한 비율
- Recall (= $\frac{TP}{TP+FN}$) : 검출해야하는 결과를 얼마나 검출했는지의 비율
- Precision-Recall Curve : confidence level에 따른 Precision과 Recall값의 변화 곡선
  - IoU에 따라 TP와 FP를 결정
  - confidence level에 따라 검출된 바운딩 박스의 유효 개수가 변함
- AP : Precision-Recall Curve 의 선 아래 쪽의 면적
  - 높을 수록 그 알고리즘의 성능이 전체적으로 우수하다는 의미
- mAP : 객체 종류별(car, bus, truck) AP의 평균값
- mAP50-95 : IoU 0.5부터 0.95까지 0.05 간격으로 mAP값을 구해서 평균한 값

수행 기간 및 팀원

🗓️ 수행 기간 : 2023.11.20 ~ 24 (5일)
🤲 팀원 (2명)

박영현 최지민

Github Github

repo structure

├── README.md
├── requirements.txt
├── test_image.png
├── code
│  ├─ EDA
│  │   ├─ highway_EDA.ipynb
│  │   ├─ highway_train.csv
│  │   └─ highway_valid.csv
│  ├─ data_handling
│  │   ├─ draw_bounding_box.py
│  │   ├─ highway_dataset_preprocess.ipynb
│  │   ├─ highway_images_folder_merge.ipynb
│  │   └─ highway_labels_xml2txt.ipynb
│  └─ train.ipynb    # YOLOv8 모델 학습
└── models    # 각 모델 폴더 하위 weights 폴더에 pt 파일 있음 
   ├─ train_aug_m71
   ├─ train_back_m100
   ├─ train_back_x100   # best model
   ├─ train_de_m100
   ├─ train_m100
   ├─ train_m400
   ├─ train_n25   # baseline
   └─ val_back_x100

모델 학습 환경

ultralytics 버전 : 8.0.20
GCP (Google Cloud Platform)

Project Workflow

2. 데이터

AI Hub 교통문제 해결을 위한 CCTV 교통 영상(고속도로) > 바운딩박스 > 수도권 영동선의 CH01 ~ CH04 사용

데이터 용량

최종 데이터 구조

dataset
├─ train
│ ├─ images
│ └─ labels
├─ validation
│ ├─ images
│ └─ labels
└─ data.yaml

데이터 개수
- train 총 데이터 개수: 23951
- valid 총 데이터 개수: 3333

EDA 요약

image 파일 이름과 label을 통해 추출한 정보
image 데이터의 시간 및 날씨 분포 (train , valid)

시간 날씨
label 분포 : car >>>>> truck > bus

➜ train과 valid의 데이터가 매우 유사한 것을 확인함

3. 실험

0. baseline

name	YOLOv8 model	epoch	batch	imgsz	metric (mAP50-95)
baseline	nano	25	128	640	0.743

실험 1 : model size & epoch up

name	note	YOLOv8 model	epoch	batch	imgsz	metric (mAP50-95)
baseline		nano	25	128	640	0.743
exp1	model & epoch ↑ EarlyStop	medium	58	92¹	800	0.813

1. GPU 4개를 사용하였는데, batch=128 로 설정 시 Out Of Memory 에러 발생. 128보다 작으면서 4의 배수인 92로 설정함.

➜ exp1 실험 결과

모델 사이즈를 nano에서 medium model로 키우고, 학습 epoch를 25에서 58로 늘린 결과,
mAP50-95가 0.743에서 0.813로 0.07만큼 상승했음

실험 2 : class imbalance

데이터를 추가함
- 기존 : validation data로 CH01 ~ CH04만 쓰기 때문에, train data도 CH01 ~ CH04만 사용하였음
- 실험2 : 기존에 train에 사용하지 않은 CH05 ~ CH10의 데이터를 추가
  - 실험1로 mAP50-95가 상승하였기 때문에, 실험1에 기반하여 YOLOv8 model medium으로 함
  - bus와 truck을 위주로 추가하고자 함
  - (bus + truck) 개수가 car의 개수 보다 많은 이미지만 선택 : 3268장
    train_df[train_df['car']<=(train_df['bus']+train_df['truck'])]

name	note	YOLOv8 model	epoch	batch	imgsz	metric (mAP50-95)
baseline		nano	25	128	640	0.743
exp1	model & epoch ↑ EarlyStop	medium	58	92	800	0.813
exp2	class imbalance 시간관계상 Stop	medium	68	64	640	0.806

➜ exp2 실험 결과

기존 train에 사용하지 않은 CH05 ~ CH10의 데이터를 추가한 exp2의 mAP50-95는 0.806로, exp1 보다 0.007만큼 낮음
- validation 이미지는 CH01 ~ CH04의 이미지뿐이라서, 오히려 그 외 채널 이미지를 학습한 것이 평가에 방해됐나?
- exp1 보다 imgsz가 낮아서?
- 더 학습을 하면 성능이 올라갈 수 있었는데, 시간 관계 상 멈춰서?

실험 3 : add background data

background 데이터를 추가함
- 고속도로 CCTV 자료를 제공하는 국가교통정보센터에서 차가 없는 빈 도로 (background) 이미지 150장을 캡쳐함
- 위 사이트에서 캡쳐한 이미지를 augmentation(Resize, Crop, Cropout 등) 하여 599장으로 데이터 증강
- train/images 에 증강한 background 이미지 599장 추가
  background 이미지 추가 방법: ultralytics/yolov5#2844

name	note	YOLOv8 model	epoch	batch	imgsz	metric (mAP50-95)
baseline		nano	25	128	640	0.743
exp1	model & epoch ↑ EarlyStop	medium	58	92	800	0.813
exp2	class imbalance 시간관계상 Stop	medium	68	64	640	0.806
exp3-1	background EarlyStop	medium	40	92	800	0.814

➜ exp3-1 실험 결과

exp3-1은 기존에 가장 높은 성능을 보인 exp1과 동일한 세팅에 background 이미지를 추가한 것
exp1과 exp3-1는 background 이미지 차이뿐인데, 거의 모든 성능 지표에서 exp3-1가 미세하게 높음
- 상승한 지표
  - Precision: all은 0.909에서 0.917로 0.008만큼 상승, car는 0.94에서 0.942로 0.002만큼 상승, bus는 0.893에서 0.909로 0.016만큼 상승, truck은 0.893에서 0.9로 0.007만큼 상승
  - Recall: all은 0.884에서 0.886로 0.002만큼 상승, car는 0.92에서 0.921로 0.001만큼 상승, truck은 0.881에서 0.886로 0.005만큼 상승
  - mAP50: all은 0.943에서 0.947로 0.004만큼 상승, car는 0.973에서 0.974로 0.001만큼 상승, bus는 0.915에서 0.92로 0.005만큼 상승, truck은 0.942에서 0.946로 0.004만큼 상승
  - mAP50-95: all은 0.813에서 0.814로 0.001만큼 상승, bus는 0.785에서 0.786로 0.001만큼 상승, truck은 0.802에서 0.804로 0.002만큼 상승
- 하락한 지표
  - Recall: bus가 0.852에서 0.851로 0.001만큼 하락
  - mAP50-95: car가 0.852에서 0.851로 0.001만큼 하락
background 이미지 추가한 것이 효과 있다는 의미

이전까지 실험한 결과, background 이미지를 추가한 exp3-1가 가장 높은 성능을 보였음
하지만 실험1을 통해 모델 사이즈를 키우면, 성능이 올라간다는 것을 확인했음
exp3-2는 background 이미지를 추가한 exp3-1를 기반으로 하고, 실험1의 결과를 참고하여 모델사이즈를 medium에서 xlarge로 키움

name	note	YOLOv8 model	epoch	batch	imgsz	metric (mAP50-95)
baseline		nano	25	128	640	0.743
exp1	model & epoch ↑ EarlyStop	medium	58	92	800	0.813
exp2	class imbalance 시간관계상 Stop	medium	68	64	640	0.806
exp3-1	background EarlyStop	medium	40	92	800	0.814
exp3-2	background EarlyStop best model	xlarge	47	32	800	✨ 0.823 ✨

➜ exp3-2 실험 결과

background 이미지를 추가한 exp3-1를 기반으로 하고, 모델 사이즈를 키우니,
exp3-1의 mAP50-95는 0.814였는데, exp3-2는 0.823으로 0.09만큼 상승함
각 클래스(car, bus, truck)의 mAP50-95도 0.005~0.015만큼 상승하였음
👏👏👏 best mAP50-95 결과를 얻음 👏👏👏

4. 결과

baseline과 best model의 predict 비교²

baseline	best
CCTV 영상 내 글자("릉","동")를 car로 인식함	그런 현상 없음
멀리서 오는 bus를 초반에 truck으로 인식	멀리서부터 bus로 인식

결론
- best model이 비교적 안정적으로 vehicle을 인식함
- 데이터만 존재한다면 차 종을 인식하는 모델로 사용 가능

한계점
- 객체가 가로등이나 CCTV 내 글자에 가려지면 인식률이 떨어짐³
- 객체를 어느 정도 거리부터 인식할 수 있는지 기준이 정확하지 않음⁴
- 검증 영상의 화질에 따라 정확도에 영향을 미침
- best 모델의 크기가 커서 검증 속도가 느리기 때문에 고속도로 실시간 분석에 어려움이 있음

2. 영상 출처: 국가교통정보센터 영동선 신갈분기점 CCTV
3. 아래 사진에서 노란원을 보면, 가로등에 가린 차가 인식되지 않음.
4. 아래 사진에서 까만박스를 보면, 앞에 있는 car는 인식되지 않고, 그보다 뒤에 있는 truck을 인식한 것을 볼 수 있음.

5. 프로젝트 회고

어려웠던 점

모델 학습을 위해 데이터를 준비하는 과정
- 데이터 용량이 너무 커서 (약 40GB) 데이터 다루는 데에 시간이 오래 걸림
  - AI Hub에서 데이터 다운받는 것
  - 압축한 zip 파일을 GCP cloud storage(bucket)에 업로드하는 것
  - bucket에서 zip 파일을 가져와서 압축 푸는 것
    ⇒ 각각 n시간 소요됨
- 이후에 빠른 방법을 찾아냄
  - AI Hub에서 데이터 다운 ➝ Workbench 터미널에서 바로 AI Hub API 사용
  - bucket에서 zip 파일 압축 푸는 것 ➝ multiprocessing을 통해 n초로 단축
Multi-GPU 사용
- 학습 시, 한개의 GPU를 쓸 땐 문제가 없었는데 device=[0,1]을 설정하면 계속 에러 발생함
- Troubleshooting
  - pip install ultralytics 시, 에러메세지 : FileNotFoundError
  - git clone https://github.com/ultralytics/ultralytics 시, 에러메세지 : CalledProcessError
    ⇒ pip와 git clone을 둘 다 하니까 Multi-GPU 사용 가능했음
  - 프로젝트 수행 당시 ultralytics 버전(8.0.20)의 문제로 추측함

배운 점

GCP cloud storage(bucket)를 통해 대용량 데이터를 다루는 경험을 함
YOLO를 학습시키기 위한 custom dataset 구조를 알게 됨
모델 성능 올리기가 쉽지 않았음
- 여러 조건에서 실험을 진행했음에도 점수가 0.83 이상으로 높게 올라가지 않음
- 시간이 충분했다면, 데이터를 더 적극적으로 수정/보완했을 것

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

HnG_highway_yolov8_repo

🚗🚌🚛 Demo

🤗 Best model validation result

How to run

📃 Contents

1. 프로젝트 소개

목표

수행 기간 및 팀원

repo structure

모델 학습 환경

Project Workflow

2. 데이터

AI Hub 교통문제 해결을 위한 CCTV 교통 영상(고속도로) > 바운딩박스 > 수도권 영동선의 CH01 ~ CH04 사용

EDA 요약

3. 실험

0. baseline

실험 1 : model size & epoch up

➜ exp1 실험 결과

실험 2 : class imbalance

➜ exp2 실험 결과

실험 3 : add background data

➜ exp3-1 실험 결과

➜ exp3-2 실험 결과

4. 결과

baseline과 best model의 predict 비교²

5. 프로젝트 회고

어려웠던 점

배운 점

About

Releases

Packages

Contributors 2

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 52 Commits
code		code
models		models
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt
test_image.png		test_image.png

박영현	최지민

Github	Github

sesac-google-ai-1st/HnG_highway_yolov8_repo

Folders and files

Latest commit

History

Repository files navigation

HnG_highway_yolov8_repo

🚗🚌🚛 Demo

🤗 Best model validation result

How to run

📃 Contents

1. 프로젝트 소개

목표

수행 기간 및 팀원

repo structure

모델 학습 환경

Project Workflow

2. 데이터

AI Hub 교통문제 해결을 위한 CCTV 교통 영상(고속도로) > 바운딩박스 > 수도권 영동선의 CH01 ~ CH04 사용

EDA 요약

3. 실험

0. baseline

실험 1 : model size & epoch up

➜ exp1 실험 결과

실험 2 : class imbalance

➜ exp2 실험 결과

실험 3 : add background data

➜ exp3-1 실험 결과

➜ exp3-2 실험 결과

4. 결과

baseline과 best model의 predict 비교2

5. 프로젝트 회고

어려웠던 점

배운 점

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

baseline과 best model의 predict 비교²

Packages