Skip to content

FeOAr/Gesture-recognition-and-control

Repository files navigation

基于YOLOv5的手势识别控制程序

1.运行环境

1.1 包环境

名称 版本 名称 版本
absl-py 1.0.0 altgraph 0.17.2
auto-py-to-exe 2.19.0 automium 0.2.6
beautifulsoup4 4.11.1 PyGetWindow 0.0.9
bottle 0.12.19 pyinstaller 4.10
bottle-websocket 0.2.9 pyinstaller-hooks-contrib 2022.0
bs4 0.0.1 PyMsgBox 1.0.9
cachetools 4.2.4 pyparsing 3.0.4
certifi 2021.5.30 pyperclip 1.8.2
cffi 1.15.0 pypiwin32 223
charset-normalizer 2.0.12 PyQt5 5.15.4
click 7.1.2 pyqt5-plugins 5.15.4.2.2
colorama 0.4.4 PyQt5-Qt5 5.15.2
cors 1.0.1 PyQt5-sip 12.9.1
cycler 0.11.0 pyqt5-tools 5.15.4.3.2
Cython 0.29.28 PyRect 0.2.0
dataclasses 0.8 PyScreeze 0.1.28
dlib 19.8.1 PySide2 5.15.2.1
Eel 0.12.4 PySocks 1.7.1
filelock 3.4.1 python-dateutil 2.8.2
Flask 2.0.3 python-dotenv 0.20.0
Flask-Cors 3.0.10 pytweening 1.0.4
future 0.18.2 pytz 2021.3
gevent 21.12.0 PyUserInput 0.1.10
gevent-websocket 0.10.1 pywin32 303
google-auth 2.6.2 pywin32-ctypes 0.2.0
google-auth-oauthlib 0.4.6 PyYAML 5.2
greenlet 1.1.2 qt5-applications 5.15.2.2.2
grpcio 1.45.0 qt5-tools 5.15.2.1.2
idna 3.3 requests 2.27.1
importlib-metadata 4.8.3 requests-file 1.5.1
imutils 0.5.4 requests-oauthlib 1.3.1
itsdangerous 2.0.1 rsa 4.8
Jinja2 3.0.3 scipy 1.5.2
kiwisolver 1.3.1 seaborn 0.7.1
legacy 0.1.6 setuptools 58.0.4
Markdown 3.3.6 shiboken2 5.15.2.1
MarkupSafe 2.0.1 six 1.16.0
matplotlib 3.3.4 soupsieve 2.3.2.post1
mkl-fft 1.3.0 tensorboard 2.8.0
mkl-random 1.1.1 tensorboard-data-server 0.6.1
mkl-service 2.3.0 tensorboard-plugin-wit 1.8.1
MouseInfo 0.1.3 tldextract 3.1.2
numpy 1.19.2 torch 1.10.2
oauthlib 3.2.0 torchaudio 0.10.2
olefile 0.46 torchvision 0.11.3
onnx 1.11.0 tornado 6.1
pandas 0.20.3 tqdm 4.63.0
pefile 2021.9.3 typing_extensions 4.1.1
Pillow 8.3.1 urllib3 1.26.9
pip 21.2.2 utils 1.0.1
place 0.5.5 Werkzeug 2.0.3
protobuf 3.19.4 wheel 0.37.1
pyasn1 0.4.8 whichcraft 0.6.1
pyasn1-modules 0.2.8 wincertstore 0.2
PyAutoGUI 0.9.53 zipp 3.6.0
pycocotools-windows 2.0 zope.event 4.5.0
pycparser 2.21 zope.interface 5.4.0

1.2 开发及训练环境

操作系统 Windows 11 22H2
CPU Intel(R) Core(TM) i7-8750H CPU @ 2.20GHz
RAM 16.0GB
GPU NVIDIA GTX 1050 Ti
VRAM 4.0GB
CUDA 11.3.1
Python版本 3.6.13
附加库 OpenCV 3.4.2,PyQt5-5.15.4,numpy1.19.2
深度学习库 Pytorch 1.10.2
操作系统 Ubuntu 20.04.4
CPU Intel® Xeon(R) Gold 6330 CPU @ 2.00GHz
RAM 16.0GB
GPU NVIDIA RTX3090
VRAM 24.0GB
CUDA 11.3
Python版本 3.8.10
附加库 OpenCV 4.5.5,numpy1.21.4
深度学习库 Pytorch 1.10.0

2.使用方法

项目导入pycharm,创建conda环境,使用pip装缺少的包。主程序是./yolov5-master/UI/mainUI.py。

3.关于自采数据集

本自采数据集含有过多肖像等私人信息,不便于分享,十分抱歉

4.网络整体结构

YOLOv5+CBAM

备注:common.py中添加了三种模块注意力机制,可以根据需求在yolov5m_CBAM.yaml中修改。

5.一个较好的打标签办法

标注流程

6. 一些补充

6.0 经有网友的实际测试,这个模型由于数据集采集的缺陷,鲁棒性可能会奇差,可能需要自行训练。

6.1 本程序的“开启控制”按钮只能点击一次,开启一次控制线程,属于程序不完善。结束控制请点击“关闭摄像头”或结束程序。

6.2 mAP文件夹

该文件夹内容源自CSDN,暂时忘了出处

6.3修改网络成功后应该出现的模型信息

./yolov5-master/runs/detect/model.pdf

6.4 已训练模型

./yolov5-master/UI/weights

6.5 B站视频

B站视频

6.6 主程序结构与流程

程序泳道图



程序结构图

6.7 其他

注意在pycharm中配置模型路径

About

Based on YOLOv5-v6.0 and self-made dataset

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published