VV

张维为语录查询项目，纯查询无需下载本项目，直接在网页端即可完成查询。

Caution

本项目仅供娱乐，请合理使用。

致谢

感谢wen999di及其提交的PR，大幅提高了人脸检测准确率和字幕识别准确率。感谢undef-i及其提交的PR，大幅提高了字幕检索速度，并且添加了GPU支持，大幅减少了新版本的人脸识别和字幕识别所需的时间。

项目简介

你还在为自己存放的VV表情包不够多，使用时觉得不够贴切而感到烦恼吗？快来试试这个项目吧！

本项目主要用于识别vv出现的视频片段（主要针对《这就是中国》节目，后续可能会增加其他视频源）及对应的字幕，并输出为json文件。

Web网页端使用说明

访问vv.cicada000.work即可直接使用网页端的台词搜索功能，搜索具有一定的模糊匹配能力。在搜索框内搜索关键词即可匹配含有该关键词的台词。展开高级选项可调整文本匹配度（0-100，默认50）、人脸相似度（0-1，默认0.5）以及是否添加口吧水印。

Python脚本使用说明

文件基本说明

requirements.txt：项目包依赖，在使用本项目之前请先下载，否则可能导致项目无法正常运行。

generate_features.py：用于生成人脸特征数据的脚本，如果没有自己的数据集可以不用，本项目已经附带了人脸数据集，即face_features.npz。如果需要用自己的数据集训练在同级目录新建target文件夹进行训练即可。

generate_features_insightface.py：用于生成人脸特征数据的脚本，如果没有自己的数据集可以不用，本项目已经附带了人脸数据集，即face_features_insightface.npz。如果需要用自己的数据集训练在同级目录新建target文件夹进行训练即可。

target文件夹，将人脸照片放入即可生成数据集文件，为了方便起见，GitHub仓库中的target文件夹可在Release中找到，解压放入项目中即可进行人脸识别的训练，正常运行识别项目可以不需要这个文件夹。

subtitle：文件夹，本项目运行的人脸识别+字幕提取的json文件可以在文件夹中找到。

face_features.npz：本项目附带的人脸数据集，可直接使用，针对FaceRec.py。

face_features_indightface.npz：本项目附带的人脸数据集，可直接使用，针对FaceRec_insightface.py。

FaceRec.py：人脸识别脚本，使用dlib的方案。

FaceRec_insightface.py：使用了insightface的人脸识别方案，相比于FaceRec.py准确率更高。

CutSubtitle.py：针对《这就是中国》节目视频的字幕裁剪识别脚本，使用ddddocr。

CutSubtitle_paddleocr.py：字幕裁剪识别脚本，使用PaddleOCR。

main.py：主函数，程序入口。

api：文件夹，网页API后端代码，API具体用法见下。

Web：文件夹，网页前端代码。

运行本项目的说明

Tip

如果要使用GPU进行训练，推荐使用Linux环境~~因为我Windows配半天没配好~~。笔者环境为WSL2 Ubuntu24.04 + CUDA12.8 + libcudnn9

正常使用CPU运行直接下载依赖运行即可（应该）。

如需使用GPU运行（这玩意拿纯CPU运行慢的要死），在下载相关pip库时需下载GPU版本。例如pip install paddlepaddle需改为pip install paddlepaddle-gpu，使用高版本的CUDA时，则需要下载更高版本的库，可在官网找到下载命令。

API使用说明

API具体请求示例如下：

https://vv.cicada000.work/search?query=测试&min_ratio=50&min_similarity=0.5&max_results=10

参数解释：

query：请求查询的关键词。

min_ratio：关键词在句子中的最小匹配度。（这一部分算法还待优化）

min_similarity：最小的人脸识别匹配度，一般认为0.5以上为VV。

max_results：返回的结果最多的个数，如果不添加默认返回全部匹配的结果。

To-Do List

提高人脸识别精度
改进搜索算法
添加视频源
网页端错误上报功能（真的需要吗）

主要使用的开源项目

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

VV

致谢

项目简介

Web网页端使用说明

Python脚本使用说明

文件基本说明

运行本项目的说明

API使用说明

To-Do List

主要使用的开源项目

About

Releases 3

Packages

Contributors 3

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 51 Commits
DataProcess		DataProcess
Web		Web
api		api
search		search
subtitle		subtitle
.gitignore		.gitignore
CutSubtitle.py		CutSubtitle.py
CutSubtitle_paddleocr.py		CutSubtitle_paddleocr.py
FaceRec.py		FaceRec.py
FaceRec_insightface.py		FaceRec_insightface.py
LICENSE		LICENSE
README.md		README.md
VV.GIF		VV.GIF
VV_meme_template.png		VV_meme_template.png
face_features.npz		face_features.npz
face_features_insightface.npz		face_features_insightface.npz
generate_features.py		generate_features.py
generate_features_insightface.py		generate_features_insightface.py
main.py		main.py
params.py		params.py
requirements.txt		requirements.txt
search_result.png		search_result.png
vercel.json		vercel.json
web_index.png		web_index.png

License

Cicada000/VV

Folders and files

Latest commit

History

Repository files navigation

VV

致谢

项目简介

Web网页端使用说明

Python脚本使用说明

文件基本说明

运行本项目的说明

API使用说明

To-Do List

主要使用的开源项目

About

Resources

License

Stars

Watchers

Forks

Releases 3

Packages 0

Contributors 3

Languages

Packages