-
Notifications
You must be signed in to change notification settings - Fork 0
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
如何提升版面分析模型精度 #10
Comments
Issue Response
根据提供的信息,针对版面分析模型精度提升的问题,可以尝试以下方法:
另外,可以参考PP-OCRv3这一开源超轻量OCR系统进行车牌识别系统的开发。该模型在CCPD数据集上达到了99%的检测精度和94%的识别精度,模型大小为12.8M。通过量化训练可以进一步压缩模型大小到5.8M,并提升推理速度。 对于识别模型中多预测一个特殊字符的问题,可以尝试去掉这个特殊字符,可以显著提高精度。 此外,还可以参考可视化效果,通用模型更倾向于检测一整行文字,而轻量级模型可能会将一行文字分成两段进行检测,因此并不是数量越多效果就越好。 另外,尽量保证类别均衡,如果某些类别样本较少,可以通过补充合成数据的方式处理。实验证明,训练集中出现频次较少的字符会导致识别效果较差,增加迭代次数不能解决样本量少的问题。 如果测试图像为中文,可以下载中文CDLA数据集的预训练模型,用于识别10种类型的文档区域:表格、图像、图像标题、表格标题、页眉、页脚、参考文献、公式。可以在版面分析模型中下载模型的训练和推理模型。 Related Sources
How to use
|
如果测试的模型中英文都有 cdla训练数据加入英文标注会改善吗? |
我训练测试效果还可以,想对比直接提供的cdla预训练模型效果,没跑通W0222 11:42:21.103763 1932985 gpu_resources.cc:119] Please NOTE: device: 0, GPU Compute Capability: 8.6, Driver API Version: 12.0, Runtime API Version: 11.8 |
在CDLA数据集上进行训练测试,效果不是很理想,有人能帮解决一下吗
我们提供了AceIssueSolver来帮助你解答问题,你是否想要它来解答(请填写yes/no)?/We provide AceIssueSolver to solve issues, do you want it? (Please write yes/no): yes
请尽量不要包含图片在问题中/Please try to not include the image in the issue.
The text was updated successfully, but these errors were encountered: