无法识别图片型PDF #1319

hanmostudy · 2024-12-18T06:41:15Z

我发现目前的模型识别普通PDF还是不错的，但是如果我把PDF转换为图片型PDF，就一点都识别不出来了

myhloli · 2024-12-18T06:43:14Z

图片型的pdf方便上传一下吗

hanmostudy · 2024-12-19T01:48:41Z

myhloli · 2024-12-19T01:52:38Z

我试了是正常的，可以在huggingface和modelscope的demo上自测一下

hanmostudy · 2024-12-19T06:37:41Z

好的，那我再去试一试，谢谢

josenhadoop · 2024-12-26T06:55:59Z

这个纯图片的pdf，在huggingface和modelscope的在线demo试了都正常，但是本地部署并跑完之后，没有报错，但输出的文件里面没有生成内容

josenhadoop · 2024-12-26T06:59:16Z

跑完之后，输出文件夹是空的

myhloli · 2024-12-26T07:10:44Z

cpu跑paddleocr有内存泄漏的情况，请关注一下运行时的内存占用，如果在解析中途因为内存占用满了导致进程被杀的话是没有结果的

hanmostudy added the enhancement New feature or request label Dec 18, 2024

myhloli closed this as completed Dec 26, 2024

Provide feedback