- 你需要本地有一个anaconda
- 在anaconda里创建一个nougat的虚拟环境,python用3.9
- 去pytorch官网抄一个stable、windows、和你电脑CUDA相同的(命令:nvidia-smi)、pip安装方式的1.13版本的、支持GPU的pytorch(1.13版本在网页中的previous version链接里)
- 在nougat虚拟环境中把pytorch命令敲进去(不先装CUDA版本的pytorch到时候会报warning:no GPU,using cpu will be slow)
- 按照facebook的github链接里面第二个pip install的方式安装nougat
- 去Release中下载模型并放在checkpoint文件夹中
命令示例:
$ nougat ./input/xxx.pdf -o ./output --batchsize 3 --checkpoint ./checkpoint --recompute
usage: nougat [-h] [--batchsize BATCHSIZE] [--checkpoint CHECKPOINT] [--model MODEL] [--out OUT]
[--recompute] [--markdown] [--no-skipping] pdf [pdf ...]
positional arguments:
pdf PDF(s) to process.
options:
-h, --help show this help message and exit
--batchsize BATCHSIZE, -b BATCHSIZE
Batch size to use.
--checkpoint CHECKPOINT, -c CHECKPOINT
Path to checkpoint directory.
--model MODEL_TAG, -m MODEL_TAG
Model tag to use.
--out OUT, -o OUT Output directory.
--recompute Recompute already computed PDF, discarding previous predictions.
--full-precision Use float32 instead of bfloat16. Can speed up CPU conversion for some setups.
--no-markdown Do not add postprocessing step for markdown compatibility.
--markdown Add postprocessing step for markdown compatibility (default).
--no-skipping Don't apply failure detection heuristic.
--pages PAGES, -p PAGES
Provide page numbers like '1-4,7' for pages 1 through 4 and page 7. Only works for single PDFs.
Q&A:
- nltk_data:
- 在项目的nougat文件下的postprocessing.py文件,或者anaconda Linux的
/home/xhj/anaconda3/envs/nougat/lib/python3.9/site-packages/nougat/postprocessing.py
中,有一行nltk.download("words")
- 确定需要下载的包,如words,从网上下载下来的包放在
/home/xhj/nltk_data/corpora/words
- 或者开个梯子解决
- nougat pip install:
- 第二条有时候不好使,第一条会报奇怪错误,建议从好使的机器上将环境打包后,迁移使用