你好，我用您的代码跑不管是multi还是默认的都无法自动部署在多卡上，请问需要调整代码解决吗，GPU是Tesla T4*4 #14

carlson99999 · 2023-11-22T07:49:39Z

No description provided.

xxw1995 · 2023-11-23T01:39:28Z

目前finetune.py是不支持多卡的 multi版本严格意义上说也不是多卡虽然能调用多张GPU训练但其实是手动映射了device 如果需要多卡训练需要把代码修改成torchrun分布式

carlson99999 · 2023-11-27T08:46:59Z

好的，谢谢，目前用multi起来了，但是跑到一半服务器断网了，请问有什么办法从output/checkpoint续跑

xxw1995 · 2024-01-02T01:05:04Z

好的，谢谢，目前用multi起来了，但是跑到一半服务器断网了，请问有什么办法从output/checkpoint续跑

从checkpoint中用peft的方式加载最新的lora.pt训练即可。目前已支持deepspeed。

Provide feedback