-
Notifications
You must be signed in to change notification settings - Fork 403
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
纯文本指令数据 和 多模态指令数据混在一起finetune #179
Comments
你好,感谢你对我们工作的关注。 |
感谢回复,有什么具体的解决办法吗? |
可以同步下huggingface上最新代码,可以解决纯文本和图像的联合训练 |
thx
获取Outlook for Android<https://aka.ms/AAb9ysg>
…________________________________
From: Shusheng Yang ***@***.***>
Sent: Wednesday, November 29, 2023 6:55:09 AM
To: QwenLM/Qwen-VL ***@***.***>
Cc: Luccadoremi ***@***.***>; Author ***@***.***>
Subject: Re: [QwenLM/Qwen-VL] 纯文本指令数据 和 多模态指令数据混在一起finetune (Issue #179)
你好,感谢你对我们工作的关注。
建议检查一下是否因为多模态+纯文本的混合finetune导致了某些卡上ViT没有梯度,如果出现这种情况,是会直接卡住的。
―
Reply to this email directly, view it on GitHub<#179 (comment)>, or unsubscribe<https://github.com/notifications/unsubscribe-auth/AJQ7J243GQ7RKURBSTVSQQLYGZTU3AVCNFSM6AAAAAA732ZRM2VHI2DSMVQWIX3LMV43OSLTON2WKQ3PNVWWK3TUHMYTQMZQHA4DONZYHE>.
You are receiving this because you authored the thread.Message ID: ***@***.***>
|
@ShuaiBai623 huggingface上有上传代码吗?貌似近期只有一个tokenizer加了个空格的修改,同步了最新代码后,依然还是会卡住 |
huggingface上现在只更新了tokenizer,这个解决不了混合训练卡住的问题吧 |
有什么新错误吗 |
@ShuaiBai623 请问这个问题解决了没? |
请问你决绝这个问题了嘛 |
|
更新了,还是会卡住 |
不会啊,我更新了没问题
发自我的iPhone
…------------------ 原始邮件 ------------------
发件人: 星火燎原 ***@***.***>
发送时间: 2023年12月21日 15:10
收件人: QwenLM/Qwen-VL ***@***.***>
抄送: zhihua ***@***.***>, Mention ***@***.***>
主题: Re: [QwenLM/Qwen-VL] 纯文本指令数据 和 多模态指令数据混在一起finetune (Issue #179)
更新了,还是会卡住
—
Reply to this email directly, view it on GitHub, or unsubscribe.
You are receiving this because you were mentioned.Message ID: ***@***.***>
|
配置是全参微调zero3吗?@ZhihuaGao |
想问下qwenvl大佬,仅仅改变img_size扩大了一倍多的分辨率,微调后发现幻觉显著增加了,3.5k的数据,这个仅仅更改配置是不是有问题? |
技术指南中 阶段2 阶段3 的训练都是 448*448 ,如果仅仅扩大分辨率 需要较多数据去训练,vit参数 全放开训练才行 我认为 |
我在尝试,但是发现报错了。 terminate called after throwing an instance of 'c10::Error' Exception raised from c10_cuda_check_implementation at ../c10/cuda/CUDAException.cpp:44 (most recent call first): |
大佬,混合训练的问题有解决吗? |
解决了吗大佬 有思路么 |
用的zero3么? |
发现单独多模态数据 或者 纯文本数据fintune就不会有问题
但如果混合纯文本指令数据和多模态指令数据一起训练,会卡住。处理数据的逻辑可能有问题?
The text was updated successfully, but these errors were encountered: