我去掉了lora部分，在原始结构finetune，总报错ValueError: Attempting to unscale FP16 gradients.

Question

我查了一下代码，是在这个地方 allow_fp16 无法被设置成true，设置了就能通过，我应该在什么地方配置，有大神指导吗？

│ /h

EnghishYang · Answer

我也遇到了类似的问题，对于作者的代码去掉peft的部分，是不能直接运行的。

mymusise · Answer

我在colab上的p100也有这个问题，但是换成了T4后就没了，不确定是不是硬件问题

EnghishYang · Answer

我在colab上的p100也有这个问题，但是换成了T4后就没了，不确定是不是硬件问题

bobo-wmdigit · Answer

我在colab上的p100也有这个问题，但是换成了T4后就没了，不确定是不是硬件问题

mymusise · Answer

我在colab上的p100也有这个问题，但是换成了T4后就没了，不确定是不是硬件问题

mymusise · Answer

另外pytorch2.0我还没试过，目前用的1.13.1

bobo-wmdigit · Answer

你跑的是带不带lora的啊？我用你的标准脚本没问题，但是我砍掉了lora那部分，也就是peft的部分，就不行了。。。

mymusise · Answer

你跑的是带不带lora的啊？我用你的标准脚本没问题，但是我砍掉了lora那部分，也就是peft的部分，就不行了。。。

mymusise · Answer

<p dir="auto">噢，抱歉，你说的是直接finetune原模型，这个我没试过，直接finetune可以参考别的repo：<a href="https://github.com/ssbuild

bobo-wmdigit · Answer

嗯，那个repo我看了，话说，你的新版本好像显存占用增加了，我以前可以跑bs = 2现在只能跑1了，同样4090

mymusise · Answer

你跑的是512长度么

bobo-wmdigit · Answer

<p dir="auto"><a target="_blank" rel="noopener noreferrer nofollow" href="https://user-images.github

bucm-tcm-tool · Answer

你跑的是带不带lora的啊？我用你的标准脚本没问题，但是我砍掉了lora那部分，也就是peft的部分，就不行了。。。

mymusise · Answer

<blockquote><p dir="auto"><a target="_blank" rel="noopener noreferrer nofollow" href="https://user-

hjing100 · Answer

python fineturn.py的fp16改成bf16试试

我去掉了lora部分，在原始结构finetune，总报错ValueError: Attempting to unscale FP16 gradients. about chatglm-tuning HOT 15 OPEN