可能可以简化代码？ about o-lora HOT 8 OPEN

WuNein commented on August 9, 2024 3

可能可以简化代码？

from o-lora.

Comments (8)

WuNein commented on August 9, 2024 2

话说照着你这样修改的话，原本的l2_loss就没有了吗？最终的loss = loss + orthogonal_loss * lamda_1吗？

你自己加上就好了，又不冲突…… 只是我懒得写了

是直接用matched_modules进行计算吗？
l2_loss = 0.
        for name, param in matched_modules:
            l2_loss += torch.norm(param, p=2)

完全不对吧，

# l2-normalization for loranew_A/B
        l2_loss = 0.
        for name, param in self.model.named_parameters():
            if "loranew_" in name:
                l2_loss += torch.norm(param, p=2)

原本代码里面写的是新的loranew，那么简化代码以后目标是

# l2-normalization for loranew_A/B
        l2_loss = 0.
        for name, param in self.model.named_parameters():
            if "lora_" in name:
                l2_loss += torch.norm(param, p=2)

lora_ 就是原本的lora_new啊，l2正则肯定是对现在task的参数进行的啊

from o-lora.

cmnfriend commented on August 9, 2024

可以的！👍

from o-lora.

WuNein commented on August 9, 2024

哦对，有个问题我不懂就问了：）懒得再翻您改的PEFT代码了（不是
既然说是当前LoRA在之前LoRA的正交方向上更新的；那么当前的LoRA大概率是merge之前LoRA，以此为基础继续训练的吧？我没理解错吧

from o-lora.

DumoeDss commented on August 9, 2024

哦对，有个问题我不懂就问了：）懒得再翻您改的PEFT代码了（不是既然说是当前LoRA在之前LoRA的正交方向上更新的；那么当前的LoRA大概率是merge之前LoRA，以此为基础继续训练的吧？我没理解错吧

训练完会进行merge
#5 (comment)

from o-lora.

WuNein commented on August 9, 2024

哦对，有个问题我不懂就问了：）懒得再翻您改的PEFT代码了（不是既然说是当前LoRA在之前LoRA的正交方向上更新的；那么当前的LoRA大概率是merge之前LoRA，以此为基础继续训练的吧？我没理解错吧

训练完会进行merge #5 (comment)

我的疑惑在新的task的lora初始化上面，既然说是最后合并的，我姑且认为是随机初始化的~毕竟代码上loss要保证两个lora_a是正交的。

from o-lora.

DumoeDss commented on August 9, 2024

话说照着你这样修改的话，原本的l2_loss就没有了吗？
最终的loss = loss + orthogonal_loss * lamda_1吗？

from o-lora.

WuNein commented on August 9, 2024

话说照着你这样修改的话，原本的l2_loss就没有了吗？最终的loss = loss + orthogonal_loss * lamda_1吗？

你自己加上就好了，又不冲突…… 只是我懒得写了

from o-lora.

DumoeDss commented on August 9, 2024

话说照着你这样修改的话，原本的l2_loss就没有了吗？最终的loss = loss + orthogonal_loss * lamda_1吗？

你自己加上就好了，又不冲突…… 只是我懒得写了

是直接用matched_modules进行计算吗？

l2_loss = 0.
        for name, param in matched_modules:
            l2_loss += torch.norm(param, p=2)

from o-lora.

可能可以简化代码？ about o-lora HOT 8 OPEN

Comments (8)

Related Issues (20)

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent