cmnfriend / o-lora Goto Github PK

View Code? Open in Web Editor NEW

131.0 131.0 13.0 44.26 MB

License: MIT License

Python 92.50% Shell 7.50%

o-lora's People

Contributors

Stargazers

Watchers

Forkers

expert68 shenzhiyang2000 pengyuzhang97 chuxij christina200 tianzhongsong danield21 shuotang123 wf4867612

o-lora's Issues

代码运行时在loss那里报错

而且do_grad_scaling这个我看在脚本中也没有。（上面的运行情况是我手动设为True之后的情况）
请问do_grad_scaling和scaler是在哪里定义了呢？

关于长序列任务上的讨论

感谢作者优秀的工作！想请教一下关于O-LoRA在更challenging的长序列任务上（large number of tasks）性能表现与PerTaskFT和MTL有差距的原因可能有哪些？期待您的回复！

ModuleNotFoundError: No module named 'datasets'

请问有人遇到过同样的问题吗？明明环境里有datasets这个包，但是一直报这个错误：
Traceback (most recent call last):
File "/home/user/ljl_new/O-LoRA/src/run_uie_lora.py", line 29, in
import datasets
ModuleNotFoundError: No module named 'datasets'
Traceback (most recent call last):
File "/home/user/ljl_new/O-LoRA/src/run_uie_lora.py", line 29, in
import datasets
ModuleNotFoundError: No module named 'datasets'

Loss在yahoo数据集上骤降为0

你好，我正在用scripts_llama/order_1.sh在llama-7b模型上训练，每次在yahoo数据集上训练时都会遇到loss直接降到0的情况（其他数据集上正常），能帮忙看看有什么问题吗？用的80G显存单卡A100，训练batch size为8，测试batch size为32，梯度累积步长为1.

作者你好~ 请问一下为什么lora矩阵的形状中有0呢

有形状中有0会导致构造DDP模型时出错

Could this be adapted to Llama2? Which part should be modified?

Great work! This repo is built based on the pretrained T5-large model, but I wonder if it could be adapted to Llama2? And which part of this project should be modified? Thanks a lot!

关于数据集

请问一下CL_Benchmark里面是完整数据集吗，我在其他地方下载的数据集和里面的条目不太一样

关于数据集加载的报错

FileNotFoundError: [Errno 2] No such file or directory: 'G:/code/O-LoRA-main/O-LoRA-main/logs_and_outputs/order_1/outputs/1-dbpedia/29ec996b8e1ae5297860b8d946af1b38/uie_dataset_lora/default-d0dfd2a00d317be8/2.0.0/c490e7f13dec80785fc335819009163a45c86ae2816040c8d81800108e 7e4374/uie_dataset_lora-train-00000-00000-of-NNNNN.arrow'

raise DatasetGenerationError("An error occurred while generating the dataset") from e

datasets.builder.DatasetGenerationError: An error occurred while generating the dataset

请问下我在运行order_1.sh时在数据集加载出现文件No such file or directory，经检查后发现outputs下有默认创建的文件夹，但是没有自动生成uie_dataset_lora-train-00000-00000-of-NNNNN.arrow导致了报错，请问该如何解决，谢谢

关于code的疑惑

你好，非常感谢您杰出的工作。我在阅读您的code的时候有2点疑惑：

关于正则化那部分，您只是将本次的loranew_A与上一次的lora_A取了正则化，而您的paper里是让本次loranew_A与之前所有的lora_A取正则，我的理解是否有问题？
我是nlp新手，不是很了解您的paper给出的avg的指标是什么，或者说计算的损失函数是什么？
谢谢。

Line 91 in ff73694

orthogonal_loss = 0.

由于这边是跟没有梯度的lora(old)来计算正交，那直接在上一步把lora（old）save为pth是不是可以避免修改peft库了

import torch

# 假设 self.model 是你的模型
stacked_params = {}

for name, param in self.model.named_parameters():
    if "lora_" in name:
        stacked_params[name] = param.data.clone()  # 使用 clone() 复制参数并避免共享内存

# 保存堆叠的参数到文件
torch.save(stacked_params, "path/to/stacked_params.pth")

然后在trainer类里面加载

# 初始化一个字典来存储匹配的模块和对应的参数
matched_modules = {} #load pth

for name, param in self.model.named_parameters():
    if "lora_A" in name:
          # 匹配的模块名称和对应的参数
          param_ = matched_modules[name]

          orthogonal_loss += torch.abs(torch.mm(param, param_.T)).sum()  # [r * dim] * [dim * r]
          break  # target modules have been matched

大致这个意思

是不是就可以避免修改PEFT代码，方便很多？

在save_and_load.py的Line 36处增加了当前Lora和previous Lora的合并，用的是concat的方式，如果说按照默认的rank=8来看，是不是concat方式会随着任务数量的增加，导致next task的rank增长？比如第二次loranew的rank就变为16了？
理论上看，用add的方式是不是也是等价的？

我还没成功run起代码来，hf被墙很烦，所以这些问题还暂时没有亲手验证，烦请作者帮忙解惑一下啦～