【1】我注意到main分支下readme里1.先是进行微调，2.再进行Inference，3.再进行Parameter merging。不应该是1,3,2的顺序吗？因为2.

main分支下的readme顺序，以及base模型能否提供huggingface的链接 about alpaca-cot HOT 4 CLOSED

nuocheng commented on June 8, 2024

main分支下的readme顺序，以及base模型能否提供huggingface的链接

from alpaca-cot.

Comments (4)

nuocheng commented on June 8, 2024

CUDA_VISIBLE_DEVICES=1 python3 uniform_finetune.py --model_type chatglm --model_name_or_path huggingface.co/THUDM/chatglm3-6b --data ./data/formatted_cot_data/aqua_train.json ./data/formatted_cot_data/ecqa_train.json ./data/formatted_cot_data/esnli_train.json --lora_target_modules query_key_value --lora_r 32 --lora_alpha 32 --lora_dropout 0.1
运行uniform_finetune.py这个脚本进行进行微调，出现了

这个问题。
使用的数据是库中自带的几个jsno数据

from alpaca-cot.

PhoebusSi commented on June 8, 2024

【1】其实3是可有可无的一步，在1微调得到lora权重后，2inference时同时加载llm和lora的权重即可完成推理。而3则是将lora合进llm的操作，用lora替代原有llm中的矩阵，得到一个新的llm，可直接用新llm完成推理，不再需要同时再加载llm和lora权重了。因此3并不是一个必要操作，基本上1和2就满足了训练和测试的需求。

【2】用uniform_finetune.py跑llama-13应该是能跑起来的，是不是本地显存过低？

【3】tabular_LLM主要是提供了相关tabular数据，模型训练相关的代码请参考main分支。

from alpaca-cot.

PhoebusSi commented on June 8, 2024

CUDA_VISIBLE_DEVICES=1 python3 uniform_finetune.py --model_type chatglm --model_name_or_path huggingface.co/THUDM/chatglm3-6b --data ./data/formatted_cot_data/aqua_train.json ./data/formatted_cot_data/ecqa_train.json ./data/formatted_cot_data/esnli_train.json --lora_target_modules query_key_value --lora_r 32 --lora_alpha 32 --lora_dropout 0.1 运行uniform_finetune.py这个脚本进行进行微调，出现了这个问题。使用的数据是库中自带的几个jsno数据

暂时还不支持chatglm3 可以跑下chatglm2就不会有这个报错了

from alpaca-cot.

nuocheng commented on June 8, 2024

CUDA_VISIBLE_DEVICES=1 python3 uniform_finetune.py --model_type chatglm --model_name_or_path huggingface.co/THUDM/chatglm3-6b --data ./data/formatted_cot_data/aqua_train.json ./data/formatted_cot_data/ecqa_train.json ./data/formatted_cot_data/esnli_train.json --lora_target_modules query_key_value --lora_r 32 --lora_alpha 32 --lora_dropout 0.1 运行uniform_finetune.py这个脚本进行进行微调，出现了这个问题。使用的数据是库中自带的几个jsno数据

暂时还不支持chatglm3 可以跑下chatglm2就不会有这个报错了

好的，我试一下2

from alpaca-cot.

main分支下的readme顺序，以及base模型能否提供huggingface的链接 about alpaca-cot HOT 4 CLOSED

Comments (4)

Related Issues (20)

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent