Comments (7)
为什么我直接init_params="step_xxxx" 也能加载, 这样做不对么,
使用init_params
只是加载参数,不会加载optimizer相关的variable,如Adam的moment之类的,使用init_checkpoint
是为了从之前中断的状态继续训练
from knover.
功能已支持,把配置文件的init_params改成init_checkpoint即可,我后面在文档上加上
from knover.
功能已支持,把配置文件的init_params改成init_checkpoint即可,我后面在文档上加上
我就是看到已经有这功能,但是文档里又没有写,所以建议文档里加上。另外就是现在这样还是不太方便,除了init_params改成init_checkpoint还得加--start_step参数(配置文件和train.sh里都得加)才能正常的在后续创建能续上的step checkpoint,所以我觉得是不是保存checkpoint的时候顺便就在这个目录记下最后一个step,这样训练的时候先读取这个进度信息,如果有进度信息就自动恢复训练,这样用起来就方便多了
from knover.
功能已支持,把配置文件的init_params改成init_checkpoint即可,我后面在文档上加上
我就是看到已经有这功能,但是文档里又没有写,所以建议文档里加上。另外就是现在这样还是不太方便,除了init_params改成init_checkpoint还得加--start_step参数(配置文件和train.sh里都得加)才能正常的在后续创建能续上的step checkpoint,所以我觉得是不是保存checkpoint的时候顺便就在这个目录记下最后一个step,这样训练的时候先读取这个进度信息,如果有进度信息就自动恢复训练,这样用起来就方便多了
保存checkpoint的时候其实是已经包含了step信息(目前没有输出step信息),start step不设置也不影响训练,也可以准确从上次的checkpoint保存的step继续训练,这个只会影响显示(显示后续可以优化)
另外运行配置修改上,绝大多数情况都不需要修改train.sh的逻辑,可以直接在配置上通过train_args
设置所有额外的参数,如加一行
train_args="--start_step 2000"
from knover.
功能已支持,把配置文件的init_params改成init_checkpoint即可,我后面在文档上加上
我就是看到已经有这功能,但是文档里又没有写,所以建议文档里加上。另外就是现在这样还是不太方便,除了init_params改成init_checkpoint还得加--start_step参数(配置文件和train.sh里都得加)才能正常的在后续创建能续上的step checkpoint,所以我觉得是不是保存checkpoint的时候顺便就在这个目录记下最后一个step,这样训练的时候先读取这个进度信息,如果有进度信息就自动恢复训练,这样用起来就方便多了
保存checkpoint的时候其实是已经包含了step信息(目前没有输出step信息),start step不设置也不影响训练,也可以准确从上次的checkpoint保存的step继续训练,这个只会影响显示(显示后续可以优化)
另外运行配置修改上,绝大多数情况都不需要修改train.sh的逻辑,可以直接在配置上通过train_args
设置所有额外的参数,如加一行train_args="--start_step 2000"
学到了新知识,非常感谢:)
from knover.
为什么我直接init_params="step_xxxx" 也能加载, 这样做不对么,
from knover.
功能已支持,把配置文件的init_params改成init_checkpoint即可,我后面在文档上加上
我就是看到已经有这功能,但是文档里又没有写,所以建议文档里加上。另外就是现在这样还是不太方便,除了init_params改成init_checkpoint还得加--start_step参数(配置文件和train.sh里都得加)才能正常的在后续创建能续上的step checkpoint,所以我觉得是不是保存checkpoint的时候顺便就在这个目录记下最后一个step,这样训练的时候先读取这个进度信息,如果有进度信息就自动恢复训练,这样用起来就方便多了
保存checkpoint的时候其实是已经包含了step信息(目前没有输出step信息),start step不设置也不影响训练,也可以准确从上次的checkpoint保存的step继续训练,这个只会影响显示(显示后续可以优化)
另外运行配置修改上,绝大多数情况都不需要修改train.sh的逻辑,可以直接在配置上通过train_args
设置所有额外的参数,如加一行train_args="--start_step 2000"
学到了新知识,非常感谢:)
#31
已经补充了文档
from knover.
Related Issues (20)
- Plato-KAG部署环境下如何输入topic和knowledge
- 请问Link theWorld这个论文中2.1节Service Information的service API是如何构建的
- Plato-KAG文档 HOT 1
- 加载数据时发现报错[WARN] Invalid example: context too long / no context - Example HOT 2
- WARN,读数据时显示context过长或无content HOT 1
- 使用single_gpu训练报错TypeError: __new__() got multiple values for argument data_id HOT 4
- PLATO stage-1训练之后output里没有输出 HOT 1
- InvalidArgumentError: Broadcast dimension mismatch HOT 2
- PLATO stage1训练发现内存一直在增长,训练到9w步后,出现内存溢出,这是什么原因? HOT 4
- PLATO-KAG生成的回复能否使用NSP模型的score排序 HOT 2
- 关于PLATO-KAG模型部署后的回答生成 HOT 2
- Release of training code for QKConv HOT 11
- KAG训练中mean_mlm_ce指标的意义是什么 HOT 2
- KAG训练中mean_mlm_ce指标的意义是什么
- lr scheduler参数设置 HOT 4
- Changing the allowed maximum conversation length in Plato-2 HOT 1
- Using PLATO-XL for inference on 3 or more GPUs HOT 2
- Methods of PLATO-KAG pre-training for other languages
- 训练plato2.2L
- AG-DST模型开源了吗 HOT 1
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from knover.