code
└── data_preprocessing
├── gnt2gnt.cpp # 数据预处理
└── gnt2tf.py # 制作tfrecord数据集以供mindspore训练
└── train&eval
├── config.py # 配置文件
├── dataset.py # 数据载入及预处理
├── eval.py # 批量验证测试集精度&导出pb模型
├── lr_generator.py # 学习率设置
├── train_with_eva.py # 训练并验证精度
├── inference.py # 推理单张图片
└── resnet.py # resnet18
该部分可参考手写汉字拍照识别系统,处理方法类似
该部分使用标准resnet论文中的18层结构。由于手写汉字特征较为简单且三通道意义不大,因此将输入改为了112 * 112 * 1。
选择华为云服务中的ModelArts;选择训练管理中的训练作业模块,点击“创建”。
在常用框架模块下进行设置,包括对代码目录、启动文件、数据存储位置和单卡多卡模式等。
在训练作业中选择一个任务进入,选择日志模块进行查看。若在本地配置了MindSpore,还可通过MindInsight可视化训练过程。
mindspore的底层加速确实不错,同等参数训练比tensorflow要快一些。
网络训练完成后,可进一步导出为GEIR或ONNX格式的PB模型,以便后续部署到Atlas或其它平台上进行推理。