yolov5模型剪枝

基于yolov5最新v5.0进行剪枝，采用yolov5s模型。

剪枝方法1

基于BN层系数gamma剪枝。

在一个卷积-BN-激活模块中，BN层可以实现通道的缩放。如下：

BN层的具体操作有两部分：

在归一化后会进行线性变换，那么当系数gamma很小时候，对应的激活（Zout）会相应很小。这些响应很小的输出可以裁剪掉，这样就实现了bn层的通道剪枝。

通过在loss函数中添加gamma的L1正则约束，可以实现gamma的稀疏化。

上面损失函数L右边第一项是原始的损失函数，第二项是约束，其中g(s) = |s|，λ是正则系数，根据数据集调整

实际训练的时候，就是在优化L最小，依据梯度下降算法：

𝐿′=∑𝑙′+𝜆∑𝑔′(𝛾)=∑𝑙′+𝜆∑|𝛾|′=∑𝑙′+𝜆∑𝛾∗𝑠𝑖𝑔𝑛(𝛾)

所以只需要在BP传播时候，在BN层权重乘以权重的符号函数输出和系数即可，对应添加如下代码:

            # Backward
            loss.backward()
            # scaler.scale(loss).backward()
            # # ============================= sparsity training ========================== #
            srtmp = opt.sr*(1 - 0.9*epoch/epochs)
            if opt.st:
                ignore_bn_list = []
                for k, m in model.named_modules():
                    if isinstance(m, Bottleneck):
                        if m.add:
                            ignore_bn_list.append(k.rsplit(".", 2)[0] + ".cv1.bn")
                            ignore_bn_list.append(k + '.cv1.bn')
                            ignore_bn_list.append(k + '.cv2.bn')
                    if isinstance(m, nn.BatchNorm2d) and (k not in ignore_bn_list):
                        m.weight.grad.data.add_(srtmp * torch.sign(m.weight.data))  # L1
                        m.bias.grad.data.add_(opt.sr*10 * torch.sign(m.bias.data))  # L1
            # # ============================= sparsity training ========================== #

            optimizer.step()
                # scaler.step(optimizer)  # optimizer.step
                # scaler.update()
            optimizer.zero_grad()

这里并未对所有BN层gamma进行约束，详情见yolov5s每个模块 https://blog.csdn.net/IEEE_FELLOW/article/details/117536808 分析，这里对C3结构中的Bottleneck结构中有shortcut的层不进行剪枝，主要是为了保持tensor维度可以加：

实际上，在yolov5中，只有backbone中的Bottleneck是有shortcut的，Head中全部没有shortcut.

如果不加L1正则约束，训练结束后的BN层gamma分布近似正太分布：

是无法进行剪枝的。

稀疏训练后的分布：

可以看到，随着训练epoch进行，越来越多的gamma逼近0.

训练完成后可以进行剪枝，一个基本的原则是阈值不能大于任何通道bn的最大gamma。然后根据设定的裁剪比例剪枝。

剪掉一个BN层，需要将对应上一层的卷积核裁剪掉，同时将下一层卷积核对应的通道减掉。

这里在某个数据集上实验。

首先使用train.py进行正常训练：

python train.py --weights yolov5s.pt --adam --epochs 100

然后稀疏训练：

python train_sparsity.py --st --sr 0.0001 --weights yolov5s.pt --adam --epochs 100

sr的选择需要根据数据集调整，可以通过观察tensorboard的map，gamma变化直方图等选择。在run/train/exp*/目录下:

tensorboard --logdir .

然后点击出现的链接观察训练中的各项指标.

训练完成后进行剪枝：

python prune.py --weights runs/train/exp1/weights/last.pt --percent 0.5

裁剪比例percent根据效果调整，可以从小到大试。裁剪完成会保存对应的模型pruned_model.pt。

微调：

python finetune_pruned.py --weights pruned_model.pt --adam --epochs 100

model	sparity	map	mode size
yolov5s	0	0.322	28.7 M
sparity train yolov5s	0.001	0.325	28.7 M
65% pruned yolov5s	0.001	0.318	6.8 M
fine-tune	0	0.325	6.8 M

剪枝方法2

对于Bottleneck结构：

如果有右边的参差很小，那么就只剩下左边shortcut连接，相当于整个模块都裁剪掉。可以进行约束让参差逼近0.见train_sparsity2.py。

backbone一共有3个bottleneck，裁剪全部bottleneck：

model	sparity	map	model size
yolov5s-prune all bottlenet	0.001	0.167	28.7 M
85%+Bottlenet		0.151	1.1 M
finetune		0.148

裁剪Bottleneck数	map
所有bottle res	0.167
第2,3的bottle res	0.174
第3的bottle res	0.198

可以看到实际效果并不好，从bn层分布也可以看到，浅层特征很少被裁减掉。

剪枝方法3

卷积核剪枝，那些权重很小的卷积核对应输出也较小，那么对kernel进行约束，是可以对卷积核进行裁剪的。

裁剪卷积核需要将下一层BN层对应裁剪，同时裁剪下一层卷积层的输出通道。见train_sparsity3.py

	s	model size	map
sparity train	1e-5	28.7 M	0.335
50% kernel prune		8.4 M	0.151
finetune		8.4 M	0.332

剪枝方法4

混合1和3，见train_sparsity4.py

	map	model size
conv+bn sparity train	0.284	28.7 M
85% bn prune	0.284	3.7 M
78% conv prune	0.284	3.9 M
85% bn prune+78% conv prune	0.284	3.7 M

替换backbone

model	size	mAPval 0.5:0.95	mAPval 0.5
yolov5s	640	0.353	0.557
mobilenetv3small 0.75

调参

浅层尽量少剪,从训练完成后gamma每一层的分布也可以看出来.
系数λ的选择需要平衡map和剪枝力度.首先通过train.py训练一个正常情况下的baseline.然后在稀疏训练过程中观察MAP和gamma直方图变化,MAP掉点严重和gamma稀疏过快等情况下,可以适当降低λ.反之如果你想压缩一个尽量小的模型,可以适当调整λ.
稀疏训练=>剪枝=>微调可以反复迭代这个过程多次剪枝.

常见问题

稀疏训练是非常种重要的,也是调参的重点,多观察bn直方图变化,过快或者过慢都不适合,所以需要平衡你的sr, lr等.一般情况下,稀疏训练的结果和正常训练map是比较接近的.
剪枝时候多试试不同的ratio,一个基本的准则是每层bn层至少保留一个channel,所以有时候稀疏训练不到位,而ratio设置的很大,会看到remaining channel里面会有0出现,这时候要么设置更小的ratio,要么重新稀疏训练,获得更稀疏的参数.
如果想要移植到移动端，可以使用ncnn加速，另外剪枝时控制剩余channel为2^n能有效提升推理速度；GPU可以使用TensorRT加速。

wuyifan2233 / yolov5prune Goto Github PK

yolov5prune's Introduction

yolov5模型剪枝

剪枝方法1

剪枝方法2

剪枝方法3

剪枝方法4

替换backbone

调参

常见问题

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent