datawhalechina / thorough-pytorch Goto Github PK

第零章：前置知识（选学）
- 人工智能简史
- 相关评价指标
- 常用包的学习
- Jupyter相关操作
第一章：PyTorch的简介和安装
- PyTorch简介
- PyTorch的安装
- PyTorch相关资源简介
第二章：PyTorch基础知识
- 张量及其运算
- 自动求导简介
- 并行计算、CUDA和cuDNN简介
第三章：PyTorch的主要组成模块
- 思考：完成一套深度学习流程需要哪些关键环节
- 基本配置
- 数据读入
- 模型构建
- 损失函数
- 优化器
- 训练和评估
- 可视化
第四章：PyTorch基础实战
- 基础实战——Fashion-MNIST时装分类
- 基础实战——果蔬分类实战（notebook）
第五章：PyTorch模型定义
- 模型定义方式
- 利用模型块快速搭建复杂网络
- 模型修改
- 模型保存与读取
第六章：PyTorch进阶训练技巧
- 自定义损失函数
- 动态调整学习率
- 模型微调-torchvision
- 模型微调-timm
- 半精度训练
- 数据扩充
- 超参数的修改及保存
- PyTorch模型定义与进阶训练技巧
第七章：PyTorch可视化
- 可视化网络结构
- 可视化CNN卷积层
- 使用TensorBoard可视化训练过程
- 使用wandb可视化训练过程
第八章：PyTorch生态简介
- 简介
- 图像—torchvision
- 视频—PyTorchVideo
- 文本—torchtext
- 音频-torchaudio
第九章：模型部署
- 使用ONNX进行部署并推理
第十章：常见网络代码的解读(推进中)
- 计算机视觉
  - 图像分类
    - ResNet源码解读
    - Swin Transformer源码解读
    - Vision Transformer源码解读
    - RNN源码解读
    - LSTM源码解读及其实战
  - 目标检测
    - YOLO系列解读（与MMYOLO合作）
  - 图像分割
- 自然语言处理
  - RNN源码解读
- 音频处理
- 视频处理
- 其他

三、人员安排

成员	个人简介	个人主页
牛志康	DataWhale成员，西安电子科技大学本科生	[知乎][个人主页]
李嘉骐	DataWhale成员，清华大学研究生	[知乎]
刘洋	Datawhale成员，**科学院数学与系统科学研究所研究生	[知乎]
陈安东	DataWhale成员，**民族大学研究生	[个人主页]

教程贡献情况（已上线课程内容）：

李嘉骐：第三章；第四章；第五章；第六章；第七章；第八章；内容整合

牛志康：第一章；第三章；第六章；第七章；第八章，第九章，第十章；文档部署

刘洋：第二章；第三章

陈安东：第二章；第三章；第七章

四、课程编排与配套视频

部分章节直播讲解请观看B站回放（持续更新）：https://www.bilibili.com/video/BV1L44y1472Z

课程编排：深入浅出PyTorch分为三个阶段：PyTorch深度学习基础知识、PyTorch进阶操作、PyTorch案例分析。
使用方法:

我们的课程内容都以markdown格式或jupyter notebook的形式保存在本仓库内。除了多看加深课程内容的理解外，最重要的还是动手练习、练习、练习
组队学习安排:

第一部分：第一章到第四章，学习周期：10天；

第二部分：第五章到第八章，学习周期：11天

五、关于贡献

本项目使用Forking工作流，具体参考atlassian文档大致步骤如下：

在GitHub上Fork本仓库
Clone Fork后的个人仓库
设置upstream仓库地址，并禁用push
使用分支开发，课程分支名为lecture{#NO}，#NO保持两位，如lecture07，对应课程目录
PR之前保持与原始仓库的同步，之后发起PR请求

命令示例：

# fork
# clone
git clone [email protected]:USERNAME/thorough-pytorch.git
# set upstream
git remote add upstream [email protected]:datawhalechina/thorough-pytorch.git
# disable upstream push
git remote set-url --push upstream DISABLE
# verify
git remote -v
# some sample output:
# origin	[email protected]:NoFish-528/thorough-pytorch.git (fetch)
# origin	[email protected]:NoFish-528/thorough-pytorch.git (push)
# upstream	[email protected]:datawhalechina/thorough-pytorch.git (fetch)
# upstream	DISABLE (push)
# do your work
git checkout -b lecture07
# edit and commit and push your changes
git push -u origin lecture07
# keep your fork up to date
## fetch upstream main and merge with forked main branch
git fetch upstream
git checkout main
git merge upstream/main
## rebase brach and force push
git checkout lecture07
git rebase main
git push -f

Commit Message

提交信息使用如下格式：<type>: <short summary>

<type>: <short summary>
  │            │
  │            └─⫸ Summary in present tense. Not capitalized. No period at the end.
  │
  └─⫸ Commit Type: [docs #NO]:others

others包括非课程相关的改动，如本README.md中的变动，.gitignore的调整等。

六、更新计划

内容	更新时间	内容
apex		apex的简介和使用
模型部署		Flask部署PyTorch模型
TorchScript		TorchScript
并行训练		并行训练
模型预训练 - torchhub		torchhub的简介和使用方法
目标检测 - SSD		SSD的简介和实现
目标检测 - RCNN系列		Fast-RCNN & Mask-RCNN
目标检测 - DETR		DETR的实现
图像分类 - GoogLeNet		GoogLeNet的介绍与实现
图像分类 - MobileNet系列		MobileNet系列介绍与实现
图像分类 - GhostNet		GhostNet代码讲解
生成式对抗网络 - 生成手写数字实战		生成数字并可视化
生成式对抗网络 - DCGAN
风格迁移 - StyleGAN
生成网络 - VAE
图像分割 Deeplab系列		Deeplab系列代码讲解
自然语言处理 LSTM		LSTM情感分析实战
自然语言处理 Transformer
自然语言处理 BERT
视频		待定
音频		待定
自定义CUDA扩展和算子

七、鸣谢与反馈

非常感谢DataWhale成员叶前坤 @PureBuckwheat 和胡锐锋 @Relph1119 对文档的细致校对！
如果有任何想法可以联系我们DataWhale也欢迎大家多多提出issue。
特别感谢以下为教程做出贡献的同学！并特别感谢MMYOLO的贡献者们！

Made with contrib.rocks.

八、关注我们

Datawhale是一个专注AI领域的开源组织，以“for the learner，和学习者一起成长”为愿景，构建对学习者最有价值的开源学习社区。关注我们，一起学习成长。

LICENSE

本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。

thorough-pytorch's People

Contributors

Stargazers

Watchers

Forkers

virtualnew qxxy000 smart1ove duanzi019 o3otz xijinmu rogerhou0127 yuanshuaihuang as85207 yjfdunese heshilie ponykid xiaoer95 pengfei-chen fanxiaol newtopython0807 rainabao ls361664056 academic-waste xliu79 qwerty6518 rootray h2bit jessicaxue666 yanjining landbuland piggytough jsnorman rachelchang01 cpynick hu-yq 6forwater29 xiang314159265 hzrzg yusithiesun martin-rhodes-art njszh smg1307 9414lalala tian685 derekxueyonghai sheepchangedeworld nameliming itsyunfei maxxbaba yangmindidemajia huojianxiaohuanxiong missingjoe zeqing-liu yinghaopeng nefelibatawht jeffrey-13 rrpuqy hengyuwanqian smallsky1314 strongerfly wwzhuang01 11sarac relph1119 lpw0351 freakingbuster heyu-cmd rangeking s-yuan137 aicmaodyu jackliaoall-ai-books-practise-archive huang1024rui nqhq-lou ychuest dyian-snow syc1123 zhiyant shengmin2678 unclestrong lioninline baiguosummer xiaoyangyang2 smaleaf jiezju kangxia1990 loyoung 0alexyun0 tesla-peer cilence justinwu66 hzjcaesar liangfengyouxingii renameart jonnoy-gates shaozheliu chenyahao4179 mr-atomer lionlazy-hao gjwsocool violet712 yao-jiawei xiaoyinya zdw0825 nnn666nnn xiaoxiaoyao

thorough-pytorch's Issues

Issue on page /第三章/3.3 数据读入.html

没有看到对MyDataset的使用呢？
文件的格式能提供一些说明吗，不然和代码对不上，谢谢。

Issue on page /第零章/0.2 评价指标.html

你好，就是第零章的评价指标部分，图片完全加载不出来

optim.zero_grad()

optim.zero_grad()这个方法除了能将累积的梯度清零，还有一个作用就是当多个batch只调用一次这个函数时，相当于增大了batch_size，也就是可以将batch大小增大n倍

Issue on page /第六章/6.3 模型微调-torchvision.html

建议：512 修改为 num_ftrs 应该更合适一些

[求助][盼复]：Windows 10 cuda 11.6 没能正常安装torch，\lib\site-packages\torch\lib\shm.dll" or one of its dependencies.

问题复现

系统环境

安装过程

如图出现了问题

通过网络百度了，让安装 vc_redist 没有解决

已没招，盼复~

.grad_fn是对tensor计算一次就引用一次Function对象，来产生运算结果，记录运算的发生，保存记录运算的输入，tensor使用.grad.fn属性记录这个计算图的入口，反向传播中，autograd引擎会按照逆序，通过function的backward依次计算梯度.
手动创建这里建议给出例子,比如:

3.对于markdown公式无法显示问题，是否能改善一下，阅读体验不佳
4.

对于开篇的这些总结，感觉可以在下面对应代码块的头部进行匹配，这样对于小白来说阅读起来会更容易理解一些，不会摸不着头脑，可以适当在结尾处对知识点做一些总结。

Issue on page /第六章/6.5 数据增强-imgaug.html

imgaug 年久失修,若imshow需要修改源码:

python3.10/site-packages/imgaug/imgaug.py

        fig, ax = plt.subplots(figsize=(w, h), dpi=dpi)
        fig.canvas.set_window_title("imgaug.imshow(%s)" % (image.shape,))
        # cmap=gray is automatically only activate for grayscale images
        ax.imshow(image, cmap="gray")

其中需要把
fig.canvas.set_window_title 修改为 fig.canvas.manager.set_window_title

Good job

The tutorial as a whole is still a great effort, although there are some errors. I hope the rest of the chapter will be updated quickly.

Issue on page /第五章/5.3 PyTorch修改模型.html

ResNet(
(conv1): Conv2d(3, 64, kernel_size=(7, 7), stride=(2, 2), padding=(3, 3), bias=False)
(bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
(relu): ReLU(inplace=True)
(maxpool): MaxPool2d(kernel_size=3, stride=2, padding=1, dilation=1, ceil_mode=False)
(layer1): Sequential(
(0): Bottleneck(
(conv1): Conv2d(64, 64, kernel_size=(1, 1), stride=(1, 1), bias=False)
(bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
(conv2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
(bn2): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
(conv3): Conv2d(64, 256, kernel_size=(1, 1), stride=(1, 1), bias=False)
(bn3): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
(relu): ReLU(inplace=True)
(downsample): Sequential(
(0): Conv2d(64, 256, kernel_size=(1, 1), stride=(1, 1), bias=False)
(1): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
)
)
..............
(avgpool): AdaptiveAvgPool2d(output_size=(1, 1))
(fc): Linear(in_features=2048, out_features=1000, bias=True)
)
请问如果我想修改net.layer1中的(0).conv1应该怎么获取呢？目前只会net.layer1=xxx或者net.fc=xxx这种，再往layer1中里面的层修改应该怎么获取？谢谢

[PyTorchv1 第一章节]问题收集

Issue on page /第四章/4.1 ResNet.html

这一部分在书籍中缺失了4.2 4.3 4.4

分类，回归，交叉验证

能不能添加一个回归的例子？

然后分类和回归分别采用交叉验证？

课后作业的编写

需求：针对当前教程设计一些课后题，帮助大家进一步了解
人数：1～不限上限
联系方式：[email protected]

Issue on page /第十章/Transformer 解读.html

Your issue content here.

这里是不是写错了？

FN是否应为实际为阳性，模型检测为阳性
TN是否应为实际为阴性，模型检测为阳性

图片

文档图片都挂了怎么解决啊

Issue on page /第九章/9.1 使用ONNX进行部署并推理.html

When converting a quantization model from pytorch to onnx, I found that there was a large error (more than 4%) in the inference accuracy between the two models. I want to know is that reasonable? And how to solve it? Looking forward to your reply

2.2 自动求导章节 tex公式未能正常显示

Issue on page /第零章/0.2 评价指标.html

Your issue content here.

第一章混淆矩阵错别字

第一段： "实际类别为正样本；True Negative (TP)代表的是实际类别和预测类标相同，预测类别和实际类别均为负样本。"
这里应该是TN 缩写。

CH1 12.2.3 PyTorch的离线安装

step 5:离线下载
问题描述：下载pytorch、torchvision压缩包后，使用conda install --offline安装，安装完成后，无法在python中import torcch
其他验证：采用在线安装后，可以import torch
环境说明：macOS v12.3.1 python 3.8 conda 23.1.0

Issue on page /第四章/4.1 ResNet.html

图裂了:

在文中部分:
比如下面这个图：
https://datawhalechina.github.io/thorough-pytorch/%E7%AC%AC%E5%9B%9B%E7%AB%A0/figures/shortcut2.jpg
左：VGG-19模型，作为参考。中：一个有34个参数层的普通网络。右：一个有34个参数层的残差网络（即resnet34）

Issue on page /第六章/6.1 自定义损失函数.html

6.1.2 的 def forward(self,inputs,targets,smooth=1) 代码行应该往左边移动，与 def init 对齐

自然语言处理相关教程示例

需求：介绍相关的自然语言处理任务和实际代码教程
人数：1～2人
联系方式：[email protected]

第三章余弦相似度代码

我使用的是1.13.0+cu116的pytorch,结果没有错，估计是新版本的问题...

第七章 7.2.3部分一个变量未被定义

我自己的一个修改方法：将img_tensor 改为 torch.tensor(rgb_img).permute(2,0,1).unsqueeze_(0) rgb_img在前文被定义，shape为224, 224, 3 的ndarray

9.1模型部署pipeline框架图无法正常显示

我看了下源码，可能是图片添加错误，或者图片丢失。单独放浏览器渲染不出来，麻烦更新一下框架图。辛苦作者！

3.5 损失函数.md-loss章节

希望添加更常见的CEloss，和BCEloss

第二章-2.1张量

空缺

# rand是[0,1)均匀分布 #https://pytorch.org/docs/1.9.1/generated/torch.rand.html#torch.rand
# randn是服从N（0，1）的正态分布 #https://pytorch.org/docs/1.9.1/generated/torch.randn.html#torch.randn

参数不足

#normal缺参数， 参考：https://pytorch.org/docs/1.9.1/generated/torch.normal.html#torch.normal
print(torch.normal(4.0,3.0,(4,)))

可能是版本问题，我这边是1.9.0，函数找不到

#uniform 找不到
print(torch.__version__)
help(torch.uniform)

Issue on page /第二章/2.3 并行计算简介.html

并行计算
方法一最后一行，应为：
所以这个方式慢慢淡出了视野。

离线安装pytorch和torchvision出现CondaValueError: cannot mix specifications with conda package filenames

windows环境：
在下载地址https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/中下载torchvision-0.10.0-py37_cu111 (1).tar.bz2和pytorch-1.10.1-py3.9_cuda11.1_cudnn8_0.tar.bz2两个包后，复制它们到相应环境的site-packages目录下，然后输入命令conda install --offline torchvision-0.10.0-py37_cu111 (1).tar.bz2出现提示：
CondaValueError: cannot mix specifications with conda package filenames

召集uu参与教程编写

为了更好的完善教程，我们结合当前thorough-pytorch项目的进度，给出了以下task，希望有更多的同学能加入开源的贡献。主要有以下任务：

补充深度学习相关知识（包括卷积，池化，全连接，激活函数，dropout，batch normalization，BP反向传播）（2人）
补充计算机视觉领域、自然语言处理领域，语音处理相关简介（类比一篇论文的introduction，只需说明是什么，有哪些方法即可）（多人）
介绍人工智能发展简史、DL,ML,AI三者之间的关系（1人）
介绍评价相关指标（混淆矩阵， accuracy， precision， recall， F1 score）（1人）
Jupyter notebook或Jupyter Lab相关操作（1人）
一些经典代码的解读（包括但不限于ResNet，GoogleNet，MobileNet，RCNN系列，SSD，YOLO系列，transformer系列，ViT，Detr，BERT，GPT系列，CLIP，GAN相关）（该任务意在介绍一些真正的代码工作是如何写的，建议解读的是PyTorch源码、官方实现的代码或者一些标准库代码包括但不限于timm等）（多人）
联系方式：
email: [email protected]
wechat: ZhikangNiu_Wechat

[PyTocrhv1：第三章问题收集]

Issue on page /第五章/5.4 PyTorh模型保存与读取.html

这一节有一些代码错误了，附上我修改的代码：

1

改为：

import os
os.environ['CUDA_VISIBLE_DEVICES'] = '0,1,2'   #这里替换成希望使用的GPU编号
import torch
from torchvision import models

model = models.resnet152(pretrained=True)
model = nn.DataParallel(model).cuda()

保存+读取模型权重
torch.save(model.module.state_dict(), save_dir)

os.environ['CUDA_VISIBLE_DEVICES'] = '0'   #这里替换成希望使用的GPU编号
loaded_model = models.resnet152()   #注意这里需要对模型结构有定义
loaded_model.load_state_dict(torch.load(save_dir))
loaded_model = nn.DataParallel(loaded_model).cuda()
loaded_model.state_dict

2

改为：

import os
import torch
from torchvision import models
os.environ['CUDA_VISIBLE_DEVICES'] = '0,1,2'   #这里替换成希望使用的GPU编号
print(os.environ['CUDA_VISIBLE_DEVICES'])

model = models.resnet152(pretrained=True)
model = nn.DataParallel(model).cuda()

# 保存+读取模型权重，强烈建议！！
torch.save(model.module.state_dict(), save_dir)
loaded_model = models.resnet152()   #注意这里需要对模型结构有定义
loaded_model.load_state_dict(torch.load(save_dir))
loaded_model = nn.DataParallel(loaded_model).cuda()
loaded_model

3

请问这里是怎么看的？
希望作者大大解答

测试环境：
Ubuntu 22.04
NVIDIA 1080 ti * 4

补充一点，torch.tensor()的话是不共享内存的，torch.as_tensor()和torch.from_numpy()是和源数据共享内存的

3.3数据读入，class MyDataset(dataset)26行

3.3数据读入，class MyDataset()这段代码26行发现了一个错误：raw_label = self.label_info.loc[self.label_info['Image_index'] == image_name]，这里self.label_info['Image_index'] == image_name是一个关系式，其结果为布尔值，self.label_info.loc[1]或者self.label_info.loc[0]无法取值，这里是不是应该改为 if self.label_info['Image_index'] == image_name： raw_label = self.label_info.loc[self.label_info['Image_index'] ]

Issue on page /第零章/0.4 Jupyter相关操作.html

很多步骤截图不显示。

Issue on page /第零章/0.2 评价指标.html

图片和表格无法显示

第一个issues，cool~

十分感谢这个教程，我现在在dw的trm课程和李宏毅机器学习课程学习，关于.DS_Store文件，建议写个.gitignore文件，参考资料

# IDE
.vscode/
.idea/
.git/
# Python
__pycache__/

# Windows
*.bat
Thumbs.db
Desktop.ini

# Mac OS X
*.DS_Store

datawhalechina / thorough-pytorch Goto Github PK

thorough-pytorch's Introduction

深入浅出PyTorch

一、项目初衷

二、内容简介

三、人员安排

四、 课程编排与配套视频

五、关于贡献

Commit Message

六、更新计划

七、鸣谢与反馈

八、关注我们

LICENSE

thorough-pytorch's People

Contributors

Stargazers

Watchers

Forkers

thorough-pytorch's Issues

问题复现

系统环境

安装过程

如图出现了问题

这一节有一些代码错误了，附上我修改的代码：

1

2

3

Recommend Projects

Recommend Topics

Recommend Org

四、课程编排与配套视频