paddlepaddle / awesome-deeplearning Goto Github PK

深度学习入门课、资深课、特色课、学术案例、产业实践案例、深度学习知识百科及面试题库The course, case and knowledge of Deep Learning and AI

License: Apache License 2.0

Jupyter Notebook 63.92% Python 34.39% Shell 0.63% CMake 0.11% C++ 0.71% MATLAB 0.13% Makefile 0.01% Cython 0.03% Cuda 0.04% Gnuplot 0.04%

bert classification cnn detection dqn dssm dynabert gan nlp pose recommender-system reinforcement-learning rnn sarsa segmentation tinybert transformer video

awesome-deeplearning's Introduction

一、项目简介

本项目是飞桨官方出品的一站式深度学习在线百科，飞桨致力于让深度学习技术的创新与应用更简单，更多飞桨内容欢迎访问飞桨官网。本项目内容涵盖：

📒课程类：零基础实践深度学习、产业实践深度学习、特色课程、飞桨套件课程汇总资料

📒书籍类：《动手学深度学习》飞桨版

📒宝典类：深度学习百问、面试宝典

📒案例类：飞桨产业实践范例库（包含智慧城市：火灾烟雾检测、安全帽检测；智能制造：钢材缺陷检测、机械手抓取；互联网：财报识别与关键字段抽取等。

从理论到实践，从科研到产业应用，各类学习材料一应俱全，旨在帮助开发者高效地学习和掌握深度学习知识，快速成为AI跨界人才。

内容全面：无论您是深度学习初学者，还是资深用户，都可以在本项目中快速获取到需要的学习材料。
形式丰富：材料形式多样，包括可在线运行的notebook、视频、书籍、B站直播等，满足您随时随地学习的需求。
实时更新：本项目中涉及到的代码均匹配Paddle最新发布版本，开发者可以实时学习最新的深度学习任务实现方案。
前沿分享：定期分享顶会最新论文解读和代码复现，开发者可以实时掌握最新的深度学习算法。

如果本项目对您有帮助，欢迎点击网页右上方进行star❤️

👨‍🏫我是高校用户

我希望：	我可以学习：
入门深度学习	零基础实践深度学习⤵️、深度学习百问⤵️、动手学深度学习paddle版⤵️
进阶深度学习	产业实践深度学习、深度学习百问⤵️、面试宝典⤵️
趣味深度学习	特色课程⤵️、飞桨产业实践范例库

👨‍💻我是企业用户

我希望：	我可以学习：
入门深度学习	零基础实践深度学习⤵️、深度学习百问⤵️、动手学深度学习paddle版⤵️
进阶深度学习	产业实践深度学习、特色课程⤵️、面试宝典⤵️
实践深度学习	飞桨产业实践范例库、飞桨各产品课程⤵️

二、项目内容

👉课程类

零基础实践深度学习

AI Studio在线课程：《零基础实践深度学习》：理论和代码结合、实践与平台结合，包含20小时视频课程，由百度杰出架构师、飞桨产品负责人和资深研发人员共同打造。
《零基础实践深度学习》书籍：本课程配套书籍，由清华出版社2020年底发行，京东/当当等电商均有销售。

特色课 - Transformer系列

飞桨教育官方出品的Transformer系列内容解读可以参考以下两个平台。

Transformer原理和实践系列课：https://aistudio.baidu.com/aistudio/education/group/info/24683
飞桨教育官方账号：https://aistudio.baidu.com/aistudio/personalcenter/thirdview/908086

领域	章节名称	课程简介	notebook链接
NLP	经典的预训练语言模型(上)-预训练模型发展历史	介绍预训练语言模型的发展历史，word2vec，elmo，bert，gpt，bert一些拓展。	notebook链接
NLP	经典的预训练模型(上)-ELMo	全面详细的介绍ELMo模型结构，优缺点等。	notebook链接
NLP	经典的预训练模型(上)-Transformer	讲解Transformer的基本原理，包括Embedding，self-attention，encoder，decoder，复杂度计算，共享机制等内容。	notebook链接
NLP	经典的预训练模型(下)-GPT	全面详细的介绍GPT的原理，预训练和finetune模式，GPT模型结构，优缺点等。	notebook链接
NLP	经典的预训练模型(下)-BERT	全面详细的介绍BERT的基本原理，预训练任务和fine tune的方式，BERT本身的模型结构，优缺点等。	notebook链接
NLP	预训练模型之自然语言理解-RoBERTa	讲解预训练模型在自然语言理解方面的改进--RoBERTa	notebook链接
NLP	预训练模型之自然语言理解-ERNIE	讲解预训练模型之自然语言理解的改进：ERNIE	notebook链接
NLP	预训练模型之自然语言理解-KBERT	讲解预训练模型之自然语言理解的改进：KBERT	notebook链接
NLP	预训练模型之自然语言理解-THU-ERNIE	讲解预训练模型之自然语言理解的改进：THU-ERNIE	notebook链接
NLP	预训练模型之长序列建模-Transformer-XL	讲解预训练模型之长序列建模的改进：Transformer-XL	notebook链接
NLP	预训练模型之长序列建模-XLNet	讲解自然语言理解之长序列建模的改进：XLNet	notebook链接
NLP	预训练模型之长序列建模-Longformer	讲解预训练模型之长序列建模的改进：Longformer	notebook链接
模型优化	预训练模型-高效结构	基于ELECTRA的标点符号预测	notebook链接
模型优化	预训练模型-蒸馏	预训练模型蒸馏算法：Patient-KD、DistilBERT、TinyBERT、DynaBERT模型详解，以及使用DynaBERT策略对TinyBERT进行模型蒸馏	notebook链接
CV	图像领域的Transformer-Vit,DeiT	详细讲解ViT 以及 DeiT原理	notebook链接
CV	图像领域的Transformer-Swin Transformer	详细讲解Swin Transformer原理	notebook链接
CV	CV领域的Transformer模型DETR在目标检测任务中的应用	详细讲解DETR原理及代码解析	notebook链接

返回⤴️

👉书籍类

《动手学深度学习》paddle版

本项目将《动手学深度学习》原书中MXNet代码实现改为PaddlePaddle实现。原书作者：阿斯顿·张、李沐、扎卡里 C. 立顿、亚历山大 J. 斯莫拉以及其他社区贡献者，GitHub地址：https://github.com/d2l-ai/d2l-zh。

本项目面向对深度学习感兴趣，尤其是想使用PaddlePaddle进行深度学习的童鞋。本项目并不要求你有任何深度学习或者机器学习的背景知识，你只需了解基础的数学和编程，如基础的线性代数、微分和概率，以及基础的Python编程。

返回[:arrow_heading_up:](#0)

👉宝典类

深度学习百问

深度学习百问内容包含深度学习基础篇、深度学习进阶篇、深度学习应用篇、强化学习篇以及面试宝典，详细信息请参阅Paddle知识点文档平台。

返回⤴️

👉案例类

飞桨应用案例集

领域	产业案例	来源	更多内容
智能工业	厂区传统仪表统计监测	飞桨官方	更多飞桨案例
智能工业	新能源汽车锂电池隔膜质检	飞桨官方	更多飞桨案例
智能工业	天池铝材表面缺陷检测	飞桨官方	更多飞桨案例
智能工业	安全帽检测	飞桨官方	更多飞桨案例
智慧城市	高尔夫球场遥感监测	飞桨官方	更多飞桨案例
智慧城市	积雪语义分割	飞桨官方	更多飞桨案例
智慧城市	戴口罩的人脸识别	飞桨官方	更多飞桨案例
智慧交通	车道线分割和红绿灯安全检测	飞桨官方	更多飞桨案例
智慧交通	【PaddleDetection2.0专项】PP-YOLOv2	飞桨PaddleDet	更多paddleDet案例
智慧交通	PaddleX助力无人驾驶（基于YOLOv3的车辆检测和车道线分割）	开发者BIT可达鸭	更多飞桨案例
智慧交通	eblite_标志物检测	开发者TobeWell	更多飞桨案例
智慧交通	PaddleOCR: 车牌识别	飞桨开发者寂寞你快进去	更多飞桨案例
智慧农林	耕地地块识别	飞桨官方	更多飞桨案例
智慧农林	AI识虫	飞桨官方	更多飞桨案例
智慧农林	更快更强！高效快速的PP-YOLO实战演练	飞桨PaddleDet	更多paddleDet案例
智慧农林	PaddleX快速上手-Faster RCNN目标检测	飞桨PaddleX	更多PaddleX案例
智慧农林	AI识虫检测分享	开发者aaaLKgo	更多飞桨案例
智慧农林	基于PaddleX实现森林火灾监测	飞桨官方	更多飞桨案例
智慧医疗	医学常见中草药分类	飞桨官方	更多飞桨案例
智慧医疗	眼疾识别	飞桨官方	更多飞桨案例
智慧医疗	基于Paddle的肝脏CT影像分割	开发者代码生成器	更多飞桨案例
智慧医疗	PaddleHub 肺炎CT影像分析	飞桨PaddleHub	更多PaddleHub案例
智慧医疗	基于飞桨PGL的高致病性传染病的传播趋势预测基线系统	飞桨官方	更多飞桨案例
其他	人摔倒检测	开发者Niki_173	该开发者更多案例
其他	足球比赛动作定位	飞桨官方	更多飞桨案例
其他	基于强化学习的飞行器仿真	飞桨官方	更多飞桨案例
其他	基于ERNIE-Gram实现语义匹配	飞桨官方	更多飞桨案例
其他	『NLP打卡营』实践课5：文本情感分析	飞桨PaddleNLP	更多飞桨PaddleNLP案例
其他	『NLP经典项目集』03：利用情感分析选择年夜饭	飞桨PaddleNLP	更多飞桨PaddleNLP案例
其他	分类任务：如何在客服对话中，识别客户情绪的好坏	开发者中大bbking	更多飞桨案例
其他	『NLP打卡营』实践课3：使用预训练模型实现快递单信息抽取	飞桨PaddleNLP	更多飞桨PaddleNLP案例
其他	发愁七夕文案？PaddleHub情话生成送给你 (文内含七夕抽奖)	飞桨PaddleHub	更多PaddleHub案例
其他	基于PaddleDetection的PCB瑕疵检测	飞桨官方	更多飞桨案例
其他	基于百度飞桨的单/多镜头行人追踪（非官方Baseline）	开发者BIT可达鸭	更多飞桨案例
其他	PaddleLite树莓派从0到1：安全帽检测小车部署（一）	开发者深渊上的炕	更多飞桨案例
其他	PaddleX、PP-Yolo：手把手教你训练、加密、部署目标检测模型	开发者深渊上的炕	更多飞桨案例
其他	中文语音识别	飞桨官方	更多飞桨案例
其他	PaddleHub一键OCR中文识别(超轻量8.1M模型，火爆)	飞桨官方	更多飞桨案例
其他	老北京城影像修复	飞桨PaddleGAN	更多PaddleGAN案例
其他	飞桨创意之星宋代诗人念诗的秘密——PaddleGAN实现精准唇形合成	飞桨官方	更多飞桨案例
其他	通过OCR实现验证码识别	飞桨官方	更多飞桨案例
其他	PaddleHub一键OCR中文识别（超轻量8.1M模型，火爆）	飞桨PaddleHub	更多PaddleHub案例
其他	全流程，从零搞懂基于PaddlePaddle的图像分割	开发者nanting03	更多飞桨案例
其他	负荷预测0.1	开发者gaomaosheng0	更多飞桨案例
其他	AI 实现皮影戏，传承正在消失的艺术	开发者Zohar	更多飞桨案例
其他	『深度学习7日打卡营』人脸关键点检测	开发者TC.Long	更多飞桨案例
强化学习	DDPG算法应用于股票量化交易	开发者	更多飞桨案例

飞桨学术案例集

技术方向	学术案例	来源	更多内容
机器学习	鸢尾花分类	AIStudio官方	更多飞桨案例
前馈神经网络	波士顿房价预测	开发者AIStudioHelper	更多飞桨案例
图像分类	手写数字识别	AIStudio官方	更多飞桨案例
图像分类	猫狗分类	AIStudio官方	更多飞桨案例
图像分类	图像分类网络VGG在多表情识别任务中的应用	开发者之雍Jerry	更多飞桨案例
图像分类	图像分类-ResNet	开发者笨笨	更多飞桨案例
图像分类	用PaddlePaddle实现图像分类-SE_ResNeXt	AIStudio官方	更多飞桨案例
图像分类	深入理解图像分类中的Transformer-Vit,DeiT	PaddleEdu	更多飞桨案例
图像分类	Swin Transformer	PaddleEdu	更多飞桨案例
图像分类	小样本学习(Few-Shot Learning)	开发者DeepGeGe	更多飞桨案例
图像分割	经典实例分割模型Mask RCNN	AIStudio官方	更多飞桨案例
图像分割	PaddleSeg_DeepLabv3+	飞桨PaddleSeg	更多飞桨案例
图像分割	基于PaddlePaddle的语义分割DeepLabV3+实现	AIStudio官方	更多飞桨案例
图像检测	深度学习进阶-目标检测	AIStudio官方	更多飞桨案例
图像检测	一文详解yolov3目标检测算法	开发者AIStudio96069	更多飞桨案例
图像检测	CV领域的Transformer模型DETR在目标检测任务中的应用	PaddleEdu	更多飞桨案例
视频分类	TSN视频分类	PaddleEdu	更多飞桨案例
视频分类	Paddle2.1实现视频理解经典模型 — TSM	PaddleEdu	更多飞桨案例
视频分类	基于Attention和Bi-LSTM实现视频分类	PaddleEdu	更多飞桨案例
视频分类	CV领域的Transformer模型TimeSformer实视频理解	PaddleEdu	更多飞桨案例
GAN	一文搞懂生成对抗网络之经典GAN（动态图、VisualDL2.0）	开发者FutureSI	更多飞桨案例
GAN	基于PaddlePaddle的StarGAN,AttGAN,STGAN算法	AIStudio官方	更多飞桨案例
OCR	文字识别-CRNN	开发者哦吼	更多飞桨案例
NLP	基于ERNIE实现9项GLUE任务	PaddleEdu	更多飞桨案例
NLP	NLP领域的XLNet模型在情感分析中的应用	PaddleEdu	更多飞桨案例
NLP	NLP领域中的ERNIE模型在阅读理解中的应用	PaddleEdu	更多飞桨案例
NLP	NLP领域的ELECTRA在符号预测上的应用	PaddleEdu	更多飞桨案例
NLP	NLP领域的Transformer在机器翻译上的应用	PaddleEdu	更多飞桨案例
NLP	【Paddle打比赛】讯飞赛题—中文问题相似度挑战赛0.9+Baseline	PaddleEdu	更多飞桨案例
NLP	用PaddlePaddle实现BERT	AIStudio官方	更多飞桨案例
多模态	【Paddle CLIP】你写啥他画啥，一个专属于你的小画家	PaddleFleet	更多飞桨案例
强化学习	从代码到论文理解并复现MADDPG算法(PARL)	开发者Mr.郑先生_	更多飞桨案例
推荐	[基于DeepFM 模型的点击率预估](https://github.com/PaddlePaddle/awesome-DeepLearning/tree/master/examples/DeepFM for CTR Prediction)	PaddleEdu	更多飞桨案例
推荐	基于DSSM的电影推荐	AIStudio官方	更多飞桨案例
知识蒸馏	基于CIFAR100的SSLD蒸馏实验	PaddleClas	更多飞桨案例

返回⤴️

👉竞赛类

领域	竞赛案例	来源	介绍
机器学习	【Paddle打比赛】个贷违约预测Baseline+ 0.607	开发者w5688414	DataFountain个贷违约预测，参考官方的baseline并用paddle进行改进
NLP	【Paddle打比赛】讯飞赛题—中文问题相似度挑战赛0.9+Baseline	PaddleEdu	中文问题相似度挑战赛paddle版本Baseline，基于paddlenlp通过预训练模型的微调完成问题相似度评定任务
NLP	基于PaddleHub的疫情期间网民情绪识别	开发者CChan	本项目为疫情期间网民情绪识别比赛的解决方案。使用了PaddleHub和ERNIE实现对疫情期间微博文本的情绪识别。
NLP	【Paddle打比赛】产品评论观点提取竞赛baseline	开发者w5688414	DataFountain基于BERT的产品评论观点提取竞赛baseline，增加了优化方法
NLP	【Paddle打比赛】剧本角色情感识别baseline-精度0.676	开发者w5688414	剧本角色情感识别baseline，使用bert模型
语音	【Paddle打比赛】语音合成	开发者XYZ_916	2021 新网银行智能语音大赛baseline。截止2021.11.17，该方案在总分榜第一，作品榜第二
CV	中文场景文字识别挑战赛baseline	小度AIStudio	中文场景文字识别挑战赛的baseline项目, 用于参赛选手借鉴参考
CV	【Paddle打比赛】手写字体OCR识别竞赛baseline	开发者Pink peach	2021世界人工智能创新大赛，手写字体OCR识别竞赛baseline
CV	2020 CCF BDCI: 遥感影像地块分割baseline	开发者lxastro	2020 CCF BDCI: 遥感影像地块分割的baseline模型库，包括baseline模型的训练方法和比赛的评测脚本。
CV	第三届**AI+创新创业大赛：半监督学习目标定位竞赛第1名方案	开发者张牙舞爪	半监督学习目标定位竞赛第一名方案分享 A榜得分0.81425 B榜得分0.80428
数据挖掘	【Padddle打比赛】心电图智能诊断竞赛Baseline-0.6765	开发者w5688414	AIWIN 心电图智能诊断竞赛

返回⤴️

👉汇总

飞桨各产品学习资料汇总

产品	视频课程	学习文档
PaddleGAN	生成对抗网络七日打卡营
PaddleOCR	OCR自动标注小工具讲解、3.5M超轻量实用OCR模型解读、OCR应用与部署实战
PaddleClas	PaddleClas系列直播课
PaddleDetection	目标检测7日打卡营
PaddleX	PaddleX实例分割任务详解、PaddleX目标检测任务详解、PaddleX语义分割任务详解、PaddleX图像分类任务详解、PaddleX客户端操作指南、飞桨全流程开发工具PaddleX
PaddleHub	手把手教你转换PaddleHub模型教程
VDL	可视化分析工具助力AI算法快速开发、深度学习算法可视化调优实战演示
高层API	高层API助你快速上手深度学习
PaddleNLP	基于深度学习的自然语言处理

返回⤴️

三、技术交流

非常感谢您使用本项目。您在使用过程中有任何建议或意见，可以在 Issue 上反馈给我们，也可以通过扫描下方的二维码联系我们，飞桨的开发人员非常高兴能够帮助到您，并与您进行更深入的交流和技术探讨。

四、许可证书

本项目的发布受Apache 2.0 license许可认证。

五、贡献内容

本项目的不断成熟离不开各位开发者的贡献，如果您对深度学习知识分享感兴趣，非常欢迎您能贡献给我们，让更多的开发者受益。

本项目欢迎任何贡献和建议，大多数贡献都需要你同意参与者许可协议（CLA）来声明你有权并实际上授权我们可以使用你的贡献。

代码贡献规范

pip install pre-commit

pre-commit install

添加修改的代码后，对修改的文件进行代码规范，pre-commit 会自动调整代码格式，执行一次即可，后续commit不需要再执行。提交pr流程，详见：awesome-DeepLearning 提交 pull request 流程。

贡献者

以下是awesome-DeepLearning贡献者列表： yang zhou，Niki_173，Twelveeee，buriedms，AqourAreA，zhangjin12138，rerny，LiuCongNLP，LemonCherryFu, lutianhao

awesome-deeplearning's People

Contributors

Stargazers

Watchers

Forkers

ldoublev sunmingyang1987 elena-github zhenwuliu xyzhou-puck connor-idea ququ600 zxy3 txssg xiaomujiang txd1jsw zdshooter mitchell-dream shanxf1992 myxiao2019 bamboo-aha zjanet yongsgithub scutyusong shitouzdl yyhithub8 jlzz csy199509 lcsss1995 m3lab-ltu sijia-w shaochenglong mengxuertang wangnaa a-pai liuzhangyuan lvjian0706 1649759610 han508 y-long28 kevinxu816 lijunming1234 zhanghandi 3301085375 maplemoonsky psile rawat999 seracfloe an1018 suncc1 shishumo leomengkk waldenruc xiaoyangyang2 jimmy-zhu feixliu shanetian linaom1214 fisher2008 wynshiter seafyliang fzzcode trefoil0219 frankfan007 allensmile wuzuowuyou curious-developers ailyanlu1 mingkin qyan0131 yotofu thinkall huangweiboy2 cynthiazv xieshiyu9527 pweawhctochero libertatis yaoshanliang tuzferrgo not-today sallenkey-wei josonchen yunchunrui pangpang20 wwhio xqzping diyi1999 yuanshuailan haowangyin ricardosz yueyedeai powellsz 515832953 jianengli fly-hub jameskitfu hangjianjun1972 hongyu9000 yanzhuangzhuang123 heysupermelon ricardo-yyz watersward robinwanglb qch-top naturelanguageqing

awesome-deeplearning's Issues

工业表计读数例程运行出错

我的版本是paddlex==1.3.11
报错
File "/home/xs/.local/lib/python3.8/site-packages/paddlex/cv/models/load_model.py", line 43, in load_model
raise Exception("There's no attribute {} in paddlex.cv.models".format(
Exception: There's no attribute PPYOLOv2 in paddlex.cv.models
后尝试用2.0.0
报错
if data.dtype == np.object:
Your running script needs PaddleX<2.0.0, please refer to https://github.com/PaddlePaddle/PaddleX/tree/release/2.0-rc/tutorials/train#%E7%89%88%E6%9C%AC%E5%8D%87%E7%BA%A7 to solve this issue.

背景图数量问题

在用paddlex训练模型时，加入add_negative_samples方法时，背景图数量是有限制的吗？如果有数量现状，数值是多少呢？我添加500张和200张都会报错，130张时可以正常训练，而且精度反而下降0.3左右，不知道是啥原因。还望解答，非常感谢。

零基础实践深度学习的AlexNet进行眼疾识别，查看数据形状部分，代码是否前后不一致？

文件位置：junior_class/chapeter-3-Computer_Vision/notebook/3-2-CV-Image_Classification.ipynb
前面定义数据读取器时，训练集和验证集的读取器是分开定义的

# 训练集读取器
def data_loader(datadir, batch_size=10, mode = 'train'):
# 验证机读取器
def valid_data_loader(datadir, csvfile, batch_size=10, mode='valid'):

然而后面查看数据形状的部分代码中，却都调用data_loader而只是传不同的mode参数

# 查看数据形状
DATADIR = '/home/aistudio/work/palm/PALM-Training400/PALM-Training400'
train_loader = data_loader(DATADIR, 
                           batch_size=10, mode='train')
data_reader = train_loader()
data = next(data_reader)
data[0].shape, data[1].shape

eval_loader = data_loader(DATADIR, 
                           batch_size=10, mode='eval')
data_reader = eval_loader()
data = next(data_reader)
data[0].shape, data[1].shape

注意力机制章节位置错误

计算每个预测向量对图片的梯度时报错

问题是这样的。我想计算每个类别中预测向量的分量对于图片的梯度，代码是这样的

for k in range(num_classes):
# 如果下标与预测标签下标一致，跳过
if k == index_0:
continue
pred_k = predict[k]
grad_k = paddle.grad(pred_k,adv_img,retain_graph=True, create_graph=True)[0]

pred_k 是第k个类别的分量，然后我用grad进行计算时，报错了。报错内容是(NotFound) The Op dropout_grad doesn't have any grad op。这我就很不理解了。
恳请大佬指点

跑多类别车辆跟踪的训练demo时，缺少一个基础配置文件configs/mot/mcfairmot/../../datasets/mcmot_vehicle.yml'，从哪下载

FileNotFoundError: [Errno 2] No such file or directory: 'configs/mot/mcfairmot/../../datasets/mcmot_vehicle.yml'

perplexity的文档中表述错误

在docs/tutorials/deep_learning/metrics/perplexity.md这个文档中描述语言模型在测试集上的困惑度越高，则代表语言模型训练地越好，反之亦然。这里根据上文介绍应该是困惑度perplexity越低则模型越好才对吧。请您查看是否存在问题。

文档丢失

面试宝典中的关于归一化的几个文档丢失

一些文档中的错别字

1. 错别字

登场 → 等长

由 → 有
https://paddlepedia.readthedocs.io/en/latest/tutorials/deep_learning/model_tuning/attention/classic_attention.html

预训练文件

VIT在ImageNet的预训练模型什么时候能做出来呢

如何将眼疾识别项目的训练模块中二分类的代码部分修改为适用于多个标签分类的代码？

项目想利用fer2013的数据集去训练识别3种表情的vgg网络
以下是项目链接
https://aistudio.baidu.com/aistudio/projectdetail/2351692?shared=1
具体问题位于项目“4.训练函数启动定义”之后的code段
源代码大部分选自于“百度架构师手把手带你零基础实践深度学习”中的眼疾识别项目

文档丢失

我点击面试宝典里的

打开后是这样的：

或许有其他文档也丢失了，麻烦一起补充一下，谢谢

transformer_courses/Transformer_Machine_Translation 找不到zh-en/train.tags.zh-en.zh.cut.txt文件

问题位置

https://github.com/PaddlePaddle/awesome-DeepLearning/tree/master/transformer_courses/Transformer_Machine_Translation

问题现象

在按照README进行bpe分词处理时，sh subword.sh命令执行错误，找不到zh-en/train.tags.zh-en.zh.cut.txt文件。

复现方式

安装完依赖并且获取数据集后，执行bpe分词处理

python data_process.py
sh subword.sh #出错命令
python bpe_process2.py

解决方法

浏览例程代码后，发现zh-en/train.tags.zh-en.zh.cut.txt文件是通过bpe_process.py脚本生成。将其添加到sh subword.sh命令前执行即可。

python data_process.py
python bpe_process.py
sh subword.sh
python bpe_process2.py

深度学习百问里面部分无图

https://paddlepedia.readthedocs.io/en/latest/tutorials/CNN/convolution_operator/Dilated_Convolution.html
此链接里面没有图4

paddle Edu里面部分图片无法显示的问题

地址：https://paddlepedia.readthedocs.io/en/latest/tutorials/deep_learning/basic_concepts/neuron.html
情况：

等地方图片均无法显示，非GitHub疑似非网络问题（GitHub普遍存在但是涉及网络无法加载部分可以理解，是否就这个问题能不能出一个好的解决方案？及解决近期大量GitHub无法登入和加载的问题？）
辛苦了！端午安康！

文档错误

https://paddlepedia.readthedocs.io/en/latest/tutorials/deep_learning/metrics/perplexity.html
这里

一般来讲，用于评判语言模型的测试集均是合理的、高质量的语料，只要语言模型在测试集上的困惑度越高，则代表语言模型训练地越好，反之亦然。

应该是测试集上困惑度越低，越好.

LSTM网络训练分类任务loss降不下去

子类亚类的概念

https://github.com/PaddlePaddle/awesome-DeepLearning/blob/master/Paddle_Enterprise_CaseBook/Hemtle%20Detection/accuracy_improvement.md
在上面安全帽检测项目精度优化文档里面，提及了子类亚类的概念，麻烦详细解释下概念？谢谢。

data_prepare()方法

https://aistudio.csdn.net/62f9f9fcb99b4c6e4e63d786.html
在“基于百度自研模型ERNIE进行事件抽取任务”这篇文章里，将DUEE数据集处理为BIO标注的数据时，用到的data_prepare()方法请问可以分享吗？

一文读懂BiLSTM+CRF实现命名实体识别的公式错误

图里公式的两个不等号写反了，如果按照图里的假设，beta_2应该为[0,1]

零基础实践深度学习，LeNet在手写数字识别上的应用，网络结构定义的前向计算中激活函数位置不对

notebook中的前向计算定义代码如下，代码的注释中说每个卷积层使用Sigmoid激活函数，但实际Sigmoid函数的位置并不是这样。

# 网络的前向计算过程
    def forward(self, x):
        x = self.conv1(x)
        # 每个卷积层使用Sigmoid激活函数，后面跟着一个2x2的池化
        x = F.sigmoid(x)
        x = self.max_pool1(x)
        x = F.sigmoid(x)
        x = self.conv2(x)
        x = self.max_pool2(x)
        x = self.conv3(x)
        # 尺寸的逻辑：输入层将数据拉平[B,C,H,W] -> [B,C*H*W]
        x = paddle.reshape(x, [x.shape[0], -1])
        x = self.fc1(x)
        x = F.sigmoid(x)
        x = self.fc2(x)
        return x

是否应该是下面这样？

# 网络的前向计算过程
    def forward(self, x):
        x = self.conv1(x)
        # 每个卷积层使用Sigmoid激活函数，后面跟着一个2x2的池化
        x = F.sigmoid(x)
        x = self.max_pool1(x)
        x = self.conv2(x)
        x = F.sigmoid(x)
        x = self.max_pool2(x)
        x = self.conv3(x)
        x = F.sigmoid(x)
        # 尺寸的逻辑：输入层将数据拉平[B,C,H,W] -> [B,C*H*W]
        x = paddle.reshape(x, [x.shape[0], -1])
        x = self.fc1(x)
        x = F.sigmoid(x)
        x = self.fc2(x)
        return x

已签署 CLA 后始终显示未签署

点击进入签署页面会显示已签署，但是在 pr 页面仍显示未签署，可能与上传时的 git 用户名与 github 用户名不同导致的？

tutorials/chapter-3-Computer_Vision/3-2-CV-Image_Classification.ipynb 眼疾数据集未公开，无法下载

有关飞桨产业实践案例的问题---智慧交通

您好！请问飞桨产业实践案例中有没有关于车辆3D检测的案例资料和相关数据集？类似于下面图中课程介绍的这个智慧交通应用。

怎么自定义优化器指标、自定义网络用到padlle的高阶API训练

百度架构师手把手带你零基础实践深度学习---文本情感倾向性分析中代码运行后准确率很低

文本情感倾向性分析中代码运行后准确率很低
acc只有75.7%，请问是正常的吗
https://aistudio.baidu.com/bdvgpu/hub/user/253884/2095464/notebooks/2095464.ipynb

运行多类别车辆跟踪时，按要求更换评估集后，评估结果为0，后发现缺少sequences文件夹，但不知道该文件是如何生成的

训练时，如何只保存准确率最高的模型和最后一个模型final.pdparams

我只想保存这两个模型，不然太占空间了

公式显示问题

[Call for Contribution] Tutorials for PaddlePaddle 2.1（基于飞桨2.1的应用案例教程建设）

1. 目标

目前飞桨框架2.1版本已经发布，不久的将来即将发布2.2正式版，在2.1版本中，飞桨框架面向用户体验做了一系列的升级优化
。为了能够让用户快速掌握到飞桨框架升级内容，并了解和学习如何使用2.1进行相关任务的开发，我们进行应用案例教程的立项，在不同的任务场景上为用户提供一个端到端的易学案例，来快速的传递相关知识和使用方法。

在此呼吁广大的飞桨开发者来一起共建我们的应用案例教程，努力为用户提供更加优质的示例教程，为用户学会使用框架铺设一条高速公路。

2. 教程清单

目前我们从已有内容和待补充方向进行了初步评估，梳理了以下建议的选题方向和题目，并为大家提供了比较优秀的对标文章进行学习参考，大家可以从这个列表中选择自己想要进行贡献的题目，或者也可以进行非列表内的题目自选。

招募列表（8.23日公开）

序号	领域	题目	参考	认领人
01	机器学习	负荷预测 0.1	负荷预测0.1 - 飞桨AI Studio	linsl1986
02	NLP	基于TextCNN的THUCNews文本分类任务
03	NLP	基于seq2seq的WMT-16机器翻
04	NLP	基于预训练模型完成实体关系抽取	『NLP打卡营』实践课4 基于预训练模型完成实体关系抽取 - 飞桨AI Studio
05	NLP	CCKS 2021篇章级事件元素抽取	CCKS 2021篇章级事件元素抽取 - 飞桨AI Studio - 人工智能学习实训社区
06	语音	动手搭建轻量级机器同传翻译系统	『NLP打卡营』实践课8：动手搭建轻量级机器同传翻译系统 - 飞桨AI Studio
07	CV	深入了解DeepLabv3图像分割算法		lutianhao
08	CV	基于SlowFast的视频分类		KHB1698
09	推荐	局部敏感哈希原理解读
10	推荐	DeepFM的原理解读		sleepingxin
11	推荐	GNN的原理解读
12	推荐	Wide&Deep的原理解读
13	推荐	youtubeDNN原理解读
14	强化学习	SAC算法实现月球着陆器着陆	基于飞桨复现强化学习进阶算法SAC，让月球着陆器顺利着陆 - 飞桨AI Studio
15	强化学习	PPO算法实现四轴飞行器	PARL框架下入门PPO：一个战胜世界冠军的强化学习算法
16	强化学习	AlphaZero下五子棋
17	强化学习	MuZero实现CartPole	极简MuZero算法实践——Paddle2.0版本 - 飞桨AI Studio
18	NLP	情话生成送给你	发愁七夕文案？PaddleHub情话生成送给你 (文内含七夕抽奖) - 飞桨AI Studio
19	NLP	使用预训练模型实现快递单信息抽取	『NLP打卡营』实践课3：使用预训练模型实现快递单信息抽取 - 飞桨AI Studio
20	NLP	恶意网页识别	使用PaddleNLP进行恶意网页识别（七）：网页二维码解析识别思路与实现 - 飞桨AI Studio
21	OCR	车牌识别	PaddleOCR：车牌识别 - 飞桨AI Studio
22	GAN	天下第一AI武道会-Deepfake换脸	天下第一AI武道会-Deepfake换脸 - 飞桨AI Studio
23	GAN	老北京城影像修复	老北京城影像修复 - 飞桨AI Studio	KHB1698
24	GAN	精准唇形合成	【飞桨创意之星】宋代诗人念诗的秘密--PaddleGAN实现精准唇形合成 - 飞桨AI Studio
25	Video	给视频打标签		Skye2099
26	Video	基于PaddleVideo定位精彩足球动作
27	CV	基于PP-YOLOv2实现标注物检测
28	推荐	基于深度学习的音乐推荐	july-ML6-final-project/wsdm_music_recommendation: Final project for July Recommendation course
29	强化学习	DQN算法玩合成大西瓜	PARL强化学习——合成大西瓜 - 飞桨AI Studio	tangjitingji
30	CV	来自肺部 CT 扫描的 3D 图像分类	3D image classification from CT scans	KHB1698

招募列表外开发者主动贡献列表

3. 贡献指南

3.1 飞桨框架2.1版本安装和使用

飞桨（PaddlePaddle）版本统一使用2.1最新版，安装说明：https://www.paddlepaddle.org.cn/install/quick。
2.1版本使用教程：https://www.paddlepaddle.org.cn/documentation/docs/zh/guides/index_cn.html。
2.1版本已有应用实践教程：https://www.paddlepaddle.org.cn/documentation/docs/zh/tutorial/index_cn.html。

3.2 题目认领

可以在上面提供的列表中进行题目选择或自选题目，并将确定的题目回复到本Issue中，方便他人同步知晓已开展的文章列表信息，避免重复选题。

3.3 教程编写

应用案例教程统一使用Notebook格式（.ipynb）来进行编写，可以在本地安装使用Jupyter开发，或使用AIStudio（https://aistudio.baidu.com）。

为了方便大家进行教程的编写，并统一阅读体验，下面为大家提供了一个简单的概要框架，大家根据实际任务按照下面的框架结构进行内容编写和组织，可以结合实际场景进行微调。如果对模板有一些建议我们也可以在下面进行回复讨论。

# 题目

作者信息：Github ID (github个人主页URL)

## 1. 简要介绍
简单的一段文字介绍本案例场景和用到的一些知识点，不用太复杂的讲述知识细节，

## 2. 环境设置
导入包，运行一些初始化方法

## 3. 数据集
讲述数据集的一些基础信息，描述数据集组成等。进行数据集的下载、抽样查看、数据集定义等。

## 4. 模型组网
基于Layer定义模型网络结构，模型的可视化展示。可以概要讲述一些网络结构代码设计的原因。

## 5. 模型训练
使用模型网络结构和数据集进行模型训练。需要讲述一些实践中的知识点。

## 6. 模型评估
使用评估数据评估训练好的模型。

## 7. 模型预测
对模型进行预测，展示效果。

3.4 教程上传

写好的文档通过向[https://github.com/PaddlePaddle/docs)仓库提交Pull Request的方式来进行教程文档的上传。
对提交好的PR可以指定Reviewer TCChenlong）、tngt进行内容和代码的评审，通过后会由具有Merge权限的同学进行最终的合入。

3.5 一些原则

代码封装得当，易读性好，不用一些随意的变量/类/函数命名。
注释清晰，不仅说明做了什么，也要说明为什么这么做。
文字部分暂时不用考虑国际化，先统一使用中文编写，注意概念和描述的清晰度，尽量让大家通俗易懂，如果实在难以解释，可以给出一些能够详细介绍的页面链接。
代码编写过程中能使用高层API的部分就使用高层API，无法使用高层API的部分就使用基础API。高层API使用指南：链接
做好代码的自测工作，每段代码块需要有运行结果。

4. 已合入仓库的教程

目前已经有13篇基于飞桨2.0的教程贡献，查看方式：

Repo目录查看已经Merge的Notebook源文件：docs/practices。
查看官网渲染后的页面：应用实践。

5. 还有不清楚的怎么办？

欢迎大家随时在这个Issue下进行提问。

非常感谢大家一起来贡献！共建飞桨繁荣社区！

公式有点小毛病

归一化那块，第6节公式里的a和b是不是反了呀

from d2l import torch as d2l仍然需要么

既然是改为paddle，如果没有torch环境，from d2l import torch as d2l无法运行，请问如何解决呢？

多卡训练出错-paddle2.1.2

我采用单卡训练是没问题的：python -m paddle.distributed.launch --gpus '0' train.py
但是多卡的时候：python -m paddle.distributed.launch --gpus '0,1' train.py
就会出现如下问题：
NotImplementedError: (Unimplemented) Place CUDAPlace(0) is not supported. Please check that your paddle compiles with WITH_GPU, WITH_XPU or WITH_ASCEND_CL option or check that your train process set the correct device id if you use Executor. (at /paddle/paddle/fluid/platform/device_context.cc:88)
[operator < gaussian_random > error]
Traceback (most recent call last):
File "train.py", line 204, in
model = MNIST()
File "train.py", line 94, in init
self.conv1 = Conv2D(in_channels=1, out_channels=20, kernel_size=5, stride=1, padding=2)
File "/root/anaconda3/lib/python3.8/site-packages/paddle/nn/layer/conv.py", line 633, in init
super(Conv2D, self).init(
File "/root/anaconda3/lib/python3.8/site-packages/paddle/nn/layer/conv.py", line 132, in init
self.weight = self.create_parameter(
File "/root/anaconda3/lib/python3.8/site-packages/paddle/fluid/dygraph/layers.py", line 411, in create_parameter
return self._helper.create_parameter(temp_attr, shape, dtype, is_bias,
File "/root/anaconda3/lib/python3.8/site-packages/paddle/fluid/layer_helper_base.py", line 369, in create_parameter
return self.main_program.global_block().create_parameter(
File "/root/anaconda3/lib/python3.8/site-packages/paddle/fluid/framework.py", line 2895, in create_parameter
initializer(param, self)
File "/root/anaconda3/lib/python3.8/site-packages/paddle/fluid/initializer.py", line 355, in call
op = block.append_op(
File "/root/anaconda3/lib/python3.8/site-packages/paddle/fluid/framework.py", line 2921, in append_op
_dygraph_tracer().trace_op(type,
File "/root/anaconda3/lib/python3.8/site-packages/paddle/fluid/dygraph/tracer.py", line 43, in trace_op
self.trace(type, inputs, outputs, attrs,
NotImplementedError: (Unimplemented) Place CUDAPlace(0) is not supported. Please check that your paddle compiles with WITH_GPU, WITH_XPU or WITH_ASCEND_CL option or check that your train process set the correct device id if you use Executor. (at /paddle/paddle/fluid/platform/device_context.cc:88)
[operator < gaussian_random > error]

第7章节内notebook下文件编号错误

智慧城市-异常行为识别部分文件缺失

智慧城市-异常行为识别部分文件缺失
tools/infer_batch.py、ava_predict.py、export_model.py、predict.py等文件
main.py
配置参数文件
等其他缺失文件

百度架构师手把手带你零基础实践深度学习课节8：图像分类是否存在编写错误

第三模块：包含4×4的120通道卷积。卷积之后的图像尺寸减小到1，但是通道数增加为120。将经过第3次卷积提取到的特征图输入到全连接层。第一个全连接层的输出神经元的个数是64，第二个全连接层的输出神经元个数是分类标签的类别数，对于手写数字识别的类别数是10。然后使用Softmax激活函数即可计算出每个类别的预测概率。

定义 LeNet 网络结构

class LeNet(paddle.nn.Layer):

此处的num_classes=1是否存在编写错误？
def init(self, num_classes=1):
super(LeNet, self).init()
# 创建卷积和池化层
# 创建第1个卷积层
self.conv1 = Conv2D(in_channels=1, out_channels=6, kernel_size=5)
self.max_pool1 = MaxPool2D(kernel_size=2, stride=2)
# 尺寸的逻辑：池化层未改变通道数；当前通道数为6
# 创建第2个卷积层
self.conv2 = Conv2D(in_channels=6, out_channels=16, kernel_size=5)
self.max_pool2 = MaxPool2D(kernel_size=2, stride=2)
# 创建第3个卷积层
self.conv3 = Conv2D(in_channels=16, out_channels=120, kernel_size=4)
# 尺寸的逻辑：输入层将数据拉平[B,C,H,W] -> [B,CHW]
# 输入size是[28,28]，经过三次卷积和两次池化之后，CHW等于120
self.fc1 = Linear(in_features=120, out_features=64)
# 创建全连接层，第一个全连接层的输出神经元个数为64，第二个全连接层输出神经元个数为分类标签的类别数
self.fc2 = Linear(in_features=64, out_features=num_classes)
# 网络的前向计算过程
def forward(self, x):
x = self.conv1(x)
# 每个卷积层使用Sigmoid激活函数，后面跟着一个2x2的池化
x = F.sigmoid(x)
x = self.max_pool1(x)
x = F.sigmoid(x)
x = self.conv2(x)
x = self.max_pool2(x)
x = self.conv3(x)
# 尺寸的逻辑：输入层将数据拉平[B,C,H,W] -> [B,CHW]
x = paddle.reshape(x, [x.shape[0], -1])
x = self.fc1(x)
此处按照上述文字是否应该使用F.softmax?
x = F.sigmoid(x)
x = self.fc2(x)
return x

本人为初学者，望解答，谢谢

如果自定义数据集，如何使用label studio标注意图识别和槽位识别数据集呢？

准备用《零基础实践深度学习》做教材，请问如何获得教材配套的ppt？

准备用《零基础实践深度学习》做教材，请问如何获得配套的ppt？

波士顿房价预测归一化处理的疑问

小白一枚，按飞桨官方“零基础实践深度学习”教程，学习波士顿房价预测。有段做数据归一化处理求每列最大值，最小值，平均值的代码：

def load_data():

从文件导入数据

datafile = './work/housing.data'
data = np.fromfile(datafile, sep=' ')

每条数据包括14项，其中前面13项是影响因素，第14项是相应的房屋价格中位数

feature_names = [ 'CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE',
'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'MEDV' ]
feature_num = len(feature_names)

将原始数据进行Reshape，变成[N, 14]这样的形状

data = data.reshape([data.shape[0] // feature_num, feature_num])

将原数据集拆分成训练集和测试集

这里使用80%的数据做训练，20%的数据做测试

测试集和训练集必须是没有交集的

ratio = 0.8
offset = int(data.shape[0] * ratio)
training_data = data[:offset]

计算训练集的最大值，最小值，平均值

maximums, minimums, avgs = training_data.max(axis=0), training_data.min(axis=0),
training_data.sum(axis=0) / training_data.shape[0]

对数据进行归一化处理

for i in range(feature_num):
#print(maximums[i], minimums[i], avgs[i])
data[:, i] = (data[:, i] - minimums[i]) / (maximums[i] - minimums[i])

训练集和测试集的划分比例

training_data = data[:offset]
test_data = data[offset:]
return training_data, test_data

这里很是疑惑的地方，求每列最大值，最小值，平均值，用的数据集是训练数据集training_data = data[:offset]，为何不是全部的数据集呢？

特意查了下min-max标准化，这种方法有个缺陷就是当有新数据加入时，可能导致max和min的变化，需要重新定义。按官方给的代码取80%训练集求得min-max,那test_data应该会有问题！

强化学习的代码求求了

interpretdl-特征可视化

请问我使用https://blog.csdn.net/PaddlePaddle/article/details/114609592这里面的教程

visualize_grayscale(gradients[0]) #将结果转化为灰度图，
对于这一句代码我并没有找到库或是源文件什么的
加入我想要把特征激活的图转换灰度的需要怎么做呢（例如：把激活的地方就是白色未激活的就是黑色）
十分感谢你们的回复！

特色课 - Transformer系列的 notebook链接显示为未公开项目？

notebook链接看不了？

PaddleDetection测试test_architecture.py代码运行报错

一开始运行显示没有ppdet这个模块，我搜索的解决办法是添加路径

添加路径在test_architecture.py文件里后运行报错


请问如何解决呢？

3-3-CV-Object_Detection.ipynb 代码

 # 对batchsize进行循环，依次处理每张图片
    for n in range(batchsize):
        # 对图片上的真实框进行循环，依次找出跟真实框形状最匹配的锚框
        for n_gt in range(len(gt_boxes[n])):
            gt = gt_boxes[n][n_gt]
            gt_cls = gt_labels[n][n_gt]
            gt_center_x = gt[0]
            gt_center_y = gt[1]
            gt_width = gt[2]
            gt_height = gt[3]
            if (gt_height < 1e-3) or (gt_height < 1e-3): # 应该有一个是 gt_width 吧
                continue

“归一化不会改变数据的状态分布，但标准化会改变数据的状态分布”的疑惑

归一化不会改变数据的状态分布，但标准化会改变数据的状态分布，这句话的后半句如何理解呢？对吗，不是标准化也是线性变换吗？按道理不是不会因为对数据的处理而改变数据的原始数值排序吗？
谢谢~

yolov3数据读取

数据集为csv文件，读取bbox那一列时报错，我将bbox打印出来，错误如下：
The loss value printed in the log is the current step, and the metric is the average value of previous step.
Epoch 1/500
[0.25539652 0.5858491 0.19836193 0.38616353 0.6230101 0.67830193
0.24730836 0.46918243]
[0.7792283 0.5643961 0.11184206 0.23062788]
[0.30187854 0.2775 0.26897365 0.34833333 0.8616714 0.33833334
0.19524482 0.34333333]
ERROR:root:DataLoader reader thread raised an exception!
[0.8025461 0.5915411 0.12814969 0.3371958 ][0.3800206 0.46902418 0.27600414 0.62571114 0.78063846 0.4919463
0.31101957 0.55756444][0.7390249 0.7284802 0.31010672 0.21149425 0.23306131 0.65415066
0.25486502 0.37547892]

[0.38891497 0.512614 0.36167216 0.32222998 0.7768906 0.5151941
0.31376237 0.34344438]
[0.7358862 0.4776903 0.17449117 0.51093614 0.34561482 0.2646544
0.19531521 0.23534557 0.34956422 0.6089239 0.15438521 0.1994751 ]

SystemError Traceback (most recent call last)
in
31 verbose=1,
32 shuffle=True,
---> 33 num_workers=4)

/usr/local/lib/python3.6/dist-packages/paddle/hapi/model.py in fit(self, train_data, eval_data, batch_size, epochs, eval_freq, log_freq, save_dir, save_freq, verbose, drop_last, shuffle, num_workers, callbacks)
1493 for epoch in range(epochs):
1494 cbks.on_epoch_begin(epoch)
-> 1495 logs = self._run_one_epoch(train_loader, cbks, 'train')
1496 cbks.on_epoch_end(epoch, logs)
1497

/usr/local/lib/python3.6/dist-packages/paddle/hapi/model.py in _run_one_epoch(self, data_loader, callbacks, mode, logs)
1777 def _run_one_epoch(self, data_loader, callbacks, mode, logs={}):
1778 outputs = []
-> 1779 for step, data in enumerate(data_loader):
1780 # data might come from different types of data_loader and have
1781 # different format, as following:

/usr/local/lib/python3.6/dist-packages/paddle/fluid/dataloader/dataloader_iter.py in next(self)
786
787 if in_dygraph_mode():
--> 788 data = self._reader.read_next_var_list()
789 else:
790 if self._return_list:

SystemError: (Fatal) Blocking queue is killed because the data reader raises an exception.
[Hint: Expected killed_ != true, but received killed_:1 == true:1.] (at /paddle/paddle/fluid/operators/reader/blocking_queue.h:158)

[Call for Contribution] 深度学习百问建设

1.目标

当前飞桨在大力投入深度学习教育内容的建设，为了能够让用户快速掌握深度学习基础知识，我们进行深度学习百问的立项，快速传递深度学习相关知识的原理解读。
在此呼吁广大的飞桨开发者来一起共建我们的深度学习百问，努力为用户提供更加优质的知识点原理解释，为用户学会使用框架铺设一条高速公路。

2.深度学习百问清单

目前我们从已有内容和待补充方向进行了初步评估，梳理了以下建议的选题方向和题目，并为大家提供了比较优秀的模板进行学习参考，大家可以从这个列表中选择自己想要进行贡献的题目，如果想贡献的知识点并不在下面的列表中，大家可以填写自选列表，进行自选题目的贡献。

招募列表

序号	领域	题目	owner
01	数学知识	特征值特征向量（基本概念，并给一个例子计算特征值和特征向量）
02		泰勒展开（基本概念+例子）
03		贝叶斯理论（概念+一个类似于抛硬币的例子
04		熵；（从熵到交叉熵）
05		优化：一阶优化、二阶优化（一阶：随机梯度下降、动量、AdaGrad，二阶：牛顿法，共轭梯度法）
06		对偶理论（对偶问题的数学解释）
07		泛函；（定义和性质）
08		极大似然估计（理论加举例）
09		带约束的优化（等式约束的最优化问题，不等式约束的最优化，KTT条件）
10	机器学习	感知机；（定义，公式，图文并茂）
11		梯度下降及其改进；（图文并貌）
12		Logistic Regression（理论+实践）
13		线性回归（理论+实践）
14		knn算法（理论+实践）
15		决策树；（理论+实践）
16		高斯混合模型；（单搞斯模型，高斯混合模型，EM算法）
17		SVM;（公式推导）
18		模拟退火算法;（原理+实现步骤）
19		遗传算法（原理+特性+适用的问题）
20	深度学习基础知识	全连接层（详细介绍+图、缺点）	tughv
21		卷积和池化padding的same、valid介绍（给出例子）	zhangjin12138
22		CNN 模型所需的计算力（flops）和参数（parameters）数量计算（给出计算推导、例子）
23		深度学习中卷积的参数量和计算量（给出计算推导、例子）
24		超参数：补充超参数有哪些、参数和超参数的区别、如何寻找超参数的最优值
25		样本不平衡（理论、常用解决办法）
26		前向传播和反向传播(理论、推导过程+实例)
27		归一化方法（补充BN、GN、LN等方法介绍、优缺点、适用场景）
28		池化方法补充(新增现有池化方法介绍、文字+图+公式)
29		学习率衰减方法：基于repo已有的衰减方法，补充介绍，比如使用原因、优缺点等
30	NLP知识	BLEU评估指标原理讲解，要求有原理描述，又有例子讲解
31		ROUGE评估指标原理讲解，要求有原理描述，又有例子讲解
32		一文读懂深度循环神经网 Deep RNN
33		一文读懂双向循环神经网 BRNN
34		BeamSearch原理讲解，要求需要结合任务进行讲解，比如机器翻译任务
35		一文读懂textCNN模型原理
36		一文读懂fastText模型原理
37		一文读懂GloVe词向量训练
38		手把手带你实现RNN的反向传播
39		一文读懂循环神经网络的发展史（从RNN到LSTM，再到LSTM的各种变体，如GRU，CIFG，Peephole等），要求写清楚各个模型的区别与联系。
40	CV知识	图像分类任务综述（从传统方法、到深度学习算法脉络梳理，单标签、多标签、粗细粒度分类任务介绍，常用数据集，应用场景等介绍）
41		图像分割任务综述（任务背景以及应用场景，算法发展脉络，常用数据集）
42		OCR任务综述（任务背景以及应用场景，算法发展脉络，常用数据集）
43		视频理解任务综述（任务背景以及应用场景，算法发展脉络，常用数据集）
44		GAN任务综述（任务背景以及应用场景，算法发展脉络，常用数据集）	lutianhao
45		MatrixNMS原理介绍
46		基于现有数据增广内容进行补充（包括：完善现有数据增广方法介绍，新的数据增广方法补充，补充过程中如果有的话需要添加与其他方法的对比）
47		可变形卷积原理介绍（v1、v2两个版本都需要介绍，要求原理加示例）
48		CV方向损失函数补充（目标检测：Smooth-L1/GIoU/DIoU/CIoU/IoUAware；分割：dice loss/decoupledsegnet_relax_boundary_loss/dual task loss/edge attention loss/lovasz loss/）
49		CV方向评估指标补充（在已有基础上进行补充，包括：分类、检测、分割、OCR、GAN、Video各个方向评估指标介绍）
50	推荐系统	局部敏感哈希（最近邻搜索，基本原理，多桶策略等等）
51		Item2Vec（基本原理，特点，局限性等等）
52		Wide&Deep（结构，模型的记忆能力与泛化能力，推荐过程等）
53		AutoRec（基本原理，结构，推荐过程）
54		Deep Crossing（基本原理，结构，推荐过程）
55		Graph Embedding: Deep Walk,Node2Vec, EGES
56		FM模型（FNN，DEEPFM，NFM，FM等等）
57		NeuralCF模型（原理，结构，优缺点等）
58		基于强化学习的推荐（actor-critic原理，应用，推荐过程）
59	强化学习	强化学习经典例子/实验环境详解（多臂赌博机问题、悬崖行走问题、CartPole问题、迷宫游戏、MountainCar等等）
60		model based和model free的模型对比及优缺点
61		强化学习中的动态规划算法（包括策略迭代算法和值迭代算法，分别详解后再进行对比）
62		贝尔曼方程及状态值函数、状态-动作值函数
63		带基准线的REINFORCE算法详解

自选题目

序号	领域	题目	owner
64		ResNeXt和Res2Net的模型解读	zhangjin12138
65		语义分割任务综述	lutianhao

3.贡献指南

3.1题目认领

可以在上面提供的列表中进行题目选择或自选题目，并将确定的题目的序号及题目回复到本Issue中，方便他人同步知晓已开展的文章列表信息，避免重复选题。

3.2知识点编写

知识点统一使用markdown格式来进行编写，可以在本地安装使用Typora编写，或使用AIStudio（https://aistudio.baidu.com）。
为了方便大家进行教程的编写，并统一阅读体验，下面为大家提供了一个简单的概要框架，大家根据实际任务按照框架结构进行内容编写和组织，可以结合实际场景进行微调。

3.3编写原则

能够准确地对题目进行完整解释，且标题设置条理清晰，内容讲解洞解透彻，图文并茂。

标题条目清晰，能概括出文章内容；
内容讲解图文并茂，特别是重要或抽象部分，鼓励图像原创；
讲解内容，并有自己的真知灼见，且回答较好；
内容较为丰满，会有相关的内容拓展部分，以某项技术为例，某项技术的出现原因，技术的应用场景，技术的原理，技术相关的其他知识等等。

3.4知识点上传

写好的文档通过向https://github.com/PaddlePaddle/awesome-DeepLearning/tree/master/docs 仓库提交Pull Request的方式来进行教程文档的上传。注意更改教程中的目录地址
对提交好的PR可以指定Reviewer tngt进行内容和代码的评审，通过后会由具有Merge权限的同学进行最终的合入。

4其他问题

欢迎大家随时在这个Issue下进行提问。

非常感谢大家一起来贡献深度学习百问！共建飞桨教育繁荣社区！

官方答疑的QQ群进不了

公司招了一批新人，需要给他们培训，准备用AIStudio上的课程来让他们学习，上面图片的QQ群不能加入了。

动手学深度学习3.2节有误

features, labels两个变量都没有，看上下文是用的paddle_features paddle_labels
报错：

NameError                                 Traceback (most recent call last)
/tmp/ipykernel_21564/2487356068.py in <module>
      4 loss = squared_loss
      5 for epoch in range(num_epochs):
----> 6     for paddle_X, paddle_y in paddle_data_iter(batch_size, features, labels):
      7         l = loss(net(paddle_X, paddle_w, paddle_b), paddle_y)  # `paddle_X`和`paddle_y`的小批量损失
      8         # 因为`l`形状是(`batch_size`, 1)，而不是一个标量。`l`中的所有元素被加到一起，

NameError: name 'features' is not defined

代码：

lr = 0.03
num_epochs = 3
net = paddle_linreg
loss = squared_loss
for epoch in range(num_epochs):
    for paddle_X, paddle_y in paddle_data_iter(batch_size, features, labels):
        l = loss(net(paddle_X, paddle_w, paddle_b), paddle_y)  # `paddle_X`和`paddle_y`的小批量损失
        # 因为`l`形状是(`batch_size`, 1)，而不是一个标量。`l`中的所有元素被加到一起，
        # 并以此计算关于[`paddle_w`, `paddle_b`]的梯度
        l.sum().backward()
        paddle_sgd([paddle_w, paddle_b], lr, batch_size)  # 使用参数的梯度更新参数
    with paddle.no_grad():
        paddle_train_l = loss(net(paddle_features, paddle_w, paddle_b), paddle_labels)
        print(f'epoch {epoch + 1}, loss {float(pddle_train_l.mean()):f}')

修改后会报错

---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
/tmp/ipykernel_21564/4159795007.py in <module>
      8         # 因为`l`形状是(`batch_size`, 1)，而不是一个标量。`l`中的所有元素被加到一起，
      9         # 并以此计算关于[`paddle_w`, `paddle_b`]的梯度
---> 10         l.sum().backward()
     11         paddle_sgd([paddle_w, paddle_b], lr, batch_size)  # 使用参数的梯度更新参数
     12     with paddle.no_grad():

AttributeError: 'numpy.float64' object has no attribute 'backward'

本身自己对这种从头开始写的情况不熟悉，想学习一下，现在跑不通。。。如果我懂，我能调通，但是我不懂，没法跑通，这样就学不会。。。陷入循环。

六、飞桨产业实践

毛遂自荐一波，六、飞桨产业实践的人摔倒检测可以参考一下我的这个项目：https://aistudio.baidu.com/aistudio/projectdetail/2071768

paddlepaddle / awesome-deeplearning Goto Github PK

awesome-deeplearning's Introduction

一、项目简介

如果本项目对您有帮助，欢迎点击网页右上方进行star❤️

👨‍🏫我是高校用户

👨‍💻我是企业用户

二、项目内容

👉课程类

零基础实践深度学习

特色课 - Transformer系列

👉书籍类

《动手学深度学习》paddle版

👉宝典类

深度学习百问

👉案例类

飞桨应用案例集

飞桨学术案例集

👉竞赛类

👉汇总

飞桨各产品学习资料汇总

三、技术交流

四、许可证书

五、贡献内容

代码贡献规范

贡献者

awesome-deeplearning's People

Contributors

Stargazers

Watchers

Forkers

awesome-deeplearning's Issues

1. 错别字

2. 格式错误

3. 链接跳转

4. 图片显示问题

问题位置

问题现象

复现方式

解决方法

1. 目标

2. 教程清单

招募列表（8.23日公开）

招募列表外开发者主动贡献列表

3. 贡献指南

3.1 飞桨框架2.1版本安装和使用

3.2 题目认领

3.3 教程编写

3.4 教程上传

3.5 一些原则

4. 已合入仓库的教程

5. 还有不清楚的怎么办？

定义 LeNet 网络结构

从文件导入数据

每条数据包括14项，其中前面13项是影响因素，第14项是相应的房屋价格中位数

将原始数据进行Reshape，变成[N, 14]这样的形状

将原数据集拆分成训练集和测试集

这里使用80%的数据做训练，20%的数据做测试

测试集和训练集必须是没有交集的

计算训练集的最大值，最小值，平均值

对数据进行归一化处理

训练集和测试集的划分比例

[0.38891497 0.512614 0.36167216 0.32222998 0.7768906 0.5151941 0.31376237 0.34344438] [0.7358862 0.4776903 0.17449117 0.51093614 0.34561482 0.2646544 0.19531521 0.23534557 0.34956422 0.6089239 0.15438521 0.1994751 ]

1.目标

2.深度学习百问清单

招募列表

自选题目

3.贡献指南

3.1题目认领

3.2知识点编写

3.3编写原则

3.4知识点上传

4其他问题

Recommend Projects

Recommend Topics

Recommend Org

[0.38891497 0.512614 0.36167216 0.32222998 0.7768906 0.5151941
0.31376237 0.34344438]
[0.7358862 0.4776903 0.17449117 0.51093614 0.34561482 0.2646544
0.19531521 0.23534557 0.34956422 0.6089239 0.15438521 0.1994751 ]