Awesome-DeepLearning-Knoweledge

NLP

完全图解RNN、RNN变体、Seq2Seq、Attention机制
https://zhuanlan.zhihu.com/p/28054589
一文搞懂RNN（循环神经网络）基础篇
https://zhuanlan.zhihu.com/p/30844905

机器学习

决策树(Decision Tree)
https://zhuanlan.zhihu.com/p/30059442
PCA
https://www.zhihu.com/question/41120789/answer/481966094
零基础学SVM
https://zhuanlan.zhihu.com/p/24638007
kmeans
https://zhuanlan.zhihu.com/p/75477709
LR逻辑回归
https://zhuanlan.zhihu.com/p/73608677
随机森林
https://www.zhihu.com/question/64043740/answer/644998828
集成学习（Ensemble Learning）
https://www.cnblogs.com/zongfa/p/9304353.html
八种常见机器学习对比
https://blog.csdn.net/Mason_Mao/article/details/82693701
ROC曲线 AUC https://blog.csdn.net/qq_30992103/article/details/99730059 https://www.bioinfo-scrounger.com/archives/767/

Pytorch

Pytorch详解NLLLoss和CrossEntropyLoss：
https://blog.csdn.net/qq_22210253/article/details/85229988
https://github.com/mepeichun/Efficient-Neural-Network-Bilibili/blob/master/4-Knowledge-Distillation
Pytorch中BCEloss, BCEwithlogitsloss的区别： https://blog.csdn.net/qq_22210253/article/details/85222093
Pytorch .detach的作用：
https://blog.csdn.net/qq_39709535/article/details/80804003
Pytorch Hook
https://zhuanlan.zhihu.com/p/75054200
pytorch中的广播机制

1. A.ndim > B.ndim, 并且A.shape最后几个元素包含B.shape, 比如下面三种情况, 注意不要混淆ndim和shape这两个基本概念
    A.shape=(2,3,4,5), B.shape=(3,4,5)
    A.shape=(2,3,4,5), B.shape=(4,5)
    A.shape=(2,3,4,5), B.shape=(5)
2. A.ndim == B.ndim, 并且A.shape和B.shape对应位置的元素要么相同要么其中一个是1, 比如
    A.shape=(1,9,4), B.shape=(15,1,4)
    A.shape=(1,9,4), B.shape=(15,1,1)

https://blog.csdn.net/littlehaes/article/details/103807303

Sequential的三种写法

net1 = nn.Sequential()
net1.add_module('conv', nn.Conv2d(3, 3, 3))
net1.add_module('batchnorm', nn.BatchNorm2d(3))
net1.add_module('activation_layer', nn.ReLU())
 
net2 = nn.Sequential(
        nn.Conv2d(3, 3, 3),
        nn.BatchNorm2d(3),
        nn.ReLU()
        )
 
from collections import OrderedDict
net3= nn.Sequential(OrderedDict([
          ('conv1', nn.Conv2d(3, 3, 3)),
          ('bn1', nn.BatchNorm2d(3)),
          ('relu1', nn.ReLU())
        ]))

调整学习率的方法

# 方法1: 调整学习率，新建一个optimizer
old_lr = 0.1
optimizer1 =optim.SGD([
                {'params': net.features.parameters()},
                {'params': net.classifier.parameters(), 'lr': old_lr*0.1}
            ], lr=1e-5)
 
# 方法2: 调整学习率, 手动decay, 保存动量
for param_group in optimizer.param_groups:
    param_group['lr'] *= 0.1 # 学习率为之前的0.1倍

nn.functional中的函数和nn.Module主要区别：

1. nn.Module实现的layers是一个特殊的类，都是有class layer(nn.Module)定义，会自动提取可学习的参数
2. nn.functional中的函数更像是纯函数，由def function(input)定义
3. 也就是说如果模型有可学习的参数，最好用nn.Module否则使用哪个都可以，二者在性能上没多大差异，
4. 对于卷积，全连接等具有可学习参数的网络建议使用nn.Module
5. 激活函数（ReLU,sigmoid,tanh），池化等可以使用functional替代。对于不具有可学习参数的层，将他们用函数代替，这样可以不用放在构造函数__init__中。

pytorch多卡训练的原理
https://blog.csdn.net/wyz6666/article/details/99484326

（1）将模型加载到一个指定的主GPU上，然后将模型浅拷贝到其它的从GPU上；
（2）将总的batch数据等分到不同的GPU上（坑：需要先将数据加载到主GPU上）；
（3）每个GPU根据自己分配到的数据进行forward计算得到loss，并通过backward得到权重梯度；
（4）主GPU将所有从GPU得到的梯度进行合并并用于更新模型的参数。
    https://blog.csdn.net/wyz6666/article/details/99484326

pytorch中train和eval有什么不同

(1). model.train()——训练时候启用
启用 BatchNormalization 和 Dropout，将BatchNormalization和Dropout置为True
(2). model.eval()——验证和测试时候启用
不启用 BatchNormalization 和 Dropout，将BatchNormalization和Dropout置为False

train模式会计算梯度，eval模式不会计算梯度。

DataLoader, DataSet, Sampler之间的关系 https://www.cnblogs.com/marsggbo/p/11308889.html

编程语言（Python）

python 深拷贝浅拷贝：
https://blog.csdn.net/zhubaoJay/article/details/90897028
https://www.csdn.net/gather_2f/MtjaIgysMjQwLWJsb2cO0O0O.html
python 序列化与反序列化
https://www.cnblogs.com/wangchunli-blogs/p/9949671.html
python垃圾回收机制

python采用的是引用计数机制为主，标记-清除和分代收集(隔代回收、分代回收)两种机制为辅的策略
计数机制
Python的GC模块主要运用了引用计数来跟踪和回收垃圾。
在引用计数的基础上，还可以通过“标记-清除”解决容器对象可能产生的循环引用的问题。通过分代回收以空间换取时间进一步提高垃圾回收的效率。
标记-清除：
标记-清除的出现打破了循环引用，也就是它只关注那些可能会产生循环引用的对象
缺点：该机制所带来的额外操作和需要回收的内存块成正比。
隔代回收
原理：将系统中的所有内存块根据其存活时间划分为不同的集合，每一个集合就成为一个“代”，垃圾收集的频率随着“代”的存活时间的增大而减小。也就是说，活得越长的对象，就越不可能是垃圾，就应该减少对它的垃圾收集频率。那么如何来衡量这个存活时间：通常是利用几次垃圾收集动作来衡量，如果一个对象经过的垃圾收集次数越多，可以得出：该对象存活时间就越长。

GIL全局解释器锁

在Cpython解释器才有GIL的概念，不是python的特点。
python在设计的时候，还没有多核的概念。因此，为了设计方便与线程安全，直接设计了一个锁：GIL锁
在一个进程下，一次只能有一个线程执行，以此来保证数据的安全性。
从这也可以看出，为多线程分配多个CPU，多个CPU也不会起作用，因为每次只能执行一个线程。所以python中的线程只能实现并发，不能实现真正的并行。

is和==的区别？

is:判断内存地址是否相等
==：判断数值是否相等

python中闭包，闭包的实质
https://www.jianshu.com/p/5582ca53d53e
解释继承

一个类继承自另一个类，也可以说是一个孩子类/派生类/子类，继承自父类/基类/超类，同时获取所有的类成员（属性和方法）。
继承使我们可以重用代码，并且还可以更方便地创建和维护代码。Python 支持以下类型的继承：
单继承- 一个子类类继承自单个基类
多重继承- 一个子类继承自多个基类
多级继承- 一个子类继承自一个基类，而基类继承自另一个基类
分层继承- 多个子类继承自同一个基类
混合继承- 两种或两种以上继承类型的组合

迭代器和生成器的区别

迭代器是一个更加抽象的概念，任何对象，如果它的类有next方法和iter方法返回自身。对于string、list、dict、tuple等这类容器对象，使用for循环遍历是很方便的。在后台for语句对容器对象调用iter()函数，iter()是Python的内置函数。iter()会返回一个定义了next()方法的迭代器对象，它在容器中逐个访问容器内元素，next()也是python的内置函数。在没有后续元素时，next()会抛出一个StopIterration的异常。
生成器（Generator）是创建迭代器的简单而强大的工具。它们写起来就像是正规的函数，只是在返回数据的时候需要使用yield语句。每次next()被调用时，生成器会返回它脱离的位置（它记忆语句最后一次执行的位置和所有的数据值）

python 装饰器
https://www.zhihu.com/question/26930016/answer/1047233982
python中关于unicode,utf-8,gbk等编码
https://blog.csdn.net/feiyang5260/article/details/81947444
Python中*args、**args
https://blog.csdn.net/qq_41877039/article/details/97623476

编程语言（C++）

C++三大特性之多态
https://blog.csdn.net/skySongkran/article/details/82012698
C++三大特性
https://blog.csdn.net/qq_43414142/article/details/100892336
C++ 静多态与动多态
https://www.cnblogs.com/staring-hxs/p/3669497.html
C++继承中重载、重写、重定义、虚函数
https://blog.csdn.net/AndyYoung77/article/details/90146893
C/C++ 全局变量和局部变量在内存里的区别
https://blog.csdn.net/luke_sanjayzzzhong/article/details/102469462

常见代码

目标检测常用代码
https://github.com/miaoshuyu/object-detection-usages

chinayi / awesome-deeplearning-knowledge Goto Github PK

awesome-deeplearning-knowledge's Introduction

Awesome-DeepLearning-Knoweledge

深度学习

基础模型

目标检测

NLP

机器学习

Pytorch

编程语言（Python）

编程语言（C++）

常见代码

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent