MachineLearningInAction

工作原理：存在一个训练样本集，并且样本集中每个数据都存在标签，即已知样本集中每一数据与所属分类的对应关系.输入没有标签的新数据后，将新数据的每个特征与样本集中数据对应的特征进行比较，算法提取样本集中特征最相似（最近邻）的分类标签。选择k(k<20)个最相似数据中出现次数最多的分类作为新数据的分类。优点：精度高，对异常值不敏感，无数据输入假定缺点：计算复杂度高，空间复杂度高 适用数据范围：数值型和标称型

第三章决策树

工作原理：决策树算法能够读取数据集合，构建决策树。决策树的一个重要任务是理解数据中所蕴含的知识信息，因此决策树可以使用不熟悉的数据集合，并从中提取出一系列的规则，这些机器根据数据集创建规则的过程，就是机器学习的过程。优点：计算复杂度不高，输出结果易于理解，对中间值的缺失不敏感，可以处理不相关特征数据缺点：可能会产生过度匹配问题 适用数据类型：数值型和标称型

第四章朴素贝叶斯

工作原理：朴素贝叶斯是贝叶斯决策理论的一部分.贝叶斯决策的核心**是选择具有最高概率的决策。朴素贝叶斯分类器是用于文档分类的常用算法，把每个词的出现或者不出现作为一个特征，它假设特征之间相互独立, 即一个单词出现的可能性和其他相邻单词没有关系，并且每个特征同等重要。优点：在数据较少的情况下仍然有效，可以处理多类别问题。缺点：对于输入数据的准备方式较为敏感。 适用数据类型：标称型

第五章 Logistic回归

工作原理：根据现有数据对分类边界线建立回归公式，以此进行分类。“回归”表示要找到最佳拟合参数集优点：计算代价不高，易于理解和实现。缺点：容易欠拟合，分类精度可能不高。 适用数据类型：数值型标称型

ye-yechen / machinelearninginaction Goto Github PK

machinelearninginaction's Introduction

MachineLearningInAction

目录

第一部分分类

machinelearninginaction's People

Contributors

Watchers

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent

ye-yechen / machinelearninginaction Goto Github PK

machinelearninginaction's Introduction

MachineLearningInAction

目录

第一部分 分类

machinelearninginaction's People

Contributors

Watchers

Recommend Projects

Recommend Topics

Recommend Org

第一部分分类