datamining-machinelearning's Introduction

DataMining-MachineLearning

数据挖掘与机器学习作业
预览html文件，在网址前加 http://htmlpreview.github.io/?

信用卡违约客户的分类与聚类分析.pdf

本研究主要目的在于利用商业智能与数据挖掘的技术整合，利用UCI中信用卡违约客户数据，使用聚类模型探索客户分类，并利用分类算法建立一套相对稳定且有效的预测模型，提供相关部门与发卡机构一个准则，以降低违约比例，进而降低信用风险。

文章数据集来源于UCI网站的OnlineNewsPopularity数据集，这是关于13-14年发表在Mashable网站的新闻数据，共4万条样本，63个变量。原有数据含有的因变量为文章的转发量，我们将1400作为分界点，将转发量大于等于1400的新闻标记为热门新闻，将小于1400的文章标记为非热门新闻。我们分别使用决策树、bagging、随机森林算法，根据新闻的特征预测新闻是否为热门新闻。建模发现，bagging和随机森林比决策树的预测效果好，预测错误率分别为33.7%，33.7%，38.3%。影响因素方面，文章主题、发表时间、关键字、参考链接类型等都对新闻热度有重要影响。

Recommend Projects

snowing-st / datamining-machinelearning Goto Github PK

datamining-machinelearning's Introduction

DataMining-MachineLearning

信用卡违约客户的分类与聚类分析.pdf

在线新闻热度预测.html

datamining-machinelearning's People

Contributors

Stargazers

Watchers

Forkers

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent