Giter VIP home page Giter VIP logo

assignments's Introduction

Assignments

Assignments for newbies (students of Prof. Gao)

Study Plan 学习计划

以下为针对2017-2018学年研一及保研同学的《统计学习方法》一书的阅读进度安排。
注:《统计学习方法》中有少许错误,可查看勘误表修正。

                                                                           
章节 内容 日期 负责人
第1章 统计学习方法概论1-24页 10.09-10.15
第2章 感知机25-36页 10.09-10.15
第3章 k近邻法37-45页 10.16-10.22
第4章 朴素贝叶斯法47-53页 10.16-10.22
第5章 决策树55-75页 10.23-10.29
第6章 逻辑斯谛回归与最大熵模型77-94页 10.30-11.05
第7章 支持向量机95-134页 11.06-11.19
第8章 提升方法137-153页 11.20-11.26
第9章 EM算法及其推广155-170页 11.27-12.03
第10章 隐马尔可夫模型171-189页 12.04-12.17
第11章 条件随机场191-210页 12.18-12.31

Assignment 101

练习内容:熟练 KNN(K 邻近)算法的**和编码实现

详细说明:利用 python 语言实现 KNN 算法,并对收集的鸢尾花数据进行分类。鸢尾花数据 分为两部分,一部分为 104 个带类别标记的样本组成的训练集,另一部分为不带类别标记的 46 个样本组成的测试集,要求对 46 个不带类别标记的样本进行预测。文件夹内包内含4个文件, 分别为 data-description.txt, training.txt, test.txt,knn.py。knn.py 为需要你来完成的代码。

输入与输出:输入训练集与测试集数据(见文本文件),输出分类正确率,召回率,F1

注意:请尽量不要调用第三方的直接实现,如scikit-learn

Deadline:2017-10-31


Assignment 102

练习内容:熟练回归模型的**和编码实现,掌握梯度下降和正则化方法。

详细说明:使用python语言实现回归模型,利用收集的NACA0012 airfoils数据对模型进行训练。 Airfoils 数据分为两部分,一部分为1052 个包含sound pressure level连续值输出的样本组成的训练集, 另一部分为不包含sound pressure level输出的451个样本组成的测试集,要求对451个不带输出值的样本进行输出预测。 文件夹内包含四个文件,分别为data-description.txt, training.txt, test.txt, linear.py。 其中linear.py为需要你来完成的代码。

输入与输出:输入训练集(6维)与测试集(5维)数据(见文本文件),输出为预测值与真实值的误差平方和。误差越小,则拟合越好。

提示:可以分别尝试用线性模型和多项式模型拟合训练数据,并用梯度下降法来求解模型参数,找到表现更好的模型。如果选择高阶多项式模型,请注意使用正则化项来避免模型过拟合,以提升模型在测试集上的表现。

注意:请尽量不要调用第三方的直接实现,如scikit-learn

Deadline:2017-11-20

assignments's People

Contributors

coder-yu avatar 0411tony avatar chocalataa avatar

Watchers

James Cloos avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.