Giter VIP home page Giter VIP logo

ds_course_2020's Introduction

Курс "Инструменты анализа данных" 2020

© Валерий Студенников

Нам понадобится Python 3 и дополнительные библиотеки:

pip3 install -U numpy
pip3 install -U pandas
pip3 install -U sklearn
pip3 install -U matplotlib

Кому нужно вдруг подтянуть Python, рекомендую ресурс http://pythontutor.ru/, где краткая теория и можно быстро и весело порешать несложные задачки онлайн. На занятиях будем исходить из того, что Python не представляет сложностей )

Варианты работы с блокнотами Jupyter:

Jupyter-сервер

Классика жанра: запускаете Jupyter-web-сервер где-то у себя:

pip3 install -U jupyter

jupyter-notebook

Затем открываем в браузере http://localhost:8888/

Приложение nteract

Оболочка для Jupyter Notebook на десктопе (под разные ОС):

https://nteract.io/

Jupyter Lab

Расширенный вариант Jupyter Notebook блекджеком и табами. https://jupyterlab.readthedocs.io/

Тоже запускается как web-сервер:

pip3 install jupyterlab

jupyter lab

Затем открываем в браузере http://localhost:8888/

Облачные блокноты

Требования к оформлению лабораторных работ:

  1. Присылать ответы в jupyter-блокнотах со следующим названием файла: номерзадания-названиезадания-вашеимяфамалия.ipynb, например, 01-numpy-ivan_ivanov.ipynb

    В заголовке самого блокнота (в самой первой ячейке) также — название задания и ФИО автора.

  2. Все ячейки, требующие вычисления, должны быть вычислены и в присылаемом блокноте должен содержаться вывод ячеек. Пустой блокнот с очищенным выводом ячеек не принимается!

  3. Внутри в markdown-ячейках обязательно дублируете условие задачи в виде оглавления, каждую подзадачу предваряете markdown-ячейкой с описанием подзадачи.

  4. Очень желательны комментарии к коду, которые объясняют, что делает тот или иной фрагмент. Нам за reverse engeneering не доплачивают ))

  5. Код по-возможности структурируйте в небольший логические блоки, каждый в своей ячейке, чтобы легко было его понять. Выводите в блокнот промежуточные результаты. Вам же будет удобнее.

  6. Если в работе используется какой-то датасет — ссылку на место, откуда его взяли и на описание длатсета. Хорошо рядом с загрузкой датасета кратко продублируете описание датасета — что это такое и о чём. Это важно, например, для правильной трактовки признаков, например, чтобы отделить категоривальные признаки от вещественных.

Датасеты:

Откуда брать датасеты для работ?

Репозитории с датасетами:

Всяческие открытые данные:

Лабораторные работы:

  1. NumPy
  2. Pandas
  3. Визуализация данных
  4. Задачи классификации. Метрики качества классификации
  5. Деревья решений
  6. Catboost
  7. Линейная Регрессия
  8. Классификация текстов с помощью TfIdf
  9. Кластеризация
  10. Понижение размерности признакового пространства

Полезные ссылки

ds_course_2020's People

Contributors

xtrueman avatar

Stargazers

 avatar  avatar  avatar

Watchers

 avatar  avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.