Репозиторий с проектами, созданными в рамках курса "Специалист Data Science" в Яндекс.Практикуме
- Ссылка на курс: https://praktikum.yandex.ru/data-scientist/
- Предобработка данных / Data Processing - Project_01
- Исследовательский анализ данных / Exploratory data analysis - Project_02
- Статистический анализ данных / Statistical analysis of data - Project_03
- Сборный проект / Common project - Project_04
- Введение в машинное обучение / Introduction to machine learning - Project_05
- Обучение с учителем / Supervised learning - Project_06
- Машинное обучение в бизнесе / Machine learning in business - Project_07
- Сборный проект / Common project - Project_08
- Линейная алгебра / Linear algebra - Project_09
- Численные методы (градиентный бустинг) / Numerical analysis (gradient boosting) - Project_10
- Временные ряды / Time series - Project_11
- Машинное обучение для текстов / Machine learning for texts - Project_12
- Выпускной проект / Final project - Project_final
№ | Название | Общая информация | Стек технологий |
---|---|---|---|
13 | (Дипломный проект) Прогнозирование оттока клиентов оператора связи | Необходимо научиться с высокой точностью прогнозировать отток клиентов телеком-оператора. Это позволит своевременно предложить промокоды и бонусы и сохранить клиента. | catboost sklearn seaborn matplotlib plotly pandas numpy math |
12 | (Обработка естественного языка) Определение токсичности комментариев | Магазину нужен инструмент, который будет искать токсичные комментарии и отправлять их на модерацию. Для этого необходимо обучить модель классифицировать комментарии на позитивные и негативные | BERT spacy SVC pymystem3 re sklearn pandas numpy matplotlib plotly math |
11 | (Временные ряды) Прогноз количества заказов такси на следующий час | Чтобы привлекать больше водителей в период пиковой нагрузки, нужно спрогнозировать количество заказов такси на следующий час. | TimeSeriesSplit catboost lightgbm statsmodels sklearn pandas numpy matplotlib plotly math time |
10 | Определение стоимости автомобилей | Необходимо построить модель для определения стоимости автомобиля, с учетом ограничений обозначенных заказчиком | catboost lightgbm sklearn pandas numpy matplotlib plotly math time |
9 | Разработать метод преобразования данных для защиты персональной информации | Необходимо разработать метод преобразования данных, согласно которому будет сложно восстановить персональную информацию. Обосновать корректность его работы. | sklearn pandas numpy |
8 | Предсказание коэффициента восстановления золота из золотосодержащей руды | Нужно построить модель, которая предскажет коэффициент восстановления золота из золотосодержащей руды по данным с параметрами добычи и очистки. | sklearn matplotlib plotly pandas numpy |
7 | Выбор локации для нефтяной скважины | Нефтяной компании нужно решить, где бурить новую скважину. Для этого необходимо построить модель для определения региона, где добыча принесёт наибольшую прибыль. | sklearn scipy matplotlib plotly pandas numpy |
6 | Прогнозирование оттока клиентов банка | Нужно спрогнозировать, уйдёт клиент из банка в ближайшее время или нет | sklearn pandas numpy matplotlib |
5 | Рекомендация тарифов существующим клиентам | Необходимо построить систему, способную проанализировать поведение клиентов, давно не меняющих тарифные планы, и предложить пользователям новый тариф, отвечающий их предпочтениям. | sklearn pandas |
4 | Определение параметров коммерческой успешности компьютерных игр | Необходимо выявить определяющие успешность игры закономерности, чтобы сделать ставку на потенциально популярный продукт и спланировать рекламные кампании | scipy matplotlib plotly pandas numpy math |
3 | Определение перспективного тарифа для телеком-компании | Чтобы скорректировать рекламный бюджет нужно проанализировать, как клиенты пользуются сотовой связью, и сделать вывод, — какой из предлагаемых федеральным оператором тарифов приносит больше денег. | scipy pandas numpy plotly math |
2 | Исследование объявлений о продаже квартир | На базе архива объявлений о продаже квартир в Санкт-Петербурге и соседних городах провести EDA. Цель - определить параметры, чтобы в дальнейшем научиться определять рыночную стоимость объектов недвижимости | matplotlib plotly pandas numpy math |
1 | Исследование надёжности заёмщиков | Исследование надёжности заёмщиков для кредитного отдела банка с целью построения модели кредитного скоринга | pymystem3 pandas numpy collections math |
- email: [email protected]