Collected projects completed during training at Yandex.Practice
Все проекты выполнены на русском языке, имеют расширение файла .ipynb, и предлогают готовый вариант решения без ссылки на набор с данными.
№ |
Название проекта |
Описание |
Используемые библиотеки |
---|---|---|---|
1 | Исследование данных сервиса “Яндекс.Музыка” | Сравнение предпочтений пользователей Яндекс.Музыки из Москвы и Санкт-Петербурга в зависимости от времени (утро и вечер) и дня недели (понедельник, среда, пятница) | Pandas Python |
2 | Исследование надёжности заёмщиков — анализ банковских данных | На основе статистики о платёжеспособности клиентов исследовать влияет ли семейное положение и количество детей клиента на факт возврата кредита в срок | Pandas Python |
3 | Продажа квартир в Санкт-Петербурге — анализ рынка недвижимости | Используя данные сервиса Яндекс.Недвижимость, определить рыночную стоимость объектов недвижимости и типичные параметры квартир | Pandas Python Matplotlib |
4 | Определение выгодного тарифа для телеком компании | На основе данных клиентов оператора сотовой связи проанализировать поведение клиентов и поиск оптимального тарифа | Pandas Python Matplotlib NumPy SciPy |
5 | Определение закономерностей успешности видео игр | На основе данных сделать ставку на потенциально популярный продукт и спланировать рекламные кампании на следующий год. | Pandas Python Matplotlib Plotly |
6 | Классификаиция клиентов телеком компании | Оператор мобильной связи выяснил: многие клиенты пользуются архивными тарифами. На основе данныхт предложить пользователям один из новых тариф. | Pandas Python Matplotlib Scikit-learn |
7 | Прогнозирование оттока клиента Банка | На основе данных нужно спрогнозировать, уйдёт клиент из банка в ближайшее время или нет. Предоставлены исторические данные о поведении клиентов и расторжении договоров с банком | Pandas Matplotlib Scikit-learn |
8 | Определение наиболее выгодного региона нефтедобычи | Предоставлены пробы нефти в трёх регионах. На основе данных построить модель для определения региона, где добыча принесёт наибольшую прибыль. | Pandas Scikit-learn |
9 | Исследование технологического процесса очистки золота | Спрогнозировать концентрацию золота при проведении процесса очистки золота | Python Pandas Matplotlib NumPy Scikit-learn |
10 | Защита данных клиентов страховой компании | Разработка модели анонимизации персональных данных | Python Pandas NumPy Scikit-learn |
11 | Построение модели определения стоимости автомобиля | Разработка системы рекомендации стоимости автомобиля на основе его описания | Python Pandas Lightgbm Catboost Optuna |
12 | Прогнозирование количества заказов такси на следующий час | Разработка системы предсказания объема заказа для привлечения водителей в период пиковой нагрузки | Python Pandas Scikit-learn Statsmodels Plotly |
13 | Обучение модели классификации комментариев | Определение токсичности комментарии. Требуется инструмент, который будет искать токсичные комментарии и отправлять их на модерацию. | Python Pandas nltk Spacy Catboost |
14 | Определение возраста покупателей | Разработка модель, которая по фотографии определит приблизительный возраст человека. | Pandas Matplotlib Keras Tensorflow |
15 | Проект по прогнозированию температуры стали для оптимизации производственных расходов | Разработка модель, способной спрогнозировать последнюю температуру по партии выплавки стали | Pandas Matplotlib Shap CatBoost Optuna Scikit-learn |