Проекты, выполненные в рамках курса "Специалист по Data Science" Данные проекты были выполнены в ходе обучения в Яндекс.Практикуме, профессии "Аналитик данных" / "Специалист по Data Science".
Название проекта | Описание | Используемые библиотеки |
---|---|---|
Обучение модели классификации комментариев | Определение токсичности комментарии. DL для NLP | Python, Pandas, BERT, nltk, tf-idf, NLP |
Обработка фотографий покупателя | Определение возраста по фотографии | Python, Keras, Tensorflow |
Построение модели определения стоимости автомобиля | Численные методы. Разработка системы рекомендации стоимости автомобиля на основе его описания | Python, Pandas, lightGBM, CatBoost |
Прогнозирование оттока клиента Банка | На основе данных из банка определить клиент, который может уйти | Python, Pandas, Matplotlib, NumPy, Scikit-learn, CatBoost |
Исследование технологического процесса очистки золота | Спрогнозировать концентрацию золота при проведении процесса очистки золота | Python Pandas Matplotlib NumPy Scikit-learn исследовательский анализ данных |
Прогнозирование количества заказов такси на следующий час | Разработка системы предсказания объема заказа. | Python, Pandas, Scikit-learn, statsmodels |
Определение наиболее выгодного региона нефтедобычи | На основе данных геологи разведки выбрать район добычи нефти | Pandas, Scikit-learn, бутстреп |
Классификация клиентов телеком компании | На основе данных предложить клиенту тариф. | Python, Pandas, Matplotlib, NumPy, Scikit-learn, CatBoost |
Продажа квартир в Санкт-Петербурге — анализ рынка недвижимости | Исследовательский анализ данных. Используя данные сервиса Яндекс.Недвижимость, определить рыночную стоимость объектов недвижимости и типичные параметры квартир. | Python, Pandas, Matplotlib, исследовательский анализ данных, визуализация данных, предобработка данных |
Защита данных клиентов страховой компании | Разработка модели анонимизации персональных данных | Python, NumPy, Scikit-learn |
Выявление определяющих успешность видео игры закономерностей. | Анализ продаж игр за предыдущие года, и прогнозирование на следующий год | Python, Pandas, Matplotlib, NumPy, исследовательский анализ данных |