[Stepik] Практический Machine Learning (2023)
Чему вы научитесь:
После прохождения курса вы сможете полностью решать классические задачи анализа данных: начиная от сбора и хранения данных и заканчивая внедрением обученных моделей в продакшн.
Программа курса:
Организация курса
Чему вы научитесь:
- Изучите классические и современные алгоритмы машинного обучения
- Повторите или освоите математические подходы, необходимые для анализа данных
После прохождения курса вы сможете полностью решать классические задачи анализа данных: начиная от сбора и хранения данных и заканчивая внедрением обученных моделей в продакшн.
Программа курса:
Организация курса
- О курсе
- Инструменты
- Kaggle
- Введение
- Основные понятия машинного обучения
- Типы задач в машинном обучении
- Схема проекта по машинному обучению
- Оценка обобщающей способности модели
- Домашнее задание
- Разведочный анализ данных
- Основы линейной регрессии
- Регуляризация
- Практические особенности линейной регрессии
- Feature engineering
- Метрики качества регрессии
- Домашнее задание
- Переход от регрессии к классификации
- Задача оценивания вероятностей, логистическая регрессия
- Базовые метрики классификации
- Домашнее задание
- Метод опорных векторов
- Ядровой метод опорных векторов
- Продвинутые (интегральные) метрики классификации
- Домашнее задание
- Многоклассовая и multilabel-классификация
- Метод ближайших соседей
- Быстрый поиск соседей
- Калибровка вероятностей
- Решающее дерево
- Тонкости решающих деревьев
- Разложение ошибки на смещение и разброс
- Бэггинг. Случайный лес
- Бустинг. Градиентный бустинг над решающими деревьями
- Современные имплементации градиентного бустинга
- Работа с пропущенными значениями
- Поиск аномалий
- Кодирование категориальных признаков
- Методы отбора признаков
- Метод главных компонент
- Сингулярное разложение
- Линейный дискриминантный анализ
- Методы визуализации данных
- K-means
- Иерархическая кластеризация
- DBSCAN, HDBSCAN
- Метрики качества кластеризации
- Графовая кластеризация
- SHAP
- LIME
- Коллаборативная фильтрация
- Матричные разложения
- Факторизационные машины
- ML-подход
- Метрики качества ранжирования и рекомендаций
- Ранжирование
- Автоматический подбор гиперпараметров: Optuna
- Фреймворк для AutoML – H2O
- Обзор других фреймворков (TPOT, auto-sklearn, MLBox)
- Особенности работы с временными рядами
- Статистические методы прогноза временных рядов
- Адаптивные модели
- Прогнозирование временных рядов с помощью ML
- Библиотеки для анализа временных рядов: prophet
Скрытое содержимое. Вам нужно войти или зарегистрироваться.
Скачать: Скрытое содержимое. Вам нужно войти или зарегистрироваться.