Администрирование и программирование [Stepik] Максим Дуплей — Погружение в Data Science и машинное обучение (2024)

#Are$

Команда форума
Модератор

[Stepik] Максим Дуплей — Погружение в Data Science и машинное обучение (2024)

2024-08-12_08-30-19.png
Чему вы научитесь
  • 1️⃣ Программировать на Python с нуля
  • 2️⃣ Использовать популярные библиотеки Pandas и Scikit-learn
  • 3️⃣ Обучать модели машинного обучения
  • 4️⃣ Визуализировать результаты при помощи Matplotlib и Seaborn
  • 5️⃣ Разбираться в метриках для оценки результата
  • 6️⃣ Интерпретировать результат моделей ML
О курсе
Data Science
- это популярная предметная область, которая занимает одну из лидирующих позиций среди других областей в ИТ.
Специалисты, которые занимаются анализом данных и машинным обучением очень востребованы во многих странах мира, в том числе и в России.
В дальнейшем эта сфера будет еще больше развиваться, так как многие компании понимают, что именно Data Scientist может привнести огромный вклад в развитие компании, который выражается также в денежном эквиваленте.

Этот курс не перегружен математическими формулами и выводами, задача познакомиться с областью, научиться практическим навыкам, а также сформировать целостную картинку о грамотном и поэтапном обучении моделей.

Курс состоит из 4 основных блоков, где в каждом блоке предусмотрены уроки и соответствующие шаги с теорией и практикой:
1. Введение

Вы сможете узнать, что такое Data Science, чем данная область отличается от Machine Learning, а также чем занимаются специалисты в этих направлениях науки.
Познакомитесь с инструментом для анализа данных Python, а также средой разработки Jupyter Notebook.
Попробуем с вами установить их для дальнейшей полноценной работы.

2. Основы Python
В этом блоке вы сможете с нуля познакомиться с языком программирования Python: переменные, типы данных, функции, ООП. Набора перечисленных тем для начального этапа хватит для изучения и применения моделей машинного обучения.
Также вас ждут практические задания, где вы сможете отточить свои навыки программирования.

3. Библиотеки для визуализации и анализа данных
Вы познакомитесь с необходимыми инструментами, которые полезны в предварительном анализе данных, перед тем как будем обучать модель.
Это популярная библиотека Pandas для работы с табличными данными, Matplotlib и Seaborn - библиотеки для визуализации данных и результатов, в том числе обучения моделей.

4. Машинное обучение
В этом блоке мы познакомимся с моделями машинного обучения: как они работают, в какой ситуации какую модели применять.
Также разберем библиотеку Scikit-learn, где уже реализовано большинство ML моделей.
Научимся поэтапно выполнять предобработку данных, обучать модели, а также интерпретировать их результат.

ИСТОЧНИК
Скрытое содержимое. Вам нужно войти или зарегистрироваться.
СКАЧАТЬ
Скрытое содержимое. Вам нужно войти или зарегистрироваться.
 
Сверху