Статья Автор: Деникина Н.В., Деникин А.В.

Предобработка данных

Зачем это нужно?

Представь: Ты нашёл крутой датасет для анализа, но данные выглядят странно - где-то пустоты, где-то опечатки, где-то числа записаны как текст. 

Data Cleaning (Очистка данных) - это процесс превращения "сырых" данных в аккуратные и готовые к анализу!

В данном модуле мы будем чистить и подготовливать датасет к дальнейшей обработке.

В общем виде в каждом задании структура датасета выглядит следующим образом:

name - полное имя персонажа
alias - супергеройское имя 
power - уровень силы (1-100)
intelligence - уровень интеллекта (1-100)
universe - вселенная происхождения
costume_cost - стоимость костюма ($)
first_appearance - год первого появления

Печать