Обработка пропусков
df.dropna()
- удаляет строки с пропусками
df.fillna(value, inplace=True)
- заполняет пропуски значением value
df.fillna(df.mean(), inplace=True)
- заполняет средним значением
Параметр
inplace
:
inplace=False
(по умолчанию) - создает копию с изменениями
inplace=True
- изменяет исходный DataFrame напрямую
Метод
fillna()
с словарем позволяет заполнить пропуски в разных столбцах различными значениями за одну операцию. Синтаксис:
df.fillna({'column1': value1, 'column2': value2, ...})
Пример
df = ...
# Заполнение разными значениями
fill_dict = {
'age': df['age'].mean(), # Средним значением
'salary': df['salary'].median(), # Медианой
'city': 'Unknown' # Константой
}
df_filled = df.fillna(fill_dict)
print(df_filled)
Задание
Проанализируйте датасет супергероев, считав его из прикрепленного файла
Напишите программу, который ищет и обрабатывает пропуски.
- Заполните пропуски в
power
и intelligence
средними значениями
- Заполните пропуски в
costume_cost
медианным значением
- Заполните пропуски в
first_appearance
значением 1950
- Для текстовых полей (
name
, alias
, universe
) заполните пропуски строкой Unknown
Выведите обработанный датасет на экран, используя
print(df)