Модуль: Линейная регрессия


15. Оценка модели

☰ Теория

R² (R-squared, коэффициент детерминации):

  • Показывает, какую долю вариации целевой переменной объясняет модель
  • Значения от 0 до 1 (1 = идеальная модель)
  • Формула: \(R^2=1−\frac{ \sum{(y_i − \hat y_i)}^2}{\sum(y_i−\bar y)^2}\)

\(\hat y \) - предсказанное значение
\(\bar y \) - среднее значение

MAE (Mean Absolute Error):

  • Средняя абсолютная ошибка предсказания
  • Легко интерпретировать (в тех же единицах, что и целевая переменная)
  • Формула: \(MAE=\frac{1}{n}\sum∣y_i−\hat y_i∣\)

RMSE (Root Mean Squared Error):

  • Корень из средней квадратичной ошибки
  • Штрафует большие ошибки сильнее, чем MAE
  • Формула: \(RMSE=\sqrt{\frac{1}{n}\sum(y_i−\hat y_i)^2}\)

Использование библиотеки sklearn для вычисления данных метрик

Метрика Функция sklearn Импорт
r2_score(y_test, y_pred) from sklearn.metrics import r2_score
MAE mean_absolute_error(y_test, y_pred) from sklearn.metrics import mean_absolute_error
RMSE mean_squared_error(y_test, y_pred, squared=False) from sklearn.metrics import mean_squared_error

Важно: Все функции принимают два обязательных аргумента в порядке: сначала реальные значения (y_test), потом предсказания (y_pred).​


 

Ты тренер покемонов и хочешь предсказать общую силу покемона (Total) на основе его характеристик!

Датасет содержит информацию о 721 покемоне с характеристиками:​

  • HP — очки здоровья

  • Attack — сила атаки

  • Defense — защита

  • Sp. Atk — специальная атака

  • Sp. Def — специальная защита

  • Speed — скорость

  • Total — общая сила (сумма всех характеристик) — это наша цель!

  • Type 1, Type 2 — типы покемона (Fire, Water, Grass и т.д.)​

  • Generation — поколение (1-6)​

  • Legendary — легендарный ли покемон (True/False)


Выполни следующее

  1. Загрузи и подготовь данные
  2. Раздели данные на обучающую и тестовую выборки:
    Параметры разделения:
    • разметр тестовой выборки равен 20% (~144 покемона)
    • random_state=42 
  3. Обучи модель
  4. Сделай предсказания на тестовой выборке
  5. Вычисли метрики качества (R2, MAE, RMSE)
  6. Выведи на экран значение каждой метрики (с точностью до 2-х знаков после запятой): в первой строке выведи значение R2 , во второй - MAE, в третьей - RMSE.

Напишите программу
Auto
       

time 10000 ms
memory 256 Mb
Правила оформления программ и список ошибок при автоматической проверке задач

Статистика успешных решений по компиляторам
 Кол-во
Python3
Комментарий учителя