Модуль: Линейная регрессия


8. Обучение модели для предсказания цен на дома в Бостоне - с разделением данных на обучающую и тестовую выборки

Вы работаете с классическим датасетом Boston Housing Dataset, который содержит информацию о ценах на недвижимость в пригородах Бостона. Датасет включает 13 признаков, влияющих на медианную стоимость домов. Ваша задача — построить модель множественной линейной регрессии и проанализировать факторы, влияющие на цену.

Описание признаков:

Признак Описание Единицы
crim Уровень преступности на душу населения %
zn Доля жилых зон для участков > 25,000 кв. футов %
indus Доля промышленных площадей %
chas Расположение у реки (1 = да, 0 = нет) бинарный
nox Концентрация оксида азота (загрязнение воздуха) ppm
rm Среднее количество комнат в доме количество
age Доля домов, построенных до 1940 года %
dis Средневзвешенное расстояние до центров занятости единицы
rad Индекс доступности радиальных магистралей индекс
tax Ставка налога на имущество $ за $10,000
ptratio Соотношение учеников к учителям число
lstat % населения с низким статусом %
medv Медианная стоимость дома (целевая переменная) $1000

Задание

  1. Загрузите датасет из прикрепленного файла
  2. Выберите 5 наиболее важных признаков для модели:
    • rm (количество комнат)
    • lstat (% населения с низким статусом)
    • ptratio (соотношение учеников к учителям)
    • dis (расстояние до центров занятости)
    • crim (уровень преступности)
  3. Создайте X (признаки) и y (целевая переменная medv)
  4. Разделите данные на обучающую и тестовую выборки
  5. Создайте и обучите модель LinearRegression на обучающей выборке
  6. Выведите коэффициенты для каждого признака
  7. Выведите intercept модели
Примечание
1) Название коэффициентов выводить не надо
2) Для разделения данных на обучающую и тестовую выборки используйте следующие параметры: test_size=0.2, random_state=42

Напишите программу
Auto
       

time 10000 ms
memory 256 Mb
Правила оформления программ и список ошибок при автоматической проверке задач

Статистика успешных решений по компиляторам
 Кол-во
Python8
Комментарий учителя