Олимпиадный тренинг

Задача . Найти точность модели


Задача

Темы:

Ты — data scientist в музыкальной компании! Твоя задача — понять, станет ли новая песня хитом, ещё до её релиза. У тебя есть реальный датасет из Spotify с характеристиками тысяч песен.

Сможешь ли ты создать модель, которая предскажет, попадёт ли трек в топ? 🔥

Данные

В датасете есть интересные музыкальные характеристики:

  • danceability — танцевальность (0.0-1.0) — насколько под это можно двигаться
  • energy — энергичность (0.0-1.0) — насколько трек агрессивный и быстрый
  • loudness — громкость (в децибелах, обычно от -60 до 0)
  • speechiness — разговорность (0.0-1.0) — сколько в треке слов (рэп будет высоким)
  • acousticness — акустичность (0.0-1.0) — есть ли живые инструменты
  • instrumentalness — инструментальность (0.0-1.0) — есть ли вокал (чем выше, тем меньше слов)
  • liveness — живость (0.0-1.0) — записано ли вживую с публикой
  • valence — позитивность (0.0-1.0) — насколько трек весёлый (грустный vs радостный)
  • tempo — темп (удары в минуту, обычно 50-200)
  • duration_ms — длительность в миллисекундах
  • target — хит (1) или нет (0)

Напиши программу, которая:

  1. Загружает датасет
  2. Готовит данные
  3. Обучает модель логистической регрессии
  4. Оценивает её точность

time 10000 ms
memory 256 Mb
Правила оформления программ и список ошибок при автоматической проверке задач

Статистика успешных решений по компиляторам
Комментарий учителя