Ты — data scientist в музыкальной компании! Твоя задача — понять, станет ли новая песня хитом, ещё до её релиза. У тебя есть реальный датасет из Spotify с характеристиками тысяч песен.
Сможешь ли ты создать модель, которая предскажет, попадёт ли трек в топ? 🔥
Данные
В датасете есть интересные музыкальные характеристики:
- danceability — танцевальность (0.0-1.0) — насколько под это можно двигаться
- energy — энергичность (0.0-1.0) — насколько трек агрессивный и быстрый
- loudness — громкость (в децибелах, обычно от -60 до 0)
- speechiness — разговорность (0.0-1.0) — сколько в треке слов (рэп будет высоким)
- acousticness — акустичность (0.0-1.0) — есть ли живые инструменты
- instrumentalness — инструментальность (0.0-1.0) — есть ли вокал (чем выше, тем меньше слов)
- liveness — живость (0.0-1.0) — записано ли вживую с публикой
- valence — позитивность (0.0-1.0) — насколько трек весёлый (грустный vs радостный)
- tempo — темп (удары в минуту, обычно 50-200)
- duration_ms — длительность в миллисекундах
- target — хит (1) или нет (0)
Напиши программу, которая:
- Загружает датасет
- Готовит данные
- Обучает модель логистической регрессии
- Определяет успешность заданного трека