Вы — data scientist в музыкальной компании! Ваша задача — понять, станет ли новая песня хитом, ещё до её релиза. У вас есть реальный датасет из Spotify с характеристиками тысяч песен.
Сможете ли вы создать модель, которая предскажет, попадёт ли трек в топ? 🔥
Описание датасета
В датасете есть интересные музыкальные характеристики:
- danceability — танцевальность (0.0-1.0) — насколько под это можно двигаться
- energy — энергичность (0.0-1.0) — насколько трек агрессивный и быстрый
- loudness — громкость (в децибелах, обычно от -60 до 0)
- speechiness — разговорность (0.0-1.0) — сколько в треке слов (рэп будет высоким)
- acousticness — акустичность (0.0-1.0) — есть ли живые инструменты
- instrumentalness — инструментальность (0.0-1.0) — есть ли вокал (чем выше, тем меньше слов)
- liveness — живость (0.0-1.0) — записано ли вживую с публикой
- valence — позитивность (0.0-1.0) — насколько трек весёлый (грустный vs радостный)
- tempo — темп (удары в минуту, обычно 50-200)
- duration_ms — длительность в миллисекундах
- target — хит (1) или нет (0)
Все упражнения данного модуля работают с одним и тем же датасетом, который вы можете скачать здесь.