Как понять, хорошее ли у нас дерево? Нужны метрики!
Основные метрики
1. Accuracy (Точность) — процент правильных предсказаний
Accuracy = Правильные_предсказания / Все_предсказания
2. Confusion Matrix — показывает, где ошибается модель
| |
Предсказано |
| Истина |
0 |
1 |
| 0 |
TN |
FP |
| 1 |
FN |
TP |
TN - True Negative (правильно предсказали 0)
TP - True Positive (правильно предсказали 1)
FN - False Negative (предсказали 0, а было 1)
FP - False Positive (предсказали 1, а было 0)
3. Precision и Recall
Precision = TP / (TP + FP) — из предсказанных единиц сколько правильных?
Recall = TP / (TP + FN) — из всех единиц сколько нашли?