Статья Автор: Деникина Н.В., Деникин А.В.

Оценка качества дерева

Как понять, хорошее ли у нас дерево? Нужны метрики!

Основные метрики

1. Accuracy (Точность) — процент правильных предсказаний

Accuracy = Правильные_предсказания / Все_предсказания

2. Confusion Matrix — показывает, где ошибается модель
  Предсказано
Истина 0 1
0 TN FP
1 FN TP


TN - True Negative (правильно предсказали 0)
TP - True Positive (правильно предсказали 1)
FN - False Negative (предсказали 0, а было 1)
FP - False Positive (предсказали 1, а было 0)

3. Precision и Recall

Precision = TP / (TP + FP) — из предсказанных единиц сколько правильных?
Recall = TP / (TP + FN) — из всех единиц сколько нашли?
Печать