Регуляризация помогает модели не переобучаться, то есть не слишком подстраиваться под обучающие данные. Параметр C в LogisticRegression контролирует силу регуляризации:
- Большой C (например, 100) — слабая регуляризация, модель может переобучиться
- Маленький C (например, 0.01) — сильная регуляризация, модель становится проще
Оптимальное значение C обычно находят экспериментально. Попробуйте разные значения и посмотрим, как меняется качество.
Укажите в ответе значения ROC AUC при:
- C=0.01
- C=1.0
- C=100
В ответе укажите три строки, в каждой из которых записано соответствующее значение ROC AUC с точностью до 4-х знаков после запятой.