Данный отчет создан с целью обеспечения непрерывности бизнес-процессов, сохранения и распространения внутренних экспертных знаний внутри Группы, а также для подтверждения обоснованности и корректности разработанной модели.
Для достижения этих целей Отчёт подробно описывает основные методологические подходы к моделированию
{{ model_aim }}
Данный отчет имеет следующую структуру:
Основные идентификационные данные модели собраны в Таблице 1.
Параметр | Значение |
---|---|
Название модели / ID | {{ model_name }} |
Версия отчёта | {{ report_version }} |
Заказчик модели | {{ zakazchik }} |
Название участника Группы и структурного подразделения верхнего уровня | {{ high_level_department }} |
Разработчик модели (в случае привлечения внешнего разработчика, необходимо указать название компании) | {{ ds_name }} |
Описание и характеристики выборок, использованных при разработке и тестировании модели представлены в Таблице 2.
Характеристика | Обучающая выборка | Тестовая выборка | |||
Определение целевого события | {{ target_descr }} | ||||
Определение нецелевого события | {{ non_target_descr }} | ||||
Количество наблюдений в выборке | {{ count_train }} | {{ count_test }} | |||
Количество целевых событий | {{ train_target_cnt }} | {{ test_target_cnt }} | |||
Количество нецелевых событий | {{ train_nontarget_cnt }} | {{ test_nontarget_cnt }} | |||
Среднее целевой переменной в выборке | {{ train_target_perc }}% | {{ test_target_perc }}% |
Результаты работы модели, обученной на обучающей выборки, приведены в Таблице 3.
Характеристика | Обучающая выборка | Тестовая выборка |
AUC | {{ train_auc_full }}% | {{ test_auc_full }}% |
Gini | {{ train_gini_full }}% | {{ test_gini_full }}% |
Коэффициенты регрессионной модели, приведены в Таблице 4.
Наименование признака | Регрессионный коэффициент |
{{ pair[0] }} | {{ pair[1] }} |
Статистка по пропущенным значениям в обучающей и тестовой выборке приведена в Таблице 5.
Наименование признака | Число валидных значений в обучающей выборке | Число валидных значений в тестовой выборке | Число пропущенных значений в обучающей выборке | Число пропущенных значений в тестовой выборке | Процент валидных значений в обучающей выборке | Процент валидных значений в тестовой выборке | Разница процентов валидных значений в выборках |
{{ val[0] }} | {{ val[1] }} | {{ val[2] }} | {{ val[3] }} | {{ val[4] }} | {{ val[5] }} | {{ val[6] }} | {{ val[7] }} |
Наименование признака | Значение P-value |
{{ val[0] }} | {{ val[1] }} |
Наименование признака | Значение P-value |
{{ val[0] }} | {{ val[1] }} |
Требуется обучить модель с параметром regularized_refit=False
{% endif %}Gini для обучающей выборки
Gini для тестовой выборки
Наименование признака | Значение VIF |
{{ val[0] }} | {{ val[1] }} |
Для подсчета VIF необходимо несколько признаков
{% endif %}Совокупный PSI
Наименование признака | Значение PSI |
{{ val[0] }} | {{ val[1] }} |
PSI по нецелевым событиям
Наименование признака | Значение PSI |
{{ val[0] }} | {{ val[1] }} |
PSI по целевым событиям
Наименование признака | Значение PSI |
{{ val[0] }} | {{ val[1] }} |
Группировка по предсказаниям на обучающей выборке (совокупная)
Группировка по предсказаниям целевого и нецелевого событий на обучающей выборке
Группировка по предсказаниям на тестовой выборке (совокупная)
Группировка по предсказаниям целевого и нецелевого событий на тестовой выборке
PSI по сгруппированным предсказаниям модели
Совокупный PSI | {{ psi_binned_total }} |
PSI по нецелевым событиям | {{ psi_binned_zeros }} |
PSI по целевым событиям | {{ psi_binned_ones }} |
Для подсчета PSI требуется предварительно вызвать fit() и predict_proba()
{% endif %}ScoreBin | count | mean | std | min | 25% | 50% | 75% | max |
{{ val[0] }} | {{ val[1] }} | {{ val[2] }} | {{ val[3] }} | {{ val[4] }} | {{ val[5] }} | {{ val[6] }} | {{ val[7] }} | {{ val[8] }} |
ScoreBin | count | mean | std | min | 25% | 50% | 75% | max |
{{ val[0] }} | {{ val[1] }} | {{ val[2] }} | {{ val[3] }} | {{ val[4] }} | {{ val[5] }} | {{ val[6] }} | {{ val[7] }} | {{ val[8] }} |
Variable | Value | WOE | COEF | POINTS |
{{ val[0] }} | {{ val[1] }} | {{ val[2] }} | {{ val[3] }} | {{ val[4] }} |
Признак | |
{{ val[0] }} | {{ val[1] }} |
Признак | Вклад в ROC AUC |
{{ val[0] }} | {{ val[1] }} |
Для подсчета требуются как минимум 2 признака в финальной модели
{% endif %} {% else %}Требуется обучить модель с параметром regularized_refit=False
{% endif %}