Мы в соц. сетях:
Вконтакте Facebook Twitter

ИССЛЕДОВАНИЕ СПОСОБОВ ТРАНСФОРМАЦИИ ДАННЫХ В КОНТЕКСТЕ ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ МОДЕЛЕЙ КРЕДИТНОГО СКОРИНГА

Ю. В. Клебан

В статье проведено исследование, посвященное поиску наиболее эффективного подхода к предварительной обработке характеристических признаков заемщиков с целью повышения точности предсказания дефолтов по кредитным обязательствам. Проанализированы три основных способа представления данных на входы моделей кредитного скоринга: применение исходных объясняющих переменных без трансформации, преобразование категориальных характеристик в набор фиктивных переменных, биннинг показателей с расчетом весомости признака (WOE) для каждой категории.

Для получения выводов относительно систематического влияния данных подходов было проведено 10 повторяющихся итераций с построением нейросетевых моделей персептронного типа на основе каждого из этих трех способов подготовки входных факторов. Все скоринговые модели оценивались по широкому набору показателей интегральной и точечной эффективности.

Результаты проведенных экспериментов продемонстрировали практически по всем критериям преимущество предложенного автором методологического подхода к предварительной обработке данных путем разбиения количественных переменных на категории с обеспечением тренда их показателей весомости признака и соблюдением ограничений по объему наблюдений в каждой группе.

Ключевые слова. Скоринговая модель, нейронная сеть, кредитоспособность, биннинг, весомость признака (WOE), информационная значимость (IV), коэффициент Джини.

DOI 10.33111/nfmte.2019.094


Creative Commons Attribution-NonCommercial 4.0 International License

Скачать статью