Использование инновационных методов анализа данных с целью снижения кредитного риска
Целевым полем является поле "Давать кредит", принимающий значения "Да" (True) и "Нет" (False). Эти значения можно интерпретировать следующим образом: "Нет" - плательщик либо сильно просрочил с платежами, либо не вернул часть денег, "Да" - противоположность "Нет". Факторы для построения дерева были собраны и консолидированы в хранилище данных Deductor Warehouse. (Приложение Г)
Методология хранилища такова, что информация хранится в процессах, каждый процесс имеет определенный набор измерений и фактов. Т.е. процесс реализован по стандартной схеме "Звезда", в центре которой хранятся факты, а измерения являются лучами. В данном случае процесс отображает выдачу кредита заемщику. Наиболее ценной информацией процесса является статус кредита. Хороший кредит - тот, который заемщик вернул в срок и в полном объеме, плохой - обратная ситуация.
При построении модели оценки кредитоспособности огромную помощь эксперту окажет разнообразная аналитическая отчетность. Поскольку данные в хранилище представлены в многомерном виде, то, несомненно, наиболее удобно получать отчетность в виде набора срезов кросс - таблиц.
Анализируя полученное дерево решений можно сделать вывод, что при помощи дерева решений можно проводить анализ значащих факторов. Такое возможно благодаря тому, что при определении параметра на каждом уровне иерархии, по которому происходит разделение на дочерние узлы, используется критерий наибольшего устранения неопределенности. Таким образом, более значимые факторы, по которым проводится классификация, находятся на более близком расстоянии (глубине) от корня дерева, чем менее значимые. Например, фактор "Обеспеченность займа" более значим, чем фактор "Срок проживания в данной местности". Фактор "Основное направление расходов" значим только в сочетании с другими факторами. Еще одним интересным примером значимости различных факторов служит отсутствие в построенном дереве параметра "Наличие автотранспорта", что говорит о том, что на сегодняшний день это наличие не является определяющим при оценке кредитоспособности физического лица.
Можно заметить, что такие показатели как "Размер ссуды", "Срок ссуды", "Среднемесячный доход" и "Среднемесячный расход" вообще отсутствуют в полученном дереве. Данный факт можно объяснить тем, что в исходных данных присутствует такой показатель как "Обеспеченность займа", и т.к этот фактор является точным обобщением четыре вышеописанных показателей, алгоритм построения дерева решений выбрал именно его.
Очень важной особенностью построенной модели является то, что правила, по которым определяется принадлежность заемщика к той или иной группе записаны на естественном языке.
Правильно построенное на данных прошлых периодов дерево решения обладает одной еще очень важной особенностью. Эта особенность называется способность к обобщению. То есть если возникает новая ситуация (обратился потенциальный заемщик), то, скорее всего, такие ситуации уже были и достаточно много. Вследствие чего можно с большой долей уверенности сказать, что вновь обратившийся заемщик поведет себя так же, как и те заемщики, характеристики которых очень похожи на характеристики вновь обратившегося. Также можно определять принадлежность потенциального заемщика к одному из классов. Для этого необходимо воспользоваться диалоговым окном "Эксперимент".
Используя такой подход можно устранить сразу оба вышеописанных недостатка скоринговой системы оценки кредитоспособности. То есть:
Стоимость адаптации сводится практически к минимуму за счет того, что алгоритмы построения модели классификации (дерево решений) - это самоадаптируемые модели (вмешательство человека минимально).
Другие материалы:
Состояние белорусского рынка дистанционного банковского обслуживания
Состояние рынка дистанционных банковских услуг в Республике Беларусь оценить крайне сложно. Банки неохотно делятся информацией о своих успехах в данной области. Все презентации, выступления и разговоры акцентируются на том функционале, ко ...
Анализ результативности
финансово-хозяйственной деятельности
Проведение анализа результативности финансово-хозяйственной деятельности, включающего в себя анализ прибыли, рентабельности и эффективности текущей деятельности (деловой активности). Анализ бухгалтерской прибыли начинается с исследования ...
Анализ современной практики финансирования инвестиционных
проектов коммерческими банками Узбекистана
Одним из наиболее сложных видов банковской деятельности является проектное финансирование. В Узбекистане деятельностью проектным финансированием занимаются всего 6 крупных банков из 31. Это такие банки как национальный банк внешнеэкономич ...