Методология построения скоринговых систем.
Методы и подходы, лежащие в основе скоринговых систем, весьма разнообразны. К основным известным и используемым в настоящее время методам могут быть отнесены следующие:
1. Линейный дискриминантный анализ.
Дискриминантный анализ – это раздел математической статистики, содержанием которого является разработка методов решения задач различения (дискриминации) объектов наблюдения по определенным признакам. Применительно к скорингу объекты наблюдения – это данные о потенциальном заемщике, признаки – характеристики (факторы). Дискриминируются заемщики на два класса: кредитоспособные и некредитоспособные. Процедуры дискриминантного анализа можно разделить на две группы. Первая группа процедур предназначена для описания (интерпретации) различия между существующими классами, вторая – для проведения классификации новых объектов в тех случаях, когда неизвестно заранее, к какому из существующих классов они относятся.
Пусть имеется множество объектов наблюдения (кредитных договоров с данными по заемщикам и результатом – кредит погашен должным образом или имели место проблемы). Каждая единица наблюдения характеризуется несколькими факторами (переменными): xij – значение j-й переменной у i-го объекта, при i = 1 .N; j = 1 .p. Все множество объектов разбито на несколько подмножеств (два и более), или классов. Из каждого подмножества взята выборка объемом nk, где k – номер подмножества (класса) при к = l .g. Признаки, которые используются для того, чтобы отличать один класс (подмножество) от другого, называются дискриминантными переменными (предикторами). Каждая из этих переменных должна измеряться либо по интервальной шкале, либо по шкале отношений.
Интервальная шкала позволяет количественно описать различия между свойствами объектов. Для задания шкалы устанавливаются произвольная точка отсчета и единица измерения. Примерами таких шкал являются возраст заемщика, уровень его среднемесячного дохода за последние 6 месяцев и т.д.
Шкала отношений – частный случай интервальной шкалы. Она позволяет соотносить категоризированные предикторы. Теоретически число дискриминантных переменных не ограничено, но на практике их выбор осуществляется на основании содержательного анализа исходной информации и соответствующих статистических процедур оценки вклада каждого предиктора в процесс формирования правильных решений по классификации. Число объектов наблюдения должно превышать число дискриминантных переменных как минимум на два, то есть p < N. Дискриминантные переменные должны быть линейно независимыми. Еще одним предположением при дискриминантном анализе является нормальность закона распределения многомерной величины, то есть каждая из дискриминантных переменных внутри каждого из рассматриваемых классов должна быть подчинена нормальному закону распределения. В случае когда реальная картина в выборочных совокупностях отличается от выдвинутых предпосылок, следует решать вопрос о целесообразности использования процедур дискриминантного анализа для классификации новых наблюдений, так как при этом затрудняются расчеты каждого критерия классификации. Линейная дискриминантная функция имеет вид:
D(X) = w0 + w1x1 + w2x2 + . + wn xn, (1.10)
где wi- коэффициенты.
Для случая дискриминации на два класса решающее правило выглядит следующим образом: если D(X) <= 0, объект Х относится к 1-му классу, если D(X) >= 0, - ко 2-му. Необходимо отметить, что дискриминантный анализ является достаточно грубым и приближенным методом для скоринга в силу сделанных предположений и линейности самой дискриминантной функции. Однако данный метод важен в начале разработки скоринговых систем для оценки важности ("просеивания") предикторов.
2. Многофакторная логистическая регрессия.
Логика построения уравнения логистической регрессии аналогична построению линейной дискриминантной функции:
log(p/(1-p)) = w0 + w1x1 + w2x2 + . + wnxn, (1.11)
где р – вероятность дефолта (невозврата кредита),
w – весовые коэффициенты,
х – характеристики клиента.
В результате распознавания или классификации по предъявляемому объекту – потенциальному заемщику уравнение логистической регрессии дает оценку вероятности дефолта (невозврата) кредита. Если разработчиками скоринговой системы заранее установлено определенное пороговое значение этой вероятности для разделения двух классов объектов (например, "надежный заемщик" и "проблемный заемщик"), такая конструкция будет способна в автоматическом режиме формировать вывод о допустимости или недопустимости выдачи кредита. Все регрессионные методы чувствительны к корреляции между характеристиками, поэтому в модели не должно быть сильно коррелированных независимых переменных.
Другие материалы:
Общие принципы ипотечного кредитования в Европе
В настоящее время ипотека в странах ЕЭС является мощным фактором развития экономики. В странах ЕЭС до 80% всех залогов являются ипотечными. Процент за ипотечный кредит существенно ниже, чем за другие виды банковских кредитов. Ипотечный кредит, как правило, выдается на срок 15-40 лет. Процент кредит ...
Характеристика персонала
Персонал является одним из основных ресурсов предприятия, от которого зависят результаты деятельности фирмы. Его структуру можно охарактеризовать как по количеству, так и по качеству. Чтобы отразить количественное состояние работающих, используют следующие показатели: · явочная численность (определ ...
Торги на Нью-Йоркской фондовой бирже
Объем торгов: $14, 125 трлн. (2005 год) Листинг: 2672 компаний (2006 год) Капитализация: $13, 884 трлн. (2006 год) Прибыль: $16, 319 (2005 год) Объем торгов на Нью-йоркской фондовой бирже 10 мая 2008 года (NYSE) стал самым низким в 2008 году. Такое падение свидетельствует о том, что инвесторы, руко ...