Компьютерра - Журнал «Компьютерра» № 4 за 31 января 2006 года
В компании «Франклин & Грант», специалисты которой занимаются созданием математических моделей и их программной реализацией для решения финансовых задач, утверждают, что в России вообще не существует кредитных историй достаточной длины для обучения системы. Что уж говорить о новых типах кредитных продуктов, появляющихся в стране. Например, об ипотеке, собирать данные по которой для настройки системы нужно еще лет десять.
В ХКФБ проблему решили довольно оригинально, использовав для обучения своей системы скоринга базу данных о 4,2 млн. заемщиков из стран Центральной Европы. В этом случае «веса» различных исходных параметров получились достаточно схожими с российскими, и после небольшой коррекции под национальную специфику и текущий банк система стала работоспособной.
Если имеются выборки сравнительно небольшого размера, разумно использовать иные методы анализа, такие как метод ближайших соседей или дерево классификаций. В первом случае новому заемщику, исходя из каких-либо его характеристик, система ставит в соответствие определенную точку с соответствующими координатами. В зависимости от того, каких точек по соседству с данной большинство: «плохих» или «хороших» (которым соответствуют люди, отдавшие или не отдавшие кредит), принимается решение о выдаче денег. При использовании деревьев классификаций система обучается следующим образом. На основе имеющихся данных строится дерево. При построении все известные ситуации обучающей выборки сначала попадают в верхний узел, а потом распределяются по узлам (рис. 1). Критерий разбиения — это различные значения входного фактора.
Скоринг на практикеНа сегодняшний день системы скоринга строятся на базе «универсальных» аналитических комплексов (SAS, KXEN), реализуются или в виде отдельных приложений, или как модули многофункциональных банковских комплексов (Invoretail, SOWK). В частности, анализ платежеспособности заемщика применяется в последних версиях системы RS-Loans (компания R-Style Softlab), комплексном решении по автоматизации кредитного бизнеса банков. В такой реализации скоринга есть ощутимое преимущество: ведь оценка уже интегрирована в сам процесс выдачи кредита. RS-Loans, по сути, моделирует от начала до конца бизнес-процесс кредитования в виде прохождения документов по цепочке «заявка — кредитный комитет — кредитный договор» с использованием нескольких функциональных элементов: «Кредитный договор», «Клиент», «Договор обеспечения», «Объект обеспечения», «Банковская карта», «Счет», «Операции», «График погашения», «Филиал» и т. д.
В системе предусматривается разделение всех пользователей по двум основным должностям. Первая группа — кредитные инспекторы, которые занимаются сбором и оформлением документов, инициализацией операций и т. д. Вторая группа — кредитные бухгалтеры, чьи обязанности ограничиваются бухгалтерским отражением кредитной деятельности. При надобности в систему можно добавить новые должности, наделив их необходимым набором прав. Производительность кредитного отдела система повышает прежде всего за счет наличия процедур массовой обработки договоров: начисления процентов, выноса на просрочку, расчета групп риска, формирования резервов и т. д.
Задача скоринг-функционала — рассчитать максимальный размер кредита, который можно выдать клиенту, базируясь на его анкетных данных. В системе уже есть стандартный набор показателей, который банк-заказчик системы может дополнить собственными. Не секрет, что большинство банков использует собственные критерии оценки заемщика, в том числе довольно экзотичные, тщательно храня в тайне значимость тех или иных факторов для анализа. Иногда «для отвода глаз» в анкете даже присутствуют вопросы, ответы на которые никак не учитываются в ходе анализа. Расчет максимального размера кредита в RS-Loans для разных типов кредитования может рассчитываться по различным критериям. Так, при ипотеке, как правило, применяется схема, согласно которой максимальный размер кредита устанавливается исходя из платежеспособности заемщика и оценочной стоимости покупаемой недвижимости, а окончательная сумма выдаваемого кредита формируется с учетом наименьшего из полученных значений. В RS-Loans включен программный инструментарий для ввода аналогичных правил.
Скоринговые методики в системе имеют несколько вариантов применения. Пусть, например, покупатель желает приобрести в кредит какую-нибудь бытовую технику. При этом он имеет некоторые денежные средства, которые готов вложить. При обращении клиента к сотруднику банка последний вводит в БД информацию о заемщике + данные для скоринговых расчетов. Образец типовой анкеты в виде xls-файла поставляется в банк вместе с системой (см. таблицу). Этот образец служит основой для дальнейшей корректировки под требования конкретного банка — например, для исправления значений баллов за определенные клиентские характеристики или формирования новых шаблонов документов. В зависимости от ответов на вопросы система вычисляет максимальный размер кредита. Дальше бизнес-процесс и действия сотрудника зависят от опций схемы розничного кредитования, с учетом программной и аппаратной специфики банка, наличия выделенных каналов связи и полномочий сотрудника (наличия права подписи, например).
Этот процесс может работать по трем основным сценариям. Первый вариант используется, если в торговом центре («провайдере» услуг потребительского кредитования) есть выделенный канал для стабильной связи с главной БД RS-Loans. В этом случае данные анкеты автоматически загружаются в систему, быстро возвращается информация по платежеспособности клиента, максимальному размеру кредита и сопутствующая отчетность. Допускается введение в схему процедур проверки достоверности указанных заемщиком сведений. На основе полученного отчета сотрудник отказывает в кредите либо заключает договор на определенную сумму. Затем он заносит в систему информацию о своих действиях, подтверждаемых соответствующими документами. Вариант с единой БД и выделенным каналом наиболее удобен, так как в этом случае имеется возможность консолидировать и обрабатывать данные о заемщиках в одном месте или централизованно изменять методики скоринга. Допускается в этом варианте и использование Интернета для заполнения заявки непосредственно в HTML. Недостаток у такой схемы только один — доступ к базе по выделенному каналу не всегда возможен.
Если в торговом центре есть средства связи, но нет выделенного канала, передача данных идет по модему (GPRS— или обычному — неважно). Поскольку терминалы сотрудников, работающих с RS-Loans, могут действовать и через удаленное соединение, схема работы в этом случае практически аналогична предыдущей. По-прежнему будет использоваться единая база данных. Но есть другой вариант. Сотрудник банка может переслать анкетные данные напрямую или через Интернет в режиме безопасного соединения на сервер с БД RS-Loans. Серверный обработчик событий автоматически загрузит базу и сформирует необходимые отчеты и документы для обратной пересылки в торговый центр. Дополнительные сложности появляются в том случае, если прямая связь между местом продажи и главной БД RS-Loans отсутствует. Тогда приходится вести локальную БД клиентов, синхронизировать ее с центральной базой, обновлять и согласовывать «черный список» клиентов.
Первая модельВ модели Дюрана фигурируют группы факторов для определения степени кредитного риска и указаны коэффициенты для различных факторов, характеризующих кредитоспособность клиента:
1) Пол: женский (0,4 балла), мужской (0).
2) Возраст: 20 лет и меньше (0), 21 год (0,1), 22 года (0,2), 23 года и выше (0,3).
3) Срок проживания на одном месте: по 0,042 балла за каждый год, но не больше чем 0,42 в сумме.
4) Профессия: 0,55 — за профессию с низким риском, 0 — за профессию с высоким риском, 0,16 — другие профессии.
5) Финансовые показатели: наличие банковского счета (0,45), наличие недвижимости (0,35), наличие страхового полиса (0,19).
6) Работа: предприятия в общественной отрасли (0,21), другие (0).
7) Занятость: по 0,059 балла за каждый год стажа на последнем месте работы.
Сам Дюран определял сумму в 1,25 балла как порог кредитоспособности.
Примеры системПрактически все системы розничного кредитования поддерживают интеграцию с отдельными скоринговыми приложениями. Наиболее известны на российском рынке продукты компаний BaseGroup Labs и EGAR. BaseGroup Labs предлагает заказчикам систему
Deductor:Loans, последняя версия которой, кстати, была презентована в нынешнем январе. ПО построено на базе аналитической платформы Deductor, включающей инструменты для решения задач многомерного анализа (OLAP), бизнес-аналитики (business intelligence), «раскопок данных» (data mining) и др.
В состав Deductor:Loans входит модуль LoansBase.Generator, позволяющий генерировать «образцы» кредитных историй. Этот программный инструмент формирует набор примеров с разными анкетными портретами заемщиков по статистическим алгоритмам с учетом заданных распределений случайных величин. В качестве распределений можно использовать статистические данные по региону или экспертные оценки типов заемщиков. Искусственная кредитная история, по мнению разработчиков, является оптимальным вариантом обучающей выборки в тех случаях, когда реальной кредитной истории не существует или ее объем недостаточен. А такие проблемы особенно часто проявляются при потребительском кредитовании, где постоянно появляются новые виды кредитных продуктов. Причем «новички» отличаются от прежних видов кредитных программ суммой кредита или требованиями поручительства. В такой ситуации появляются и исчезают некоторые входные данные, что делает уже построенную скоринговую модель неприемлемой.