Как нам «русифицировать» Data Mining для оценки банковских рисков

РИСК МЕНЕДЖМЕНТ  Как Категория:  РИСК МЕНЕДЖМЕНТ
Опубликовал:         07.01.2023               print

Казалось бы, в продвинутом инструментарии Data Mining / Data Science нет недостатка. Но все не так просто. Дело не только в том, что почти все программные продукты на рынке — иностранного производства. Есть и проблемы, связанные с несоответствием аналитических средств программирования банковским задачам. Кроме того, опыт регуляторных валидаций банковских моделей в рамках внедрения подхода на основе внутренних рейтингов (ПВР) показал необходимость более легитимного и проверенного аналитического инструментария.


Полянский Юрий Николаевич В риск-менеджменте российских банков активно внедряются и совершенствуются аналитические подходы, особенно в сфере количественной оценки кредитного риска. В немалой степени это обусловлено бурным развитием науки и банковских технологий, в том числе в целях внедрения базельского подхода на основе внутренних рейтингов, современных международных стандартов финансовой отчетности (МСФО (IFRS) 9), передовых технологий принятия кредитных решений, планирования, управления капиталом и резервами. Все эти направления требуют не только современных аналитических методов проведения исследований категорий Data Mining/Data Science, но также эффективных программных инструментов и средств для их практического выполнения.


В российской банковской сфере одним из наиболее продвинутых аналитических решений в этой области является программный продукт SAS американской компании SAS Institute Inc., имеющий в своем составе высокоинтеллектуальные и узко специализированные компоненты SAS Enterprise Miner, SAS Credit Scoring, SAS Enterprise Guide, SAS / INSIGHT, SAS / STAT и др. Во многом по причине их уникальной научно-практической продвинутости SAS и ценится в банковской аналитике. У иных компонентов есть вполне достойные конкуренты, возможно даже превосходящие SAS.


Есть в этой сфере и другие, чуть менее известные, комплексные программные решения (SPSS, Stata, EViews, Statistica, JMP и множество других), а также языки программирования и другое программное обеспечение категории open source (с открытым исходным кодом), которые предоставляют пользователям широкие и гибкие возможности использования аналитических библиотек, совместного развития своего программного кода (R, Python, MATLAB и др.).
Словом, в продвинутом инструментарии Data Mining / Data Science вроде бы нет недостатка. Однако при более пристальном взгляде не всё оказывается так безоблачно.


Проблемы инструментария Data Mining / Data Science

  • • Во-первых, почти все существующие на рынке программные продукты — иностранного производства, что в современных реалиях не соответствует потребностям импортозамещения и поставленным задачам обеспечения государственной безопасности. Почти единственным отечественным программным продуктом, позволяющим решать в банковской сфере часть рассматриваемых задач (прежде всего — в части разработки скоринговых моделей), является Loginom (бывший Deductor). Однако этот продукт, получивший активное развитие и распространение в 2000-е годы (в т.ч. в сфере управления кредитным риском), тем не менее сейчас уже не вполне соответствует актуальным потребностям банковской аналитики и требует значительного совершенствования. С внедрением модельных методик ПВР и МСФО (IFRS) 9 круг решаемых банковскими аналитиками задач стал существенно шире скоринговых алгоритмов logit-регрессии, реализованных в Loginom.
  • • Во-вторых, применяемые на банковском рынке аналитические средства программирования по своей сути больше подходят для теоретических изысканий в студенческой аудитории или в НИИ, чем для промышленного («боевого») применения коммерческим банком в рыночных условиях с их многочисленными и срочными практическими задачами.
    Как правило, имеющиеся аналитические программные продукты предоставляют скорее широкий набор (библиотеку) элементарных статистических функций, которые довольно универсальны и предназначены для многогранного анализа в различных сферах деятельности. Однако такие «кубики» требуют глубоких знаний предметной области для решения конкретных практических задач. Бизнесу же настоятельно требуется несколько иное - готовые комплексные специализированные решения, узко профилированные под локальные бизнес-цели: например, построение и оценка качества моделей, участвующих в расчете резервов или капитала при внедрении ПВР или МСФО (IFRS) 9. То есть нужен не столько инструмент создания уникальных опытных экземпляров моделей, сколько промышленный конвейер быстрого решения типовых задач. Проблема ещё в том, что методология выполнения многих подобных исследований сама по себе в настоящее время не вполне сформировалась. А поэтому внедрение таких комплексных решений могло бы не просто автоматизировать и ускорить процедуру моделирования, но и быть своего рода руководством (учебником), шаг за шагом ведущим разработчика за собой, подсказывая верные решения, рекомендуя нужные параметры, стандартизуя формулы и алгоритмы, обеспечивая методическое единство применяемых подходов и терминов.
  • • В-третьих, рыночная стоимость владения продвинутыми программными комплексами уровня SAS достаточно высока. Позволить себе их использование может далеко не каждая компания или даже крупный банк. А потому на практике многие попросту отказываются от них в пользу свободно распространяемого ПО или вовсе простых электронных таблиц Microsoft Excel (особенно в корпоративном кредитовании, не столь многочисленном в сравнении с розницей). То есть многие ответственные аналитические задачи на практике зачастую решаются фактически «на коленке», тем самым банк полагается лишь на уровень компетенций исполнителя-моделиста (зачастую вчерашнего студента-математика, за счёт работодателя постигающего тонкости банковского дела и моделирования). Это может порождать методические и операционные ошибки, необоснованно завышать уровень операционного (в т.ч. модельного) риска, что неоднократно наблюдалось в ходе регуляторных валидаций в рамках внедрения ПВР.


Усложнение моделей оценки кредитного риска в связи с внедрением ПВР и МСФО

Модели оценки кредитного риска (ПВР, МСФО) в отличие от широко известных скорингов могут иметь гораздо более сложную (многоядерную, многомодульную) структуру, реализовывать гораздо более продвинутую и не вполне устоявшуюся логику. Состав их ключевых свойств, порядок исследований их качества существенно шире (см. рисунок ниже). В частности, помимо оценки известной в скорингах дискриминационной силы ядра модели необходимо исследование гораздо более широкого круга характеристик:

  • • прогностическая сила (точность) модели;
  • • стабильность модели с определением границ ее применимости;
  • • устойчивость модели к стрессовым изменениям внешних и внутренних условий;
  • • репрезентативность выборок и их релевантность текущему состоянию сегмента;
  • • внутренняя однородность и взаимная различность групп наблюдений;
  • • степень концентрированности наблюдений в формируемых группах.



Состав показателей и тестов, требуемых для оценки качества моделей, постоянно пополняется. Ранее известными показателями Gini и AUROC уже попросту не обойтись. При этом порядок расчета некоторых из них носит новаторский характер, отличающий их расчет от ранее принятых подходов. В частности, для выполнения ряда тестов уже недостаточно просто записать вычисляемую формулу, а требуется точно и пошагово конкретизировать верный порядок её расчета (например, для показателя Powerstat1).


В связи с внедрением ПВР и МСФО (IFRS) 9 существенно расширился состав моделей оценки кредитного риска. Помимо ранее известных моделей оценки вероятности дефолта (PD) появилась необходимость в более методически сложных моделях: оценки уровня потерь при дефолте (LGD), величины, подверженной риску дефолта (EAD), наилучшей оценки ожидаемых потерь (ELBE) и даже промежуточных «моделях внутри моделей».
Как показал опыт валидаций моделей ПВР, проведенных Банком России в нескольких передовых банках, помимо количественных (как правило, статистических) исследований есть также необходимость в проведении довольно специфического качественного анализа с применением визуальных средств (графики, рисунки, схемы и т.п.), не меньше влияющего на результат оценки.


Кроме того, внедрение моделей ПВР сопряжено с рядом регуляторно и юридически значимых особенностей (таблица). Прежде всего это обусловлено необходимостью обоснования всех особенностей разрабатываемой модели перед подразделениями внутренней валидации и внутреннего аудита банка, внешней аудиторской организацией и (или) национальным органом банковского надзора. Это существенно повышает уровень ответственности за качество выполняемых оценочных процедур, требует более легитимного и проверенного аналитического инструментария.


Ключевые регуляторные и юридические особенности моделей, применяемых для внутрибанковских и регуляторных целей

Сфера / процесс Методы и модели для внутренних целей Методы и модели для регуляторных целей
Сбор и подготовка данных По внутренним требованиям По требованиям регулятора
Разработка и тестирование По внутренним требованиям По требованиям регулятора
Документирование Рекомендуется Требуется
Внутренняя валидация Рекомендуется Требуется
Регуляторная валидация Не требуется Требуется
Внедрение По мере необходимости, оперативно После разрешения регулятора, зачастую долго
Изменения По мере необходимости, оперативно После разрешения регулятора, зачастую долго
Мониторинг Упрощенный (только внутренние процедуры) Глубокий (включая регуляторные процедуры)
Аудит Упрощенный (только внутренние процедуры) Глубокий (включая регуляторные процедуры)
Использование результатов Для любых внутренних целей по решению банка Для расчета риск-взвешенных активов (RWA). Комплексно для других внутренних целей

Особо подчеркнём, что в отличие от скоринговых моделей разработка моделей ПВР и МСФО (IFRS) 9 не является сугубо внутренним вопросом банка. В конечном счёте эти модели оказывают существенное влияние как на его финансовую устойчивость, так и на стабильность всей банковской и финансовой системы.
Все приведенные доводы показывают настоятельную необходимость для России иметь собственные продвинутые программные средства, реализующие отраслевые аналитические решения, позволяющие эффективно и надёжно осуществлять описанные количественные и качественные исследования в банковской сфере.


Энергия идеи   dvbi.ru                    Последнее изменение: 2023-01-07 16:31:21Z         Возрастная аудитория: 14-70         Комментариев:  0
Теги:  Презентации доклады
Пожалуйста, проголосуйте и ниже поставьте лайк:   rating


  Комментарии



Следующая статья:    Обзор типов веб-сервисов, доступных для применения в современных ИС
Предыдущая статья:  Определение групп адресов, ближайших к метро