Благодаря эластичности и расширяемости инфраструктура может адаптироваться на ходу.

Гибкость

Информационные системы должны уметь справляться с внезапными переменами в бизнесе за счет регулирования и корпоративного управления. Способность к быстрой адаптации очень трудно реализовать в системе управления реляционными базами данных (СУРБД), даже для одного отделения банка. Системы надзора за соблюдением правовых норм по своей природе централизуют многочисленные потоки информации из разных стандартов и форматов. Обработка необходимых, но многочисленных изменений в системе источников, – невыполнимая миссия, если использовать СУРБД и ETL-решения.

Технологии больших данных предлагают прорывной подход к схеме управления данными, потому что данные и соответствующие структуры данных хранятся и управляются отдельно друг от друга. Основной подход, используемый технологиями в отношении больших данных, полагается на схемы данных для чтения, это означает, что данные хранятся в формате, управляемом приложением. Этот подход предоставляет больше гибкости, потому что схемы данных могут просто меняться. Но в таком варианте есть недостаток, потому что он предлагает ограниченную видимость данных: все спрятано за кодом.

В 2012 г. Scaled Risk представили гибридный подход, основанный на Schema on read, но улучшенный:

• реализацией схемы данных поверх метамодели;

• возможностью Schema on read положиться на несколько схем данных;

• возможностью Schema on read автоматически запускать преобразование типов.

Этот гибридный подход значительно уменьшил обычные расходы на внедрение централизованного хранилища данных на начальной стадии, а также при дальнейших его обновлениях.

Эластичность и расширяемость

Эластичность и расширяемость – это главные прорывы, привнесенные технологией больших данных. Обеспечение настоящей открытой распределенной архитектуры позволяет приложениям, использующим большие данные, предлагать неограниченные:

• хранилища данных;

• вычислительные возможности;

• кэширование (внутри памяти).

Внедрение регуляторной системы вызывает множество вопросов, как это было в веб-отрасли:

• до какого уровня сложности будут развиваться данные;

• как быстро будут увеличиваться объемы данных;

• понадобятся ли им больше вычислительных мощностей (например, вальвация);

• нужно ли им быть быстрее (например, закон Додда – Фрэнка и центры обмена информацией)?

Совмещение внутренних и внешних данных

Эффективная система надзора за нормативно-правовым соответствием должна уметь сочетать данные, которые банк уже хранит в своей внутренней системе, предоставленные третьими сторонами, и публично доступные данные (социальные сети, Интернет). Например, при помощи этих источников данных можно распознать отмывание денег путем корпоративных закупок:

• данные из системы банковских операций;

• данные из внешних директорий компании, чтобы идентифицировать акционеров;

• управление по контролю над иностранными активами казначейства США и другие похожие списки;

• результаты поиска информации о заинтересованных лицах.

Большие данные не только обеспечивают удобный сбор данных и их хранение, но также предлагают различные гибкие возможности по синхронизации данных из различных форматов.

В случае с обнаружением случаев отмывания денег, такая реализация позволит:

• обнаружить, что акционеры – это те же люди, которые упоминаются в результатах поиска в Интернете или списках управления по контролю над иностранными активами казначейства, даже если имена транслитерированы различным образом с различных языков;

• рассчитать надежность репутации посредством извлечения данных из Интернета;

• использовать возможности программы для обнаружения слабого сигнала или

• мошеннической схемы по операциям на счету.

Совмещая такую информацию, технология больших данных (как показано на рис. 1 выдаст немедленный результат о возможности отмывания денег. Похожая верификация в ручном режиме потребует нескольких часов работы и не будет настолько исчерпывающей и эффективной.

Улучшение традиционных подходов

Большие данные способны уменьшить уровень сложности данных и обнаружить слабые сигналы в огромных массивах информации. Статистика, анализ текста, машинное обучение усиливают распределенные возможности систем анализа больших данных, потому что они способны:

• хранить большие объемы данных и статистические данные за неограниченный период времени;

• исполнять сложные алгоритмы в режиме реального времени;

• хранить наиболее часто используемые данные в быстро распределенном кэше (т. е. в памяти);

• оставлять расходы на разумном уровне (используются средние серверы).

Такие подходы дают отличные результаты для извлечения скрытой информации из массивов данных при малом числе ложно положительных результатов.

С другой стороны, традиционные подходы слишком устарели, имеют ряд ограничений и часто упускают реальные положительные результаты. Другой недостаток устаревших подходов, использующих обработчики бизнес-правил, основанные на структурированных данных, – это трудность адаптации к изменениям в правовых нормах.

Перейти на страницу:

Поиск

Похожие книги