При подходе с использованием сетки данных данные предоставляются в виде курируемых, многократно используемых продуктов данных под непосредственным контролем бизнес-доменов (например, маркетинга и продаж, региональных операций, производственного предприятия), которые используют инструменты данных, предоставляемые ИТ. Сетка возникает по мере того, как несколько доменов создают свои собственные возможности работы с данными и получают данные друг от друга, предпочтительно с использованием инструментов федерации данных, как общий уровень обслуживания данных, чтобы минимизировать ненужное перемещение данных. Домены отвечают за свои собственные данные, что означает, что они должны решать проблемы доступности и качества данных для себя и других доменов, получающих свои данные через сетку.
Решение о переходе к сетке данных может легко эволюционировать по сравнению с "озером данных", поскольку оно в большей степени связано с операционной моделью данных, чем с выбором технологий обработки данных. Для большинства организаций, начинающих с высокоцентрализованных данных и ИТ-возможностей, а также с низким уровнем зрелости и владения бизнес-данными, путь к сетке данных может оказаться неподходящим. Однако сетка данных не является предложением "все или ничего". Крупные организации могут найти преимущества в работе в гибридной модели, где наиболее зрелые бизнес-домены присоединяются к модели сетки данных, владеют своими данными и создают продукты данных для удовлетворения своих потребностей, а менее зрелые домены продолжают использовать централизованную экспертизу данных.
Ткань данных - это модернизированный, централизованный подход к данным, "инь" по отношению к "янь" data mesh. Отличительной чертой data fabric является обещание значительно ускорить и удешевить интеграцию за счет виртуализации для подключения источников данных к data fabric без лишних перемещений данных. Это решает проблему, с которой сталкиваются крупные организации, работающие в мультиоблачных средах. Хотя у архетипа data fabric большой потенциал на будущее, возможности, необходимые для автоматической связи и интеграции данных в рамках большой и сложной организации, только начинают появляться. На момент написания этой статьи, возможно, еще слишком рано рассматривать архетип data fabric.
При выборе архетипа необходимо учитывать текущий путь развития облачных технологий и дорожную карту цифровых технологий. Если вы планируете использовать множество приложений с интенсивным искусственным интеллектом в дополнение к основным BI-приложениям, рассмотрите возможность создания хранилища данных. С другой стороны, если ваша "дорожная карта" цифровых технологий предполагает наличие большого количества BI-приложений, рассмотрите возможность создания облачного хранилища данных.
Облачная и локальная инфраструктура данных
Использование облачной инфраструктуры от крупнейших провайдеров публичных облаков может стать значительным ускорителем успешного внедрения и недорогой эксплуатации крупномасштабных возможностей работы с данными. Облачные сервисы дают огромные преимущества с точки зрения производительности ваших команд по работе с данными, которые больше не вынуждены управлять чрезмерно сложными системами данных и могут вместо этого сосредоточить свое время на реализации сценариев использования, обеспечивающих ценность бизнеса.
Появилось множество технологий облачных данных, которые облегчают создание цифровых решений и решений на основе искусственного интеллекта. Путь к использованию современных возможностей облачных данных постоянно упрощается, что делает технологии, которые раньше были отличительными, доступными для каждой компании.
Некоторые организации предпочитают создавать локальные системы или гибрид локальной и облачной. Обычно такое решение принимается по двум причинам: опасения по поводу использования "облака" для особо конфиденциальных данных или критически важных рабочих нагрузок или уверенность в том, что организация может разработать и создать современные возможности работы с данными, сопоставимые с возможностями поставщиков "облака".
Успевать за темпами инноваций и возможностями поставщиков облачных услуг очень сложно, поэтому выбор в пользу локального или гибридного подхода обычно делают только крупные организации с богатой историей технологических инноваций. Но будьте осторожны. Для достижения успеха необходимы передовые инженерные навыки, инвестиции в строительство и обслуживание современных центров обработки данных, а также готовность поддерживать эти инвестиции в течение длительного времени. Современные облачные платформы обычно требуют меньших инвестиций и обеспечивают регулярный поток инноваций, с которым организациям будет сложно сравниться, особенно для рабочих нагрузок ИИ, где инновации происходят особенно быстро и где потребности в инфраструктуре являются наиболее сложными.
Принятие решения о возможностях работы с данными и внедрение эталонных архитектур