Масштабируемость. Базовая инфраструктура должна иметь возможность масштабироваться по мере необходимости в зависимости от спроса. Облачные провайдеры обладают подобными возможностями масштабирования, но компаниям необходимо настроить специальные сервисы для определения нагрузки на приложения, которые могут нуждаться в масштабировании. Например, Amazon предоставляет услугу AWS Auto Scal- ing, которая отслеживает нагрузку на приложения и масштабирует мощности для поддержания производительности. Компаниям необходимо четко продумать, какие сервисы они используют, поскольку каждый из них имеет свой собственный набор зависимостей.
Доступность. Несмотря на то что поставщики облачных услуг отличаются устойчивостью и надежностью, в их среде могут происходить сбои. Важно обеспечить возможность переключения с одной географии на другую без перебоев. Для этого существует множество механизмов, включая наличие отдельной посадочной зоны или вторичной производственной среды, работающей в другой географии, т. е. зеркальной производственной среды. Вторичная производственная среда использует тот же IaC, что и основная производственная среда. Компаниям необходимо настроить мониторинг на поиск сбоев и при их обнаружении переключиться с первичной среды на вторичную.
Включить мониторинг и наблюдаемость
Мониторинг кажется сухой темой, но он очень важен и часто неправильно понимается. Компаниям нужен хороший способ понять состояние и активность инфраструктуры, среды, решений, которые они создали, и пользователей этих приложений. Мониторинг основывается на знании того, что вы ищете, поэтому вы можете определить приборные панели для предупреждений, когда происходит то, что вы ищете:
Мониторинг приложений. Решения, которые разрабатывают agile pods, нуждаются в мониторинге для обеспечения надежности, а также для сбора обратной связи и телеметрии о том, как бизнес-пользователи взаимодействуют с решением. Обычно используются такие инструменты, как Datadog, New Relic или Dynatrace.
Мониторинг облаков и инфраструктуры. Сюда входит информация о том, какие данные поступают в ваше облако, кто его использует и какова производительность. Для этого можно использовать такие инструменты, как New Relic или Zabbix. Например, если вы используете традиционные виртуальные серверы в облаке, то понимание их поведения и нагрузки очень важно, особенно при диагностике проблем с производительностью приложений. Виртуальные серверы обычно имеют фиксированный размер, поэтому скачки нагрузки могут повлиять на производительность и скорость отклика для конечных пользователей. Мониторинг надежности потока данных и их качества - менее развитая область. Помимо упомянутых ранее инструментов, существуют и другие, например, инструменты мониторинга в Azure Data Factory, которые позволяют следить за поступлением данных.
Обратите внимание, что не существует единого инструмента мониторинга, который позволил бы организациям понять сквозной поток информации. Для целей производства команда разработчиков платформы должна определить, какие инструменты ей нужны, чтобы не только обеспечить надежность среды, но и быстро диагностировать проблемы, если они возникнут. На рис. 21.2 показана панель мониторинга производительности для решений McKinsey по аналитике корпоративных финансов. Эти решения доступны клиентам через веб-интерфейс или API.
Приборная панель, созданная с помощью инструментария New Relic, предоставляет типичную информацию о производительности приложений, которую должна отслеживать команда разработчиков решений. В верхней части приборной панели отслеживается время отклика, предоставляемое пользователям, включая показатели Adpex (соотношение удовлетворенных запросов к общему количеству запросов). Средняя часть помогает команде разработчиков определить функции (или транзакции, в данном случае), которые отвечают наименее оперативно, и таким образом подсказывает инженерам по облачным технологиям и программному обеспечению, какие функции следует улучшить в первую очередь. Наконец, нижняя часть помогает оптимизировать использование облачного хранилища и вычислений с течением времени, лучше согласуя потребности в эластичности рабочей нагрузки с приобретенным облачным сервисом.
Образец панели мониторинга для цифрового решения
30
15K
0
0
0K
5pm
7 вечера
9 вечера
5pm
7 вечера
9 вечера
11 вечера
5pm
7 вечера
9 вечера
11 вечера
ТРЕУГОЛЬНИК
30K
ФИЗИЧЕСКАЯ ПАМЯТЬ
60
ЗАГРУЗКА ПРОЦЕССОРА
9
6
3
ОБЗОР VM 1/31-2/7
20.7 61.5
Avg. CPUОбщее физическое использование память
Февраль 7 Февраль 8 Февраль 9 Февраль 10 Февраль 11 Февраль 12 Февраль 13
ОПЕРАЦИИ ПО ДНЯМ
ПОСЛЕДНЯЯ ОШИБКА
С 1 недели назад
О сайте
5 часов назад
TOP FAILED TRANSACTIONS Since 1 week ago
WebTransaction/Go/POST/run_binary 0.36%
WebTransaction/Go/POST/run/:section/:template 0.13%
WebTransaction/Go/POST/calculate 0.049%
WebTransaction/Go/POST/calculate/batched 0.012%
1.56 k
Неудачные транзакции
ОБЗОР ОШИБОК С 1 недели назад
0.017%
Неудачные транзакции в %
11 вечера