Арул Элумалай, Джеймс Каплан, Майк Ньюборн и Роджер Робертс, "Обеспечение безопасного перехода к публичному облаку", McKinsey.com, 1 января 2018 г., https://www.mckinsey.com/capabilities/mckinsey- digital/our-insights/making-a-secure-transition-to-the-public-cloud.
Джим Боэм, Чарли Льюис, Кэтлин Ли, Дэниел Уолланс и Деннис Диас, "Тенденции кибербезопасности: Заглядывая за горизонт", McKinsey
.com, 10 марта 2022 г., https://www.mckinsey.com/capabilities/risk- and-resilience/our-insights/cybersecurity/cybersecurity-trends-looking-over-the-horizon.
Глава 23.
MLOps
, чтобы ИИ мог масштабироваться
Для того чтобы AI/ML внес значительный вклад в итоговый результат компании, организации должны масштабировать технологию по всей организации, внедряя ее в основные бизнес-процессы, рабочие процессы и путешествия клиентов для оптимизации принятия решений и операций в режиме реального времени. Это особенно сложно в случае с моделями AI/ML, поскольку они представляют собой "живые организмы", которые меняются вместе с базовыми данными. Они требуют постоянного мониторинга, переобучения и дебилизации, что является сложной задачей даже для нескольких ML-моделей, но просто непреодолимой для сотен.
Определение ключевых терминов
Искусственный интеллект (ИИ) охватывает широкую концепцию создания умных интеллектуальных машин.
Машинное обучение (ML) - это подмножество искусственного интеллекта. Это метод, который "учится" на данных, чтобы повысить эффективность выполнения некоторого набора задач.
Глубокое обучение - это подмножество машинного обучения. Оно использует огромные объемы данных и сложные алгоритмы для обучения модели.
В последние годы масштабное совершенствование инструментов и технологий ML значительно изменило рабочие процессы ML, ускорило жизненный цикл приложений и позволило последовательно и надежно масштабировать AI в бизнес-области. Однако, несмотря на все эти новые возможности, необходимо помнить, что эффективная работа с ML (MLOps) требует сосредоточения на всем комплексе работ по разработке приложений, а не только на самих моделях. По нашим оценкам, до 90 % неудач в разработке ML связаны не с разработкой плохих моделей, а с неэффективной практикой продуктивизации и проблемами интеграции модели с производственными данными и бизнес-приложениями, которые не позволяют модели масштабироваться и работать как положено. Эффективная продуктизация требует разработки интегрированного набора компонентов для поддержки модели (или, зачастую, набора моделей), таких как активы данных, алгоритмы ML, программное обеспечение и пользовательский интерфейс.
MLOps - это набор практик, которые применяются на протяжении всего жизненного цикла модели ML (см. Рисунок 23.1):
Данные: Создание систем и процессов, позволяющих непрерывно собирать, хранить, анализировать, маркировать и поддерживать высококачественные данные в масштабе для приложений ML.
Разработка моделей: Профессионализация разработки моделей, чтобы гарантировать, что высококачественные алгоритмы могут быть объяснены, не являются предвзятыми, работают так, как ожидается, и постоянно контролируются и регулярно обновляются с использованием свежих данных.
Конвейеры данных и моделей: Максимальное увеличение ценности для бизнеса и снижение затрат на проектирование за счет создания интегрированных конвейеров приложений, которые принимают данные или события, обрабатывают и обогащают их, запускают модель, обрабатывают результаты, генерируют действия, отслеживают различные компоненты и бизнес-показатели.
Разработка и масштабирование: Усовершенствование компонентов обработки данных и обучения моделей для работы в масштабе, включая добавление тестов, проверку, безопасность, CI/CD и переобучение моделей.
Оперативная работа: Активный мониторинг ресурсов, производительности и бизнес-показателей.