Когда поздно вечером Маск вернулся в Сан-Франциско, он наконец нашел время поговорить со Шроффом, и тот подробно рассказал о своем проекте по созданию планировщика на базе нейронной сети. “Я считаю, что мне крайне важно продолжить эту работу”, – сказал Шрофф. Послушав его, Маск снова проникся энтузиазмом в отношении этого проекта и согласился. Он понял, что в будущем Tesla станет не только автомобильной компанией и не только компанией в сфере чистой энергетики. Полностью автономное вождение, робот Optimus и суперкомпьютер Dojo на базе машинного обучения сделают ее компанией, работающей в области искусственного интеллекта, причем не только в виртуальном мире чат-ботов, но также во вполне реальном мире заводов и дорог. Маск уже подумывал нанять группу специалистов по ИИ, чтобы составить конкуренцию OpenAI, и команда Tesla по разработке автопилота могла им в этом помочь.
Годами система автопилота Tesla опиралась на подход на основе правил. Она получала визуальные данные с установленных на автомобиле камер и распознавала такие вещи, как разметку, пешеходов, светофоры и все остальное, что попадало в поле зрения восьми камер. После этого программа применяла набор правил, например: “Остановись, когда горит красный сигнал”; “Двигайся, когда горит зеленый”; “Держись посередине между линиями разметки”; “Не пересекай двойную желтую линию, отделяющую встречную полосу”; “Проезжай перекресток только тогда, когда рядом нет быстро движущихся автомобилей, которые могут с тобой столкнуться” и так далее. Чтобы обучить систему применять эти правила в сложных ситуациях, инженеры Tesla вручную писали и обновляли сотни тысяч строк кода на языке C++.
Дхавал Шрофф за своим столом в Tesla
Проект по созданию планировщика на базе нейронной сети, которым занимался Шрофф, должен был добавить к этому новый уровень. “Вместо того чтобы определять необходимую траекторию автомобиля, опираясь только на правила, – говорит Шрофф, – мы определяем траекторию, также опираясь на нейронную сеть, которая учится на миллионах примеров, как поступают в разных ситуациях обычные водители”. Иными словами, система имитирует поведение людей. Оказавшись в определенной ситуации, нейронная сеть выбирает траекторию на основе того, что люди делали в тысячах подобных ситуаций. Примерно таким образом люди учатся говорить, водить машину, играть в шахматы, есть спагетти и делать почти что угодно еще. Порой нам дают набор правил, которым нужно следовать, но главным образом мы приобретаем навыки, наблюдая за поведением других. Такой подход к машинному обучению Алан Тьюринг описал в своей статье “Вычислительные машины и разум”, опубликованной в 1950 году.
Tesla обладала одним из крупнейших в мире суперкомпьютеров для обучения нейронных сетей. Он работал на графических процессорах (GPU), производимых компанией Nvidia. Маск рассчитывал, что в 2023 году ИИ-системы уже можно будет обучать на видеоданных с помощью суперкомпьютера Dojo, с нуля собранного в Tesla. Вычислительная мощность этого компьютера, микросхемы и инфраструктуру которого разработали штатные ИИ-инженеры Tesla, составляла почти восемь экзафлопс (1018 операций в секунду), что делало его самым мощным в мире суперкомпьютером для выполнения описанных задач. Его предполагалось использовать и для программы беспилотного вождения, и для робота Optimus. “Интересно работать над ними вместе, – говорит Маск. – Оба ищут свой путь в этом мире”.
К началу 2023 года в рамках проекта по разработке планировщика на базе нейронной сети было проанализировано 10 млн кадров видео с камер, установленных на автомобилях клиентов Tesla. Значит ли это, что система будет управлять автомобилем не лучше среднего водителя? “Нет, поскольку мы используем только данные, полученные в ситуациях, когда люди хорошо справлялись с управлением автомобилем”, – поясняет Шрофф. Специалисты по разметке данных, многие из которых работали в городе Баффало в штате Нью-Йорк, просматривали видео и ставили оценки действиям водителей. Маск велел им искать, “как поступил бы водитель Uber с пятизвездочным рейтингом”, и отобранные видеоролики в итоге использовались для обучения системы.
Маск регулярно прогуливался по штаб-квартире Tesla в Пало-Альто, где в открытом офисе сидели инженеры из команды по разработке автопилота, и частенько опускался рядом с ними на колени, чтобы что‐нибудь обсудить. Однажды Шрофф показал ему последние достижения команды. Они произвели на Маска впечатление, но у него возник вопрос: правда ли есть необходимость в этом новом подходе или же это чересчур? Одна из его установок гласила: не стоит запускать крылатую ракету, чтобы убить одну маленькую муху, ведь с этим справится и мухобойка. Может, использование нейронной сети для прокладки траектории – это неоправданно сложный способ работы с немногочисленными и маловероятными особыми случаями?