Шрофф показал Маску, в каких ситуациях планировщик на базе нейронной сети будет работать лучше, чем подход на основе правил. В демонстрационном ролике дорога была усыпана пустыми алюминиевыми банками, упавшими дорожными конусами и всевозможным мусором. Автомобиль, управляемый планировщиком, объезжал препятствия, пересекал разметку и при необходимости нарушал некоторые правила. “Так происходит, когда мы начинаем вместо правил опираться на нейронную сеть, – сказал Шрофф. – Если включить эту систему, автомобиль никогда не попадет в аварию даже в неупорядоченной среде”. Маск обожал такие скачки в будущее. “Мы должны провести демонстрацию в стиле фильмов о Джеймсе Бонде, – сказал он, – чтобы со всех сторон взрывались бомбы, с неба падал НЛО, а машина ехала вперед, ничего не задевая”.
Как правило, системы машинного обучения нуждаются в цели или метрике, чтобы использовать ее в качестве ориентира. Маск любил определять, какие метрики должны быть важнее всего, и дал путеводную звезду – количество километров, которые автомобили, оснащенные системой полностью автономного вождения (ПАВ)
Члены команды установили в офисе огромные 85‐дюймовые мониторы, на которых в реальном времени показывалось, сколько километров автомобили, оснащенные системой ПАВ, в среднем проезжают без человеческого вмешательства. Замечая, что какое‐то вмешательство повторялось неоднократно – например, когда водители хватались за руль при перестроении, при слиянии дорог или при повороте на сложном перекрестке, – они корректировали правила и отлаживали планировщик на базе сети таким образом, чтобы это исправить. Они поставили у своих столов гонг и ударяли в него всякий раз, когда им удавалось решить проблему, которая вызывала человеческое вмешательство.
К середине апреля 2023 года Маск решил, что настало время испытать новый планировщик движения на базе нейронной сети. Он решил проехаться с ним по Пало-Альто. Шрофф и команда по разработке автопилота запрограммировали автомобиль таким образом, чтобы он опирался на программу, которую с помощью нейронной сети обучили имитировать поведение обычных водителей. В программе содержался лишь абсолютный минимум традиционного кода на основе правил.
Маск сел на водительское сиденье, а на пассажирском разместился Ашок Эллусвами, который занимал в
Готовясь выехать с парковки штаб-квартиры
Шрофф и его коллеги подробно рассказали, как программа для ПАВ, которую они использовали, проходила обучение на миллионах видеороликов, полученных с камер, работающих в автомобилях клиентов компании. Получившийся в результате программный стек оказался гораздо проще традиционного, основанного на тысячах правил, написанных человеком. “Он работает в десять раз быстрее и впоследствии позволит нам удалить триста тысяч строк кода”, – сказал Шрофф. Баух добавил, что программа напоминает ИИ-бота, играющего в очень скучную видеоигру. Маск хохотнул. Пока автомобиль самостоятельно лавировал в дорожном трафике, он достал телефон и принялся писать сообщения в твиттер.