Однако помните о том, что мы оба можем опоздать (см. рис. 6.1.). Иногда мы опаздываем на работу друг из-за друга, то есть вероятность того, что опоздают и Алекс, и Джордан, P(А, Д), превышает 0. Мы не можем просто сложить обе вероятности, потому что при этом были бы дважды учтены дни, в которые мы оба опаздываем. Чтобы это компенсировать, мы должны вычесть вероятность того, что мы оба опоздаем на работу после ночного обсуждения книги, которая составляет P(А, Д) = 2 %. В итоге мы имеем вероятность опоздания 5 % для Алекса, 10 % для Джордана, минус 2 %, когда опаздывают оба: 5 + 10–2 = 13 и 13/100 = 13 %.

Отталкиваясь от этого, мы можем сформулировать правило сложения вероятностей для случая, когда наступает одно или другое событие: P(А или Д) = P(А) + P) – P(А, Д) = 5 % + 10 % – 2 % = 13 %.

Помните о пересечении

При вычислении вероятности наступления множества событий некоторые испытывают сложности с вычитанием пересекающейся области. Однако делать это необходимо, поскольку вероятность никогда не может превышать 1. Давайте снова обратимся к простому примеру с бросанием кубика. Вероятность выпадения числа, большего 2, равна 4/6. Вероятность выпадения нечетного числа составляет 3/6. Если вы хотите узнать вероятность наступления того или другого события, вы не можете просто сложить 4/6 + 3/6, потому что в итоге у вас получится 7/6 = 1 1/6, то есть число, превышающее единицу, что нарушает вышеупомянутое правило. Мы должны вычесть пересекающуюся область, включающую все случаи, когда при бросании кубика выпадает число, большее 2 и являющееся нечетным, то есть числа 3 и 5, вероятность выпадения которых составляет 2/6.

Постановка задачи:P(К > 2 или К нечетное) =

Правило сложения:P(К > 2) + P(К нечетное) – P(К > 2, К нечетное) =

Вероятности: 4/6 + 3/6–2/6

Ответ: 5/6

Выпадение числа 2 – это единственный случай, который не удовлетворяет ни одному из условий.

Вы наверняка уже устали от различных нотаций, игральных костей, монеток и опаздывающих на работу авторов. Чтобы вы могли отдохнуть от всего этого, мы предлагаем вам выполнить следующее мысленное упражнение.

<p>Мысленное упражнение на определение вероятности</p>

Сэм – замкнутый, но очень способный. Ему 29 лет. Он получил высшее экономическое образование в родной Калифорнии. В студенчестве он был одержим данными, работал волонтером в университетском статистическом консультационном центре и самостоятельно учился программировать на языке Python.

Что из этого более вероятно?

1. Сэм живет в Огайо.

2. Сэм живет в Огайо и работает дата-сайентистом.

Правильный ответ – № 1, хотя в описании нет и намека на то, что Сэм может жить в Огайо, не являясь при этом дата-сайентистом. Это вариация популярной задачи про Линду из книги «Думай медленно… решай быстро»[49], с которой у большинства людей возникают сложности. А какой ответ выбрали вы?

Ответ № 2? Возможно, потому, что мы рассказали вам о том, что Сэм занимался программированием и мог быть дата-сайентистом. Ответ № 2 кажется более вероятным именно потому, что в нем упоминается событие, связанное с прошлым Сэма. Однако он все же менее вероятен, чем ответ № 1. И вот почему.

В данном примере отсутствуют обозначения и числа, но он по-прежнему отражает важный урок из предыдущего раздела. Вероятность одновременного наступления любых двух событий не может превышать вероятность наступления каждого из них в отдельности. Чем больше «и» вы добавляете в то или иное утверждение, тем меньше будет итоговая вероятность. Для того чтобы Сэм был дата-сайентистом и жил в Огайо, он должен для начала просто жить в Огайо. Например, он мог бы жить в Огайо и работать актуарием.

Перейти на страницу:

Все книги серии Мировой компьютерный бестселлер

Похожие книги