Формула Байеса :

Вероятности P(H i) гипотез H i называют априорными вероятностями - вероятности до проведения опытов.
Вероятности P(A/H i) называют апостериорными вероятностями – вероятности гипотез H i , уточненных в результате опыта.

Пример №1 . Прибор может собираться из высококачественных деталей и из деталей обычного качества. Около 40% приборов собираются из высококачественных деталей. Если прибор собран из высококачественных деталей, его надежность (вероятность безотказной работы) за время t равна 0,95; если из деталей обычного качества - его надежность равна 0,7. Прибор испытывался в течение времени t и работал безотказно. Найдите вероятность того, что он собран из высококачественных деталей.
Решение. Возможны две гипотезы: H 1 - прибор собран из высококачественных деталей; H 2 - прибор собран из деталей обычного качества. Вероятности этих гипотез до опыта: P(H 1) = 0,4, P(H 2) = 0,6. В результате опыта наблюдалось событие A - прибор безотказно работал время t. Условные вероятности этого события при гипотезах H 1 и H 2 равны: P(A|H 1) = 0,95; P(A|H 2) = 0,7. По формуле (12) находим вероятность гипотезы H 1 после опыта:

Пример №2 . Два стрелка независимо один от другого стреляют по одной мишени, делая каждый по одному выстрелу. Вероятность попадания в мишень для первого стрелка 0,8, для второго 0,4. После стрельбы в мишени обнаружена одна пробоина. Предполагая, что два стрелка не могут попасть в одну и ту же точку, найдите вероятность того, что в мишень попал первый стрелок.
Решение. Пусть событие A - после стрельбы в мишени обнаружена одна пробоина. До начала стрельбы возможны гипотезы:
H 1 - ни первый, ни второй стрелок не попадет, вероятность этой гипотезы: P(H 1) = 0,2 · 0,6 = 0,12.
H 2 - оба стрелка попадут, P(H 2) = 0,8 · 0,4 = 0,32.
H 3 - первый стрелок попадет, а второй не попадет, P(H 3) = 0,8 · 0,6 = 0,48.
H 4 - первый стрелок не попадет, а второй попадет, P (H 4) = 0,2 · 0,4 = 0,08.
Условные вероятности события A при этих гипотезах равны:

После опыта гипотезы H 1 и H 2 становятся невозможными, а вероятности гипотез H 3 и H 4
будут равны:


Итак, вероятнее всего, что мишень поражена первым стрелком.

Пример №3 . В монтажном цехе к устройству присоединяется электродвигатель. Электродвигатели поставляются тремя заводами-изготовителями. На складе имеются электродвигатели названных заводов соответственно в количестве 19,6 и 11 шт., которые могут безотказно работать до конца гарантийного срока соответственно с вероятностями 0,85, 0,76 и 0,71. Рабочий берет случайно один двигатель и монтирует его к устройству. Найдите вероятность того, что смонтированный и работающий безотказно до конца гарантийного срока электродвигатель поставлен соответственно первым, вторым или третьим заводом-изготовителем.
Решение. Первым испытанием является выбор электродвигателя, вторым - работа электродвигателя во время гарантийного срока. Рассмотрим следующие события:
A - электродвигатель работает безотказно до конца гарантийного срока;
H 1 - монтер возьмет двигатель из продукции первого завода;
H 2 - монтер возьмет двигатель из продукции второго завода;
H 3 - монтер возьмет двигатель из продукции третьего завода.
Вероятность события A вычисляем по формуле полной вероятности:

Условные вероятности заданы в условии задачи:

Найдем вероятности


По формулам Бейеса (12) вычисляем условные вероятности гипотез H i:

Пример №4 . Вероятности того, что во время работы системы, которая состоит из трех элементов, откажут элементы с номерами 1, 2 и 3, относятся как 3: 2: 5. Вероятности выявления отказов этих элементов равны соответственно 0,95; 0,9 и 0,6.

б) В условиях данной задачи во время работы системы обнаружен отказ. Какой из элементов вероятнее всего отказал?

Решение.
Пусть А - событие отказа. Введем систему гипотез H1 - отказ первого элемента, H2 - отказ второго элемента, H3 - отказ третьего элемента.
Находим вероятности гипотез:
P(H1) = 3/(3+2+5) = 0.3
P(H2) = 2/(3+2+5) = 0.2
P(H3) = 5/(3+2+5) = 0.5

Согласно условию задачи условные вероятности события А равны:
P(A|H1) = 0.95, P(A|H2) = 0.9, P(A|H3) = 0.6

а) Найдите вероятность обнаружения отказа в работе системы.
P(A) = P(H1)*P(A|H1) + P(H2)*P(A|H2) + P(H3)*P(A|H3) = 0.3*0.95 + 0.2*0.9 + 0.5*0.6 = 0.765

б) В условиях данной задачи во время работы системы обнаружен отказ. Какой из элементов вероятнее всего отказал?
P1 = P(H1)*P(A|H1)/ P(A) = 0.3*0.95 / 0.765 = 0.373
P2 = P(H2)*P(A|H2)/ P(A) = 0.2*0.9 / 0.765 = 0.235
P3 = P(H3)*P(A|H3)/ P(A) = 0.5*0.6 / 0.765 = 0.392

Максимальная вероятность у третьего элемента.

Краткая теория

Если событие наступает только при условии появления одного из событий образующих полную группу несовместных событий, то равна сумме произведений вероятностей каждого из событий на соответствующую условную вероятность кошелек .

При этом события называются гипотезами, а вероятности – априорными. Эта формула называется формулой полной вероятности.

Формула Байеса применяется при решении практических задач, когда событие , появляющееся совместно с каким-либо из событий образующих полную группу событий произошло и требуется провести количественную переоценку вероятностей гипотез . Априорные (до опыта) вероятности известны. Требуется вычислить апостериорные (после опыта) вероятности, т.е. по существу нужно найти условные вероятности . Формула Байеса выглядит так:

На следующей странице рассматривается задача на .

Пример решения задачи

Условие задачи 1

На фабрике станки 1,2 и 3 производят соответственно 20%, 35% и 45% всех деталей. В их продукции брак составляет соответственно 6%, 4%, 2%. Какова вероятность того, что случайно выбранное изделие оказалось дефектным? Какова вероятность того, что оно было произведено: а) станком 1; б) станком 2; в) станком 3?

Решение задачи 1

Обозначим через событие, состоящее в том, что стандартное изделие оказалось дефектным.

Событие может произойти только при условии наступления одного из трех событий:

Изделие произведено на станке 1;

Изделие произведено на станке 2;

Изделие произведено на станке 3;

Запишем условные вероятности:

Формула полной вероятности

Если событие может произойти только при выполнении одного из событий , которые образуютполную группу несовместных событий, то вероятность события вычисляется по формуле

По формуле полной вероятности находим вероятность события :

Формула Байеса

Формула Байеса позволяет «переставить причину и следствие»: по известному факту события вычислить вероятность того, что оно было вызвано данной причиной.

Вероятность того, что дефектное изделие изготовлено на станке 1:

Вероятность того, что дефектное изделие изготовлено на станке 2:

Вероятность того, что дефектное изделие изготовлено на станке 3:

Условие задачи 2

Группа состоит из 1 отличника, 5 хорошо успевающих студентов и 14 студентов, успевающих посредственно. Отличник отвечает на 5 и 4 с равной вероятностью, хорошист отвечает на 5, 4 и 3 с равной вероятностью, и посредственно успевающий студент отвечает на 4,3 и 2 с равной вероятностью. Случайно выбранный студент ответил на 4. Какова вероятность того, что был вызван посредственно успевающий студент?

Решение задачи 2

Гипотезы и условные вероятности

Возможны следующие гипотезы:

Отвечал отличник;

Отвечал хорошист;

–отвечал посредственно занимающийся студент;

Пусть событие -студент получит 4.

Ответ:

На цену сильно влияет срочность решения (от суток до нескольких часов). Онлайн-помощь на экзамене/зачете осуществляется по предварительной записи.

Заявку можно оставить прямо в чате, предварительно скинув условие задач и сообщив необходимые вам сроки решения. Время ответа - несколько минут.

Цель работы: сформировать навыки решения задач по теории вероятностей с помощью формулы полной вероятности и формулы Байеса.

Формула полной вероятности

Вероятность события А , которое может наступить лишь при условии появления одного из несовместных событий В х,В 2 ,...,В п, образующих полную группу, равна сумме произведений вероятностей каждого из этих событий на соответствующую условную вероятность события А:

Эту формулу называют формулой полной вероятности.

Вероятность гипотез. Формула Байеса

Пусть событие А может наступить при условии появления одного из несовместных событий В ь В 2 ,...,В п, образующих полную группу. Поскольку заранее неизвестно, какое из этих событий наступит, их называют гипотезами. Вероятность появления события А определяется по формуле полной вероятности:

Допустим, что произведено испытание, в результате которого появилось событие А . Требуется определить, как изменились (в связи с тем, что событие А уже наступило) вероятности гипотез. Условные вероятности гипотез находят по формуле

В этой формуле индекс / = 1,2

Эту формулу называют формулой Байеса (по имени английского математика, который её вывел; опубликована в 1764 г.). Формула Байеса позволяет переоценить вероятности гипотез после того, как становится известным результат испытания, в итоге которого появилось событие А .

Задача 1. Завод изготавливает определённого типа детали, каждая деталь имеет дефект с вероятностью 0,05. Деталь осматривается одним контролёром; он обнаруживает дефект с вероятностью 0,97, а если дефект не обнаружен, пропускает деталь в готовую продукцию. Кроме того, контролер может по ошибке забраковать деталь, не имеющую дефекта; вероятность этого равна 0,01. Найти вероятности следующих событий: А - деталь будет забракована; В - деталь будет забракована, но ошибочно; С - деталь будет пропущена в готовую продукцию с дефектом.

Решение

Обозначим гипотезы:

Н = (на контроль поступит стандартная деталь);

Н =(на контроль поступит нестандартная деталь).

Событие А = (деталь будет забракована).

Из условия задачи находим вероятности

Р Н (А) = 0,01; Pfi(A) = 0,97.

По формуле полной вероятности получаем

Вероятность того, что деталь будет забракована ошибочно, равна

Найдём вероятность того, что деталь будет пропущена в готовую продукцию с дефектом:

Ответ:

Задача 2. Изделие проверяется на стандартность одним из трёх товароведов. Вероятность того, что изделие попадёт к первому товароведу, равна 0,25, ко второму - 0,26 и к третьему - 0,49. Вероятность того, что изделие будет признано стандартным первым товароведом, равна 0,95, вторым - 0,98, третьим - 0,97. Найти вероятность того, что стандартное изделие проверено вторым контролёром.

Решение

Обозначим события:

Л. = (изделие для проверки попадёт к /-му товароведу); / = 1, 2, 3;

В = (изделие будет признано стандартным).

По условию задачи известны вероятности:

Также известны условные вероятности

По формуле Байеса находим вероятность того, что стандартное изделие проверено вторым контролёром:

Ответ: «0,263.

Задача 3. Два автомата производят детали, которые поступают на общий конвейер. Вероятность получения нестандартной детали на первом автомате равна 0,06, а на втором - 0,09. Производительность второго автомата вдвое больше, чем первого. С конвейера взята нестандартная деталь. Найти вероятность того, что эта деталь произведена вторым автоматом.

Решение

Обозначим события:

А. = (взятая с конвейера деталь произведена /-м автоматом); / = 1,2;

В = (взятая деталь окажется нестандартной).

Также известны условные вероятности

По формуле полной вероятности находим

По формуле Байеса находим вероятность того, что взятая нестандартная деталь произведена вторым автоматом:

Ответ: 0,75.

Задача 4. Испытывается прибор, состоящий из двух узлов, надёжность которых равна 0,8 и 0,9 соответственно. Узлы отказывают независимо друг от друга. Прибор отказал. Найти с учётом этого вероятности гипотез:

  • а) неисправен только первый узел;
  • б) неисправен только второй узел;
  • в) неисправны оба узла.

Решение

Обозначим события:

Д = (7-й узел не выйдет из строя); i = 1,2;

Д - соответствующие противоположные события;

А = (при испытании будет отказ прибора).

Из условия задачи получаем: Р(Д) = 0,8; Р(Л 2) = 0,9.

По свойству вероятностей противоположных событий

Событие А равно сумме произведений независимых событий

Используя теорему сложения вероятностей несовместных событий и теорему умножения вероятностей независимых событий, получаем

Теперь находим вероятности гипотез:

Ответ:

Задача 5. На заводе болты изготавливаются на трёх станках, которые производят соответственно 25%, 30% и 45% всего количества болтов. В продукции станков брак составляет соответственно 4%, 3% и 2%. Какова вероятность того, что болт, случайно взятый из поступившей продукции, окажется дефектным?

Решение

Обозначим события:

4 = (наудачу взятый болт изготовлен на /-м станке); i = 1, 2, 3;

В = (взятый наудачу болт окажется дефектным).

Из условия задачи по формуле классической вероятности находим вероятности гипотез:

Также по формуле классической вероятности находим условные вероятности:

По формуле полной вероятности находим

Ответ: 0,028.

Задача 6. Электронная схема принадлежит одной из трёх партий с вероятностями 0,25; 0,5 и 0,25. Вероятность того, что схема проработает сверх гарантийного срока службы для каждой из партий, соответственно составляет 0,1; 0,2 и 0,4. Найти вероятность того, что наугад взятая схема проработает сверх гарантийного срока службы.

Решение

Обозначим события:

4 = (наугад взятая схема из г-й партии); i = 1, 2, 3;

В = (наугад взятая схема проработает сверх гарантийного срока службы).

По условию задачи известны вероятности гипотез:

Также известны условные вероятности:

По формуле полной вероятности находим

Ответ: 0,225.

Задача 7. Прибор содержит два блока, исправность каждого из которых необходима для функционирования прибора. Вероятности безотказной работы для этих блоков соответственно равны 0,99 и 0,97. Прибор вышел из строя. Определить вероятность того, что отказали оба блока.

Решение

Обозначим события:

Д = (z-й блок выйдет из строя); i = 1,2;

А = (устройство выйдет из строя).

Из условия задачи по свойству вероятностей противоположных событий получаем: ДД) = 1-0,99 = 0,01; ДД) = 1-0,97 = 0,03.

Событие А наступает только тогда, когда наступает хотя бы одно из событий Д или А 2 . Поэтому это событие равно сумме событий А = Д + А 2 .

По теореме сложения вероятностей совместных событий получаем

По формуле Байеса находим вероятность того, что устройство вышло из строя из-за отказа обоих блоков.

Ответ:

Задачи для самостоятельного решения Задача 1. На складе телевизионного ателье имеется 70% кинескопов, изготовленных заводом № 1; остальные кинескопы изготовлены заводом № 2. Вероятность того, что кинескоп не выйдет из строя в течение гарантийного срока службы, равна 0,8 для кинескопов завода № 1 и 0,7 - для кинескопов завода № 2. Кинескоп выдержал гарантийный срок службы. Найти вероятность того, что он изготовлен заводом № 2.

Задача 2. На сборку поступают детали с трёх автоматов. Известно, что 1-й автомат даёт 0,3% брака, 2-й - 0,2%, 3-й - 0,4%. Найти вероятность поступления на сборку бракованной детали, если с 1-го автомата поступили 1000, со 2-го - 2000, с 3-го - 2500 деталей.

Задача 3. На двух станках производятся одинаковые детали. Вероятность того, что деталь, произведённая на первом станке, будет стандартной, равна 0,8, а на втором - 0,9. Производительность второго станка втрое больше производительности первого. Найти вероятность того, что стандартной будет деталь, взятая наудачу с транспортёра, на который поступают детали с обоих станков.

Задача 4. Руководитель компании решил воспользоваться услугами двух из трёх транспортных фирм. Вероятности несвоевременной доставки груза для первой, второй и третьей фирм равны соответственно 0,05; 0,1 и 0,07. Сопоставив эти данные с данными о безопасности грузоперевозок, руководитель пришёл к выводу о равнозначности выбора и решил сделать его по жребию. Найти вероятность того, что отправленный груз будет доставлен своевременно.

Задача 5. Прибор содержит два блока, исправность каждого из которых необходима для функционирования прибора. Вероятности безотказной работы для этих блоков соответственно равны 0,99 и 0,97. Прибор вышел из строя. Определите вероятность того, что отказал второй блок.

Задача 6. В сборочный цех поступают детали с трёх автоматов. Первый автомат даёт 3% брака, второй - 1% и третий - 2%. Определить вероятность попадания на сборку небракованной детали, если с каждого автомата поступило соответственно 500, 200, 300 деталей.

Задача 7. На склад поступает продукция трёх фирм. Причём продукция первой фирмы составляет 20%, второй - 46% и третьей - 34%. Известно также, что средний процент нестандартных изделий для первой фирмы равен 5%, для второй - 2% и для третьей - 1%. Найти вероятность того, что наудачу взятое изделие произведено второй фирмой, если оно оказалось стандартным.

Задача 8. Брак в продукции завода вследствие дефекта а составляет 5%, причём среди забракованных по признаку а продукции в 10% случаев встречается дефект р. А в продукции, свободной от дефекта а , дефект р встречается в 1% случаев. Найти вероятность встречи дефекта Р во всей продукции.

Задача 9. В фирме имеются 10 новых автомобилей и 5 старых, которые ранее находились в ремонте. Вероятность исправной работы для нового авто равна 0,94, старого - 0,91. Найти вероятность того, что наудачу выбранный автомобиль будет исправно работать.

Задача 10. Два датчика посылают сигналы в общий канал связи, причём первый из них посылает вдвое больше сигналов, чем второй. Вероятность получить искажённый сигнал от первого датчика равна 0,01, от второго - 0,03. Какова вероятность получить искажённый сигнал в общем канале связи?

Задача 11. Имеется пять партий изделий: три партии по 8 штук, из которых 6 стандартных и 2 нестандартных, и две партии по 10 штук, из которых 7 стандартных и 3 нестандартных. Наудачу выбирают одну из партий, а из этой партии берут деталь. Определить вероятность того, что взятая деталь будет стандартной.

Задача 12. Сборщик получает в среднем 50% деталей первого завода, 30% - второго завода и 20% - третьего завода. Вероятность того, что деталь первого завода отличного качества, равна 0,7; для деталей второго и третьего заводов соответственно 0,8 и 0,9. Наудачу взятая деталь оказалась отличного качества. Найти вероятность того, что деталь изготовлена первым заводом.

Задача 13. Таможенный досмотр автомашин осуществляют два инспектора. В среднем из 100 машин 45 проходят через первого инспектора. Вероятность того, что при досмотре машина, соответствующая таможенным правилам, не будет задержана, составляет 0,95 у первого инспектора и 0,85 - у второго. Найти вероятность того, что машина, соответствующая таможенным правилам, не будет задержана.

Задача 14. Детали, необходимые для сборки прибора, поступают с двух автоматов, производительность которых одинакова. Вычислите вероятность поступления на сборку стандартной детали, если один из автоматов даёт в среднем 3% нарушения стандарта, а второй - 2%.

Задача 15. Тренер по тяжёлой атлетике рассчитал, что для получения командных зачётных очков в данной весовой категории спортсмен должен толкнуть штангу в 200 кг. На место в команде претендуют Иванов, Петров и Сидоров. Иванов за время тренировок пытался поднять такой вес в 7 случаях, а поднял в 3 из них. Петров поднял в 6 случаях из 13, а Сидоров имеет 35%-ную вероятность успешно справиться со штангой. Тренер случайным жребием выбирает одного спортсмена в команду.

  • а) Найти вероятность того, что выбранный спортсмен принесёт команде зачётные очки.
  • б) Команда не получила зачётных очков. Найти вероятность того, что выступал Сидоров.

Задача 16. В белом ящике 12 красных и 6 синих шаров. В черном - 15 красных и 10 синих шаров. Бросают игральный кубик. Если выпадет количество очков, кратное 3, то наугад берут шар из белого ящика. Если выпадет любое другое количество очков, то наугад берут шар из черного ящика. Какова вероятность появления красного шара?

Задача 17. В двух ящиках имеются радиолампы. В первом ящике содержится 12 ламп, из них 1 нестандартная; во втором 10 ламп, из них 1 нестандартная. Из первого ящика наудачу взята лампа и переложена во второй. Найти вероятность того, что наудачу извлеченная из второго ящика лампа будет нестандартной.

Задача 18. В урну, содержащую два шара, опущен белый шар, после чего из нее наудачу извлечен один шар. Найти вероятность того, что извлеченный шар окажется белым, если равновозможны все возможные предположения о первоначальном составе шаров (по цвету).

Задача 19. В ящик, содержащий 3 одинаковые детали, брошена стандартная деталь, а затем наудачу одна деталь извлечена. Найти вероятность того, что извлечена стандартная деталь, если равновероятны все возможные предположения о числе стандартных деталей, первоначально находящихся в ящике.

Задача 20. Для улучшения качества радиосвязи используются два радиоприемника. Вероятность приема сигнала каждым приемником равна 0,8, и эти события (прием сигнала приемником) независимы. Определить вероятность приема сигнала, если вероятность безотказной работы за время сеанса радиосвязи для каждого приемника равна 0,9.

При выводе формулы полной вероятности предполагалось, что событие А , вероятность которого следовало определить, могло произойти с одним из событий Н 1 , Н 2 , ... , Н n , образующих полную группу попарно несовместных событий. При этом вероятности указанных событий (гипотез) были известны заранее. Предположим, что произведен эксперимент, в результате которого событие А наступило. Эта дополнительная информация позволяет произвести переоценку вероятностей гипотез Н i , вычислив Р(Н i /А).

или, воспользовавшись формулой полной вероятности, получим

Эту формулу называют формулой Байеса или теоремой гипотез. Формула Байеса позволяет «пересмотреть» вероятности гипотез после того, как становится известным результат опыта, в результате которого появилось событие А .

Вероятности Р(Н i) − это априорные вероятности гипотез (они вычислены до опыта). Вероятности же Р(Н i /А) − это апостериорные вероятности гипотез (они вычислены после опыта). Формула Байеса позволяет вычислить апостериорные вероятности по их априорным вероятностям и по условным вероятностям события А .

Пример . Известно, что 5 % всех мужчин и 0.25 % всех женщин дальтоники. Наугад выбранное лицо по номеру медицинской карточки страдает дальтонизмом. Какова вероятность того, что это мужчина?

Решение . Событие А – человек страдает дальтонизмом. Пространство элементарных событий для опыта – выбран человек по номеру медицинской карточки – Ω = {Н 1 , Н 2 } состоит из 2 событий:

Н 1 −выбран мужчина,

Н 2 −выбрана женщина.

Эти события могут быть выбраны в качестве гипотез.

По условию задачи (случайный выбор) вероятности этих событий одинаковые и равны Р(Н 1 ) = 0.5; Р(Н 2 ) = 0.5.

При этом условные вероятности того, что человек страдает дальтонизмом, равны соответственно:

Р(А/Н 1 ) = 0.05 = 1/20; Р(А/Н 2 ) = 0.0025 = 1/400.

Так как известно, что выбранный человек дальтоник, т. е. событие произошло, то используем формулу Байеса для переоценки первой гипотезы:

Пример. Имеются три одинаковых по виду ящика. В первом ящике 20 белых шаров, во втором – 10 белых и 10 черных, в третьем – 20 черных шаров. Из выбранного наугад ящика вынули белый шар. Вычислить вероятность того, что шар вынут из первого ящика.

Решение . Обозначим через А событие – появление белого шара. Можно сделать три предположения (гипотезы) о выборе ящика: Н 1 , Н 2 , Н 3 − выбор соответственно первого, второго и третьего ящика.

Так как выбор любого из ящиков равновозможен, то вероятности гипотез одинаковы:

Р(Н 1 )=Р(Н 2 )=Р(Н 3 )= 1/3.

По условию задачи вероятность извлечения белого шара из первого ящика

Вероятность извлечения белого шара из второго ящика



Вероятность извлечения белого шара из третьего ящика

Искомую вероятность находим по формуле Байеса:

Повторение испытаний. Формула Бернулли .

Проводится n испытаний, в каждом из которых событие А может произойти или не произойти, причем вероятность события А в каждом отдельном испытании постоянна, т.е. не меняется от опыта к опыту. Как найти вероятность события А в одном опыте мы уже знаем.

Представляет особый интерес вероятность появления определенного числа раз (m раз) события А в n опытах. подобные задачи решаются легко, если испытания являются независимыми.

Опр. Несколько испытаний называюся независимыми относительно события А , если вероятность события А в каждом из них не зависит от исходов других опытов.

Вероятность Р n (m) наступления события А ровно m раз (ненаступление n-m раз, событие ) в этих n испытаниях. Событие А появляется в самых разных последовательностях m раз).

Формулу Бернулли.

Очевидны следующие формулы:

Р n (mменее k раз в n испытаниях.

P n (m>k) = P n (k+1) + P n (k+2) +…+ P n (n) - вероятность наступления события А более k раз в n испытаниях.1) n = 8, m = 4, p = q = ½,

Формула Байеса

Теорема Байеса - одна из основных теорем элементарной теории вероятностей , которая определяет вероятность наступления события в условиях, когда на основе наблюдений известна лишь некоторая частичная информация о событиях. По формуле Байеса можно более точно пересчитывать вероятность, беря в учёт как ранее известную информацию, так и данные новых наблюдений.

«Физический смысл» и терминология

Формула Байеса позволяет «переставить причину и следствие»: по известному факту события вычислить вероятность того, что оно было вызвано данной причиной.

События, отражающие действие «причин», в данном случае обычно называют гипотезами , так как они - предполагаемые события, повлекшие данное. Безусловную вероятность справедливости гипотезы называют априорной (насколько вероятна причина вообще ), а условную - с учетом факта произошедшего события - апостериорной (насколько вероятна причина оказалась с учетом данных о событии ).

Следствие

Важным следствием формулы Байеса является формула полной вероятности события, зависящего от нескольких несовместных гипотез (и только от них! ).

- вероятность наступления события B , зависящего от ряда гипотез A i , если известны степени достоверности этих гипотез (например, измерены экспериментально);

Вывод формулы

Если событие зависит только от причин A i , то если оно произошло, значит, обязательно произошла какая-то из причин, т.е.

По формуле Байеса

Переносом P (B ) вправо получаем искомое выражение.

Метод фильтрации спама

Метод, основанный на теореме Байеса, нашел успешное применение в фильтрации спама .

Описание

При обучении фильтра для каждого встреченного в письмах слова высчитывается и сохраняется его «вес» - вероятность того, что письмо с этим словом - спам (в простейшем случае - по классическому определению вероятности: «появлений в спаме / появлений всего» ).

При проверке вновь пришедшего письма вычисляется вероятность того, что оно - спам, по указанной выше формуле для множества гипотез. В данном случае «гипотезы» - это слова, и для каждого слова «достоверность гипотезы» - % этого слова в письме, а «зависимость события от гипотезы» P (B | A i ) - вычисленнный ранее «вес» слова. То есть «вес» письма в данном случае - не что иное, как усредненный «вес» всех его слов.

Отнесение письма к «спаму» или «не-спаму» производится по тому, превышает ли его «вес» некую планку, заданную пользователем (обычно берут 60-80 %). После принятия решения по письму в базе данных обновляются «веса» для вошедших в него слов.

Характеристика

Данный метод прост (алгоритмы элементарны), удобен (позволяет обходиться без «черных списков» и подобных искусственных приемов), эффективен (после обучения на достаточно большой выборке отсекает до 95-97 % спама, и в случае любых ошибок его можно дообучать). В общем, есть все показания для его повсеместного использования, что и имеет место на практике - на его основе построены практически все современные спам-фильтры.

Впрочем, у метода есть и принципиальный недостаток: он базируется на предположении , что одни слова чаще встречаются в спаме, а другие - в обычных письмах , и неэффективен, если данное предположение неверно. Впрочем, как показывает практика, такой спам даже человек не в состоянии определить «на глаз» - только прочтя письмо и поняв его смысл.

Еще один, не принципиальный, недостаток, связанный с реализацией - метод работает только с текстом. Зная об этом ограничении, спамеры стали вкладывать рекламную информацию в картинку, текст же в письме либо отсутствует, либо не несет смысла. Против этого приходится пользоваться либо средствами распознавания текста («дорогая» процедура, применяется только при крайней необходимости), либо старыми методами фильтрации - «черные списки» и регулярные выражения (так как такие письма часто имеют стереотипную форму).

См. также

Примечания

Ссылки

Литература

  • Берд Киви. Теорема преподобного Байеса . // Журнал «Компьютерра», 24 августа 2001 г.
  • Paul Graham. A plan for spam (англ.). // Персональный сайт Paul Graham.

Wikimedia Foundation . 2010 .

Смотреть что такое "Формула Байеса" в других словарях:

    Формула, имеющая вид: где a1, А2,..., Ап несовместимые события, Общая схема применения Ф. в. г.: если событие В может происходить в разл. условиях, относительно которых сделано п гипотез А1, А2, ..., Аn с известными до опыта вероятностями P(A1),… … Геологическая энциклопедия

    Позволяет вычислить вероятность интересующего события через условные вероятности этого события в предположении неких гипотез, а также вероятностей этих гипотез. Формулировка Пусть дано вероятностное пространство, и полная группа попарно… … Википедия

    Позволяет вычислить вероятность интересующего события через условные вероятности этого события в предположении неких гипотез, а также вероятностей этих гипотез. Формулировка Пусть дано вероятностное пространство, и полная группа событий, таких… … Википедия

    - (или формула Байеса) одна из основных теорем теории вероятностей, которая позволяет определить вероятность того, что произошло какое либо событие (гипотеза) при наличии лишь косвенных тому подтверждений (данных), которые могут быть неточны … Википедия

    Теорема Байеса одна из основных теорем элементарной теории вероятностей, которая определяет вероятность наступления события в условиях, когда на основе наблюдений известна лишь некоторая частичная информация о событиях. По формуле Байеса можно… … Википедия

    Байес, Томас Томас Байес Reverend Thomas Bayes Дата рождения: 1702 год(1702) Место рождения … Википедия

    Томас Байес Reverend Thomas Bayes Дата рождения: 1702 год(1702) Место рождения: Лондон … Википедия

    Байесовский вывод один из методов статистического вывода, в котором для уточнения вероятностных оценок на истинность гипотез при поступлении свидетельств используется формула Байеса. Использование байесовского обновления особенно важно в… … Википедия

    Для улучшения этой статьи желательно?: Найти и оформить в виде сносок ссылки на авторитетные источники, подтверждающие написанное. Проставив сноски, внести более точные указания на источники. Пере … Википедия

    Будут ли заключенные друг друга предавать, следуя своим эгоистическим интересам, или будут молчать, тем самым минимизируя общий срок? Дилемма заключённого (англ. Prisoner s dilemma, реже употребляется название «дилемма … Википедия

Книги

  • Теория вероятностей и математическая статистика в задачах. Более 360 задач и упражнений , Борзых Д.А.. В предлагаемом пособии содержатся задачи различного уровня сложности. Однако основной акцент сделан на задачах средней сложности. Это сделано намеренно с тем, чтобы побудить студентов к…