Теория вероятностей

Введение в теорию вероятностей

Теория вероятностей – раздел математики, изучающий закономерности случайных явлений: случайные события, случайные величины, их свойства и операции над ними.

Случайная величина – это величина, которая принимает в результате опыта одно из множества значений, причём появление того или иного значения этой величины нельзя точно предсказать до её измерения.

Под испытанием (опытом) в теории вероятностей принято понимать наблюдение какого-либо явления при соблюдении определенного комплекса условий, который должен каждый раз строго выполняться при повторении данного испытания. Если то же самое явление наблюдается при другом комплексе условий, то это уже другое испытание.

Случайные события называются несовместными, если появление одного исключает появление другого. В противном случае они называются совместными.

Пример: в урне находятся 10 белых и 10 чёрных шаров. Наугад достают один шар. Событие “шар оказался чёрным” и событие “шар оказался белым” являются несовместными.

Если по условиям испытания нет никаких оснований предполагать, что один из исходов появляется чаще других, то все исходы являются равновозможными.

В эксперименте с 10-ю белыми и 10-ю чёрными шарами у нас нет оснований предполагать, что вероятность достать белый шар отличается от вероятности достать чёрный шар, поэтому оба этих события разумно считать равновозможными.

Второй пример: симметричная (“честная”) монетка, у которой выпадание орла и решки – равновозможные события.

Третий пример: игральная кость, у которой любая грань (от 1 до 6) выпадает одинаково часто.

События образуют полную группу, если в результате испытания гарантированно реализуется хотя бы одно из них.

В эксперименте с бросанием монетки полная группа состоит из двух событий: “выпал орёл” и “выпала решка”.

Для игральной кости полную группу образуют 6 событий: “выпало 1 очко”, “выпало 2 очка”, ..., “выпало 6 очков”.

Если полную группу образуют два несовместных события, то они называются противоположными. Выпадение орла или решки – противоположные события.

Элементарное событие – это событие, которое нельзя разделить на более простые события.

Пример элементарного события: при одном бросании игральной кости выпало четыре очка. Другой пример: при одном бросании монетки выпал орёл.

Пример неэлементарного случайного события: при одном бросании игральной кости выпало нечётное число очков. Данное событие можно разбить на элементарные события: «выпало 1 очко», «выпало 3 очка», «выпало 5 очков».

Вероятность – количественная оценка возможности наступления некоторого события. Принимает значения в диапазоне от 0 до 1 включительно.

Событие, вероятность которого равна 0, называют невозможным.

Событие, вероятность которого равна 1, называют достоверным.

Два события называются независимыми, если появление одного из них не изменяет вероятности другого.

Вероятностью случайного события A называется отношение числа n элементарных событий, составляющих событие A, к числу всех элементарных событий N:

\[\mathbb{P}(A) = \frac{n}{N}.\]

Здесь считается, что все элементарные события являются несовместными, равновозможными и образуют полную группу.

Пример 1: вероятность выпадения орла при бросании монетки составляет \(P = 1 / 2 = 0{,}5\).

Пример 2: вероятность выпадения числа “3” при однократном бросании игральной кости составляет \(P_{3} = 1 / 6 = 0{,}1666\ldots\)

Пример 3: вероятность выпадения нечётного числа очков при однократном бросании игральной кости составляет \(P_{1,3,5} = 3 / 6 = 1 / 2 = 0{,}5\).

Пример 4: в урне находятся 10 белых и 20 чёрных шаров. Вероятность наугад вытащить белый шар составляет \(P = 10 / 30 = 1 / 3 = 0{,}333\ldots\)

Значение вероятности оценивается теоретически, до проведения каких-либо экспериментов (априорная вероятность). Результат реального эксперимента характеризуется относительной частотой:

\[W(A) = \frac{n}{N},\]

где n – число появлений события A; N – общее число проведенных испытаний. При увеличении числа испытаний N относительная частота стремится к теоретической вероятности (эмпирическая или, иначе, апостериорная вероятность).

Кроме описанных двух подходов к вероятности (априорная классическая и апостериорная эмпирическая), существует ещё субъективная вероятность, которая описывает меру доверия к тому или иному суждению или оценку шансов, что то или иное событие произойдёт или не произойдёт. Первые две вероятности были объективными (вычислялись на основе априорной или апостериорной информации), в отличие от них субъективная вероятность зависит от того субъекта, который производит данную оценку. Субъективная вероятность используется в тех случаях, когда теоретическую или эмпирическую вероятность вычислить затруднительно.

Событие с нулевой вероятностью

(продолжение следует...)

Сложение вероятностей

Суммой двух событий \(A+B\) называют событие, состоящее в появлении события A, или события B, или обоих этих событий.

Если события A и B являются несовместными, то вероятность появления одного из них, безразлично какого, равна сумме вероятностей этих событий:

\[\mathbb{P}(A+B) = \mathbb{P}(A) + \mathbb{P}(B).\]

Пример: в урне 10 красных, 5 синих и 15 белых шаров. Найти вероятность появления цветного шара.

Решение: вероятность появления либо красного, либо синего шара:

\[\mathbb{P}(A+B) = \mathbb{P}(A) + \mathbb{P}(B) = 10/30 + 5/30 = 15/30 = 1/2.\]

Умножение вероятностей

Произведением двух событий A и B называют событие AB, состоящее в совместном появлении этих событий.

Пример: в урне находятся шары и кубики, оба могут быть белыми или чёрными. Допустим, событие A — это вытаскивание чёрного предмета, а событие B — вытаскивание кубика, тогда событие AB заключается в том, что вытащили чёрный кубик.

Если события A и B являются независимыми, то вероятность события AB равна произведению вероятностей этих событий:

\[\mathbb{P}(AB) = \mathbb{P}(A) \cdot \mathbb{P}(B).\]

Условная вероятность

Условная вероятность — вероятность одного события при условии, что другое событие уже произошло.

Обозначение: \(\mathbb{P}(A \mid B)\) — это вероятность события A при условии, что событие B уже произошло:

\[\mathbb{P}(A \mid B) = \frac{\mathbb{P}(AB)}{\mathbb{P}(B)}.\]

Если события A и B являются независимыми, то \(\mathbb{P}(A \mid B) = \mathbb{P}(A)\) и наоборот \(\mathbb{P}(B \mid A) = \mathbb{P}(B)\).

Пример: в урне 3 белых и 3 чёрных шара. Из урны наугад дважды вынимают по одному шару (не возвращая вытащенный шар обратно). Найти вероятность достать при втором испытании (B) белый шар, при условии, что в первом испытании (A) уже был извлечён чёрный шар.

Решение: после первого испытания в урне осталось 5 шаров, из них 3 белых. Следовательно:

\[\mathbb{P}(B \mid A) = 3 / 5 = 0{,}6.\]

Этот же результат можно получить по формуле:

\[\mathbb{P}(B \mid A) = \frac{\mathbb{P}(AB)}{\mathbb{P}(A)} = \frac{9 / 30}{3 / 6} = \frac{3}{5},\]

т.к. общее число возможных комбинаций при вытаскивании двух шаров составляет \(6\cdot 5 = 30\) (6 возможностей при первом испытании, 5 возможностей при втором), из них нашему событию AB благоприятствует только \(3\cdot 3 = 9\) (3 возможных белых шара при каждом испытании).

Для зависимых событий A и B вероятность события AB:

\[\mathbb{P}(AB) = \mathbb{P}(A) \mathbb{P}(B \mid A) = \mathbb{P}(B) \mathbb{P}(A \mid B).\]

Формула полной вероятности

Пусть событие \(A\) может наступить только при условии появления одного из несовместных событий \(B_1\), \(B_2\), ..., \(B_n\), которые образуют полную группу. Тогда вероятность события \(A\) можно рассчитать по формуле:

\[\mathbb{P}(A) = \mathbb{P}(A \mid B_1) \mathbb{P}(B_1) + \mathbb{P}(A \mid B_2) \mathbb{P}(B_2) + \ldots + \mathbb{P}(A \mid B_n) \mathbb{P}(B_n).\]

Дерево решений

Дерево решений (decision tree) наглядно показывает все возможные альтернативы и помогает рассчитать условные вероятности событий.

Допустим, мы используем некоторые технические индикаторы или графические паттерны, чтобы предугадать наступление некоторого события на бирже. Например, по графическим паттернам пытаемся предсказать разворот рынка. Будем считать наступлением события \(A\) появление разворотного графического паттерна. Тогда противоположное событие (отсутствие разворотного паттерна) будем обозначать \(A'\).

Если рынок развернулся (по каким-либо объективным критериям) – значит реализовалось событие \(B\). Если рынок не развернулся – реализовалось противоположное событие \(B'\).

Предположим, мы проанализировали на истории 1000 недельных отрезков 4-х часового графика котировок. В 250 случаях мы получили предварительный сигнал о развороте рынка, таким образом, эмпирическая (апостериорная) вероятность появления сигнала составляет \(P(A) = 250 / 1000 = 0{,}25\). Соответственно, в 750 случаях сигнала не было: \(P(A') = 750 / 1000 = 0{,}75\).

Из тех недель, когда мы получили сигнал о развороте, в 200 случаях рынок действительно развернулся, т.е. вероятность сложного события \(P(A \, B) = 200 / 1000 = 0{,}2\); в 50 случаях сигнал оказался ложным: \(P(A \, B') = 50 / 1000 = 0{,}05\).

Из тех недель, когда сигнал отсутствовал, в 100 случаях действительно никакого разворота не было: \(P(A' \, B') = 650 / 1000 = 0{,}65\); в 100 случаях разворот произошёл: \(P(A' \, B) = 100 / 1000 = 0{,}1\).

Всё описанное наглядно изображено на дереве решений (рис.1).

../_images/decisiontree1.png

Рис. 1. Дерево решений

Чтобы вычислить условную вероятность по дереву решений, надо вероятность сложного события (в нашем случае одного из четырёх) разделить на соответствующую безусловную вероятность предыдущего события–сигнала (в нашем случае одну из двух). Например, чтобы найти условную вероятность того, что рынок развернётся при наличии сигнала, надо \(P(A\, B)\) разделить на \(P(A)\):

\[P(B \mid A) = \frac{P(A\, B)}{P(A)} = \frac{200 / 1000}{250 / 1000} = 0{,}8.\]

Условная вероятность того, что рынок не развернётся при наличии сигнала:

\[P(B' \mid A) = \frac{P(A\, B')}{P(A)} = \frac{50 / 1000}{250 / 1000} = 0{,}2.\]

Попробуйте ответить на вопрос: являются ли в нашем примере события \(A\) и \(B\) статистически независимыми?

Вместо дерева решений можно также использовать таблицу сопряжённости признаков:

Таблица сопряжённости признаков для рис. 1
События \(B\) \(B'\) Всего
\(A\) 200 50 250
\(A'\) 100 650 750
Всего 300 700 1000

Формула Байеса

Формула Байеса (Bayes) позволяет в формулах поменять местами причину и следствие (по известному факту события вычислить вероятность того, что оно было вызвано данной причиной):

\[\mathbb{P}(A \mid B) = \frac{\mathbb{P}(B \mid A)\, \mathbb{P}(A)}{\mathbb{P}(B)},\]

где \(\mathbb{P}(A)\) — априорная вероятность \(A\); \(\mathbb{P}(A\mid B)\) — вероятность гипотезы \(A\) при наступлении события \(B\) (апостериорная вероятность); \(\mathbb{P}(B\mid A)\) — вероятность наступления события \(B\) при истинности гипотезы \(A\); \(\mathbb{P}(B)\) — полная вероятность наступления события \(B\).

Пример 1. Применим формулу Байеса для предыдущей задачи (см. рис.1). Найдём условную вероятность того, что мы получим сигнал, когда рынок действительно развернётся:

\[P(A \mid B) = \frac{P(B \mid A) \cdot P(A)}{P(B)} = \frac{200 / 1000}{(200 + 100) / 1000} = 0{,}667.\]

Аналогично для остальных трёх вариантов событий, например:

\[P(A' \mid B) = \frac{P(B \mid A') \cdot P(A')}{P(B)} = \frac{100 / 1000}{(200 + 100) / 1000} = 0{,}333.\]

Пример 2. При рентгеновском обследовании вероятность обнаружить заболевание туберкулезом у больного туберкулезом равна 0,9; вероятность принять здорового человека за больного равна 0,01. Доля больных туберкулезом по отношению ко всему населению равна 0,001. Найти вероятность того, что человек здоров, если он был признан больным при обследовании.

Решение: обозначим заглавными буквами Б и З больного и здорового человека соответственно. Строчными буквами б и з обозначим результат обследования. По условию задачи имеем вероятности P(б|Б) = 0,9; Р(б|З) = 0,01. Т.к. Р(Б) = 0,001, то P(З) = 0,999. Требуется найти Р(З|б). Вычислим сначала полную вероятность признания больным:

P(б) = Р(б|З) · P(З) + P(б|Б) · Р(Б) = 0,01 · 0,999 + 0,9 · 0,001 = 0,01089 = 1,089%.

Вероятность оказаться здоровым при диагнозе “болен”:

Р (З|б) = Р(б|З) · P(З) / P(б) = 0,999 · 0,01 / 0,01089 = 0,917 = 91,7%.

Таким образом, 91,7% людей, у которых обследование показало результат “болен”, на самом деле здоровые люди. Удивительный результат возникает по причине значительной разницы в долях больных туберкулёзом и здоровых. Туберкулёз — редкое явление, поэтому и возникает такой парадокс.

Пример 3. В течение 277 дней наблюдалось, как дельта открытого интереса на фьючерсе евро (6E), торгуемом на бирже CME, влияет на повышение или снижение цены в течение следующего дня.

Если дельта открытого интереса (по состоянию на вечер текущего дня) была положительной (т.е. открытый интерес увеличивался), то в 79 случаях цена закрытия следующего дня оказывалась выше, чем цена закрытия текущего дня; в 83 случаях цена была ниже. Если дельта открытого интереса была отрицательной (т.е. открытый интерес уменьшался), то цена закрытия следующего дня оказывалась выше в 61 случае; в 54 случаях цена была ниже.

Результаты этого эксперимента можно записать в виде таблицы сопряжённости. Обозначим через \(A\) событие, заключающееся в том, что дельта открытого интереса увеличилась; \(A'\) — уменьшилась. Через \(B\) обозначим событие, заключающееся в том, что цена закрытия следующего дня выше, чем цена закрытия текущего дня; \(B'\) — соответственно, ниже.

Таблица сопряжённости признаков для примера 3
События \(B\) \(B'\) Всего
\(A\) 79 83 162
\(A'\) 61 54 115
Всего 140 137 277

Вероятность того, что открытый интерес увеличится: \(P(A) = 162 / 277 = 0.585\). Вероятность того, что открытый интерес уменьшится: \(P(A') = 115 / 277 = 0.415\).

Вероятность того, что цена на следующий день увеличится: \(P(B) = 140 / 277 = 0.505\). Вероятность того, что цена уменьшится: \(P(B') = 137 / 277 = 0.495\).

Вероятность того, что открытый интерес и цена увеличится: \(P(A B) = P(B \mid A) P(A) = 79 / 277 = 0.285\). Вероятность того, что открытый интерес и цена уменьшится: \(P(A' B') = P(B' \mid A') P(A') = 54 / 277 = 0.195\). Вероятность того, что открытый интерес увеличится, а цена уменьшится: \(P(A B') = P(B' \mid A) P(A) = 83 / 277 = 0.3\). Вероятность того, что открытый интерес уменьшится, а цена увеличится: \(P(A' B) = P(B' \mid A) P(A') = 61 / 277 = 0.22\).

По формуле Байеса вероятность того, что цена увеличится, при условии, что открытый интерес увеличился:

\[P(B \mid A) = \frac{P(A \mid B) \cdot P(B)}{P(A)} = \frac{P(A B)}{P(A)} = \frac{79}{162} = 0.49.\]

Вероятность того, что цена уменьшится, при условии, что открытый интерес увеличился:

\[P(B' \mid A) = \frac{P(A \mid B') \cdot P(B')}{P(A)} = \frac{P(A B')}{P(A)} = \frac{83}{162} = 0.51.\]

Как и положено, сумма двух последних вероятностей равна 1.

Вероятность того, что цена увеличится, при условии, что открытый интерес уменьшился:

\[P(B \mid A') = \frac{P(A' \mid B) \cdot P(B)}{P(A')} = \frac{P(A' B)}{P(A')} = \frac{61}{115} = 0.53.\]

Вероятность того, что цена уменьшится, при условии, что открытый интерес уменьшился:

\[P(B' \mid A') = \frac{P(A' \mid B') \cdot P(B')}{P(A')} = \frac{P(A' B')}{P(A')} = \frac{54}{115} = 0.47.\]

Как и положено, сумма двух последних вероятностей равна 1.

Итак, при увеличении открытого интереса мы можем прогнозировать уменьшение цены фьючерса (с небольшим перевесом вероятностей), а при уменьшении открытого интереса — наоборот, увеличение цены.

Насколько этот перевес вероятностей значителен, чтобы его можно было надеяться использовать при торговле – к этому вопросу мы ещё вернёмся в разделе о проверке статистических гипотез.

(продолжение следует...)


Теги: Теория вероятностей




Комментарии (1)

Вы просматриваете: StatHypoTest.rst
Facebookdel.icio.usStumbleUponDiggGoogle+Twitter
Gravatar
Владимир говорит...
Пример расчёта достигаемого уровня значимости в MS Excel можно найти на http://arhiuch.ru
17th November 2016 4:29pm
Страница 1 из 1

* Обязательные поля
(Не публикуется)
 
Жирный Курсив Подчеркнутый Перечеркнутый Степень Индекс Код PHP Код Кавычки Вставить линию Вставить маркированный список Вставить нумерованный список Вставить ссылку Вставить e-mail Вставить изображение Вставить видео
 
Улыбка Печаль Удивление Смех Злость Язык Возмущение Ухмылка Подмигнуть Испуг Круто Скука Смущение Несерьёзно Шокирован
 
1000
Captcha
Refresh
 
Введите код:
 
Запомнить информацию введенную в поля формы.