Я предполагаю, что у вас уже есть некоторое базовое понимание перестановки, комбинации и вероятности (например, условной вероятности / теоремы Бая). Я сосредоточусь на области вероятности, которая используется в разработке функций. Я не буду углубляться в математику ни в одном из дистрибутивов; однако, если вам интересно узнать, не стесняйтесь сообщить мне об этом в комментариях. Если у вас нет базового представления о вероятности, тогда этот пост не для вас; Я расскажу об основной вероятности в другом посте.

Дискретный: Р.В. (случайная величина) X называется дискретной R.V. если это набор возможных результатов, пространство отсчетов S счетно (конечная или бесконечная последовательность с таким количеством элементов, сколько есть целых чисел).

Непрерывный: Р.В. X называется непрерывным R.V. если S содержит бесконечные числа, равные количеству точек на отрезке.

Функция плотности вероятности (PDF):

Функции плотности вероятности учитывают непрерывные случайные величины. Таким образом, они дают значение, например, P (2 ‹x‹ 4), что, конечно же, выполняется посредством интеграции, за исключением нормального или логнормального распределений, где таблица z проще и обычно используется.

Вероятностная функция масс (PMF):

Вероятностные массовые функции учитывают только дискретные случайные величины. Таким образом, они дают значение P (X = x). Другими словами, PDF в случае дискретных переменных называется PMF.

Кумулятивная функция распределения (CDF):

Кумулятивная функция распределения (CDF) - это вероятность того, что переменная принимает значение, меньшее или равное x. То есть {F (x) = Pr [X≤x] = α}.

Для непрерывного распределения это можно выразить математически как

Для дискретного распределения CDF можно выразить как

Ниже приведен график нормальной кумулятивной функции распределения.

  • Дискретные распределения вероятностей: биномиальное распределение, распределение Пуассона, геометрическое распределение, отрицательное биномиальное распределение, гипергеометрическое распределение, полиномиальное распределение, многомерные гипергеометрические распределения.
  • Непрерывные распределения вероятностей: равномерное (прямоугольное) распределение, нормальное распределение, гамма-распределение, экспоненциальное распределение, распределение x² (хи-квадрат), бета-распределение, двумерное распределение, t-распределение, F-распределение.

Биномиальное распределение:

Биномиальное распределение можно рассматривать как просто вероятность УСПЕХА или НЕУДАЧИ в эксперименте или опросе, который повторяется несколько раз. Биномиальное распределение - это тип распределения, который имеет два возможных результата (префикс «би» означает два или два). Например, подбрасывание монеты имеет только два возможных результата: орел или решка, а сдача теста может иметь два возможных результата: сдан или не пройден.

Распределение Пуассона:

Распределение Пуассона - это дискретное распределение вероятностей количества событий, происходящих в заданный период времени, с учетом среднего количества раз, когда событие происходит за этот период времени.

Условия использования распределения Пуассона:

  • Событие может происходить любое количество раз в течение периода времени.
  • События происходят независимо. Другими словами, если событие происходит, это не влияет на вероятность того, что другое событие произойдет в тот же период времени.
  • Частота появления постоянна; то есть ставка не меняется в зависимости от времени.
  • Вероятность возникновения события пропорциональна продолжительности периода времени. Например, вероятность того, что событие произойдет за 2 часа, должна быть вдвое выше, чем за 1 час.

Более подробно о распределении Пуассона можно прочитать в этой статье.

Функция масс вероятности распределения Пуассона определяется выражением:

Геометрическое распределение:

Геометрическое распределение, интуитивно говоря, представляет собой распределение вероятностей количества решек, которые нужно перевернуть перед первой головой, используя взвешенную монету. Он полезен для моделирования ситуаций, в которых необходимо знать, сколько попыток, вероятно, необходимо для успеха, и, следовательно, имеет приложения для моделирования населения, эконометрики, рентабельности инвестиций (ROI) в исследования и т. Д.

Вероятность успеха после (x-1) неудачи:

Три допущения геометрического распределения:

  • Для каждого испытания есть два возможных исхода (успех или неудача).
  • Испытания независимы.
  • Вероятность успеха одинакова для каждого испытания.

Гипергеометрическое распределение:

Гипергеометрическое распределение используется для расчета вероятностей при выборке без замены.

Обратите внимание, что оно отличается от биномиального распределения, поскольку биномиальный эксперимент требует, чтобы вероятность успеха была постоянной при каждом испытании. Но в гипергеометрических распределениях вероятность успеха меняется при каждом испытании.

Пример: предположим, что у вас есть урна из 10 шариков - 5 красных и 5 зеленых. Вы случайным образом выбираете 2 шарика без замены и подсчитываете количество выбранных вами красных шариков. Вначале вероятность выбрать красный шарик составляет 5/10. Если вы выберете красный шарик при первом испытании, вероятность выбора красного шарика при втором испытании составит 4/9. И если вы выберете зеленый шарик при первом испытании, вероятность выбора красного шарика при втором испытании составит 5/9.

Обратите внимание, что если вы выбрали шарики с заменой, вероятность успеха не изменится. Это будет 5/10 на каждом испытании. Тогда это был бы биномиальный эксперимент.

Мультиномиальное распределение:

Полиномиальное распределение - это распределение вероятностей результатов полиномиального эксперимента.

Полиномиальный эксперимент - это статистический эксперимент, обладающий следующими свойствами:

  • Эксперимент состоит из n повторных испытаний.
  • Каждое испытание имеет дискретное количество возможных результатов.
  • В любом конкретном испытании вероятность того, что произойдет конкретный результат, постоянна.
  • Испытания независимы; то есть результат одного испытания не влияет на результат других испытаний.

Пример: рассмотрим следующий статистический эксперимент. Вы бросаете два кубика трижды и записываете результат каждого броска. Это полиномиальный эксперимент, потому что:

  • Эксперимент состоит из повторных испытаний. Мы бросаем кости трижды.
  • Каждое испытание может привести к дискретному количеству результатов: от 2 до 12.
  • Вероятность любого исхода постоянна; он не меняется от одного броска к другому.
  • Испытания независимы; то есть получение определенного результата в одном испытании не влияет на результаты других испытаний.

Примечание. Биномиальный эксперимент - это особый случай полиномиального эксперимента. Вот главное отличие. В биномиальном эксперименте каждое испытание может привести к двум и только двум возможным результатам. В полиномиальном эксперименте каждое испытание может иметь два или более возможных результата.

Равномерное (прямоугольное) распределение:

Распределение вероятностей, при котором все исходы равновероятны; каждая переменная имеет одинаковую вероятность того, что она будет результатом.

PDF для равномерного распределения составляет:

Нормальное распределение (или Гаусса, Гаусса или Лапласа – Гаусса):

Характеристики нормального распределения:

  • симметричная форма колокола
  • среднее и медиана равны; оба расположены в центре раздачи
  • ≈68% данных попадает в 1 стандартное отклонение от среднего
  • ≈95% данных попадает в 2 стандартных отклонения от среднего
  • ≈99,7 данных попадает в 3 стандартных отклонения от среднего

PDF нормального распределения определяется по формуле:

Гамма-распределение:

Гамма-функция: гамма-функция, обозначенная Γ (x), является расширением факториальной функции на действительные (и комплексные) числа. В частности, если n∈ {1,2,3,…}, то

В более общем смысле, для любого положительного действительного числа α Γ (α) определяется как

Гамма-распределение:
Говорят, что непрерывная случайная величина X имеет гамма-распределение с параметрами α ›0 и λ› 0, что показано как X∼Gamma (α , λ), если его PDF определяется выражением

Экспоненциальное распределение:

(частный случай гамма-распределения и непрерывный аналог геометрического распределения)

Говорят, что непрерывная случайная величина X имеет экспоненциальное распределение с параметром λ ›0, показываемым как X∼Exponential (λ), если ее PDF определяется как:

Распределение x² (хи-квадрат):

(Частный случай гамма-распределения)

Предположим, мы выбираем случайную выборку размером n из нормальной генеральной совокупности, имеющую стандартное отклонение, равное σ. Мы обнаружили, что стандартное отклонение в нашей выборке равно s. Имея эти данные, мы можем определить статистику, называемую хи-квадрат, используя следующее уравнение:

Распределение статистики хи-квадрат называется распределением хи-квадрат. Распределение хи-квадрат определяется следующей функцией плотности вероятности:

Бета-распределение:

Это распределение представляет собой семейство вероятностей и является универсальным способом представления результатов в процентах или пропорциях. Например, насколько велика вероятность того, что Канье Уэст победит на следующих президентских выборах? Вы можете подумать, что вероятность равна 0,2. Ваш друг может подумать, что это 0,15. Бета-версия позволяет описать это.

PDF для бета-распространения предоставляется:

Двумерное распределение:

Проще говоря, двумерное распределение - это вероятность того, что определенное событие произойдет, когда в вашем сценарии есть две независимые случайные величины. Например, имея две миски, каждая из которых наполнена двумя разными типами конфет, и вытаскивая по одной конфете из каждой миски, вы получаете две независимые случайные величины, две разные конфеты. Поскольку вы вытаскиваете по одной конфете из каждой миски одновременно, у вас есть двумерное распределение при расчете вероятности того, что вы получите определенные виды конфет.

Вот - очень хорошая статья, в которой детально проработано двумерное распределение.

t-распределение:

Это член семейства непрерывных распределений вероятностей, которое возникает при оценке среднего значения нормально распределенной совокупности в ситуациях, когда размер выборки невелик и стандартное отклонение генеральной совокупности неизвестно.

PDF для t-распределения рассчитывается как:

Когда использовать t-распределение:

Распределение t можно использовать с любой статистикой, имеющей колоколообразное распределение (т.е. приблизительно нормальное). Выборочное распределение статистики должно иметь форму колокола, если применяется любое из следующих условий.

  • Распределение населения нормальное.
  • Распределение населения симметрично, одномодально, без выбросов, размер выборки не менее 30.
  • Распределение населения умеренно асимметричное, одномодальное, без выбросов, размер выборки не менее 40.
  • Размер выборки больше 40, без выбросов.

Распределение t не следует использовать с небольшими выборками из популяций, которые не являются приблизительно нормальными.

Спасибо за чтение, и если у вас есть какие-либо вопросы или предложения, не стесняйтесь оставлять сообщения в разделе комментариев. Кроме того, мне потребовалось много усилий, чтобы написать это, так что я надеюсь, что вы нашли это полезным.