top of page

Распределения

  • Фото автора: Алексей Линтур
    Алексей Линтур
  • 14 июн. 2020 г.
  • 2 мин. чтения

Спойлер: будет скучно, но это нужно знать прежде, чем мы пойдём дальше.


Чтобы сравнивать, нужно иметь некоторый образец или эталон. Что может быть этим мерилом? Давайте представим себе эксперимент (кстати, можете попробовать выполнить — это интересный опыт). Представьте, что у нас есть мешок, в котором лежат фишки пронумерованные от 1 до 70. Мы будем вынимать наугад по одной и не будем возвращать их обратно в мешок. В таких условиях вытянуть фишку с номером 12 равна вероятности вытянуть фишку с номером 63 или любую другую. Это называется равновероятные события. Казалось бы тут нет и быть не может какой-то закономерности… если бы это было так, то все лотереи и казино обанкротились бы и причём давно. Если мы начнём вытягивать фишки и отмечать каждый номер на графике, то быстро убедимся в том, что одни номера будут выпадать чаще (к примеру от 20 до 30), а другие — реже (к примеру от 40 до 50). Не удивляйтесь, это нормально — именно так и должно быть. И так будет всегда, сколько раз бы мы не повторяли этот эксперимент. Всегда одних номеров будет больше, а других — почти поровну. В статистике это явление называется распределением случайной величины. И это настолько нормально, что его так и называют «нормальное распределение». Всё было бы легко и просто, если бы распределение было только одно, но это не так. Их много и разных. Проблема в том, что перед тем как начать сравнивать, нам обязательно нужно выяснить какое из распределений использовать в каждом конкретном случае. Давайте посмотрим на те из распределений, которые нам будут встречаться чаще всего. Сразу оговорюсь: за каждым из распределений стоит внушительная математика с «трёхэтажными» формулами, но мы в это пока вникать не будем. По крайней мере тут :) Распределения предсказывают как будет вести себя случайная величина, если мы будем проводить эксперимент бесчисленное множество раз. Это мостик между нашей ограниченной выборкой и той самой генеральной совокупностью.

Нормальное распределение или распределение Гаусса-Лапласа. Оно описывает непрерывную случайную величину и, наверное, самое часто встречаемое и часто употребляемое распределение. Его можно использовать для непрерывных случайных величин.


Полиномиальное распределение — это распределение дискретной (прерывистой) случайной величины и оно описывает число успехов в некотором количестве повторений эксперимента в случае, когда отклик по своей природе категориальный. Сложно, да? Сейчас проясним на примере. Выборка, в которой собраны спортсмены, музыканты, повара и т. п. — это и есть пример той самой категориальности. Частным случаем такого распределения будет биномиальное распределение и его можно использовать для случая, когда категорий только две. Например, «проиграл» и «выиграл»; «наличие» и «отсутствие» и так далее.


Гипергеометрическое распределение — это ещё один вариант распределения

дискретной случайной величины. Классическим примером является вероятность вытягивания белых шариков наугад из урны с разноцветными шариками.









Всё, что нам нужно тут — это получить представление о том, как ведёт себя случайная величина; что нет и быть не может равномерного распределения в виде прямой линии; что каждое распределение имеет свою характерную форму (геометрически, на графике); что для каждого случая есть свой, подходящий закон чётко предсказывающий поведение случайной величины.

Какое распределение использовать в каждом конкретном случае — это момент от части творческий и этого мы ещё коснёмся в будущем. Пока что только знакомство.


コメント


+380956526141

Украина, г. Ужгород

©2019 Законы Звезд. Сайт создан на Wix.com

bottom of page