top of page

Выборка

  • Фото автора: Алексей Линтур
    Алексей Линтур
  • 11 июн. 2020 г.
  • 3 мин. чтения

Все начинается именно с них - с комплектов данных, собранных и отфильтрованых по определенному принципу или признаку. Выборки бывают разными в зависимости от принципа их формирования. Давайте с ними знакомится!

Генеральная совокупность... нет... Её Величество Генеральная Совокупность! Это, без преувеличения, Святой Грааль статистики. Все про неё слышали, знают, что она где-то есть, но никто её в глаза не видел. В случае с астрологией, генеральная совокупность - это все люди вообще и в принципе, обладающие определенным признаком (все пожарники, все музыканты или все врачи). Жившие, живущие, ещё не рожденные - буквально все. Понятное дело, что собрать информацию о всех этих людях невозможно - собственно, поэтому никто никогда и не видел генеральной совокупности воочию. А как тогда быть? Вот именно для этого нам и нужны статистические методы - они созданы исключительно для того, чтобы математическим путем вывести закономерности, справедливые для генеральной совокупности не имея при этом самой генеральной совокупности, а изучая только её небольшой фрагмент - вот такая задача. Без статистики эту цель достичь невозможно. Хотя и с ней бывает очень не легко...

Выборка или выборочная совокупность - это малая часть генеральной совокупности, но вполне осязаемая, которую мы можем исследовать. Это кусочек от целого, изучая который мы сможем составить мнение о целом. Выборки бывают разными в зависимости от принципа их формирования: случайные, серийные, квотные и тому подобное. Чаще всего астрологи имеют дело со стихийными выборками - составленными из наиболее доступных респондентов. Объем (то есть количество данных в таких выборках) тут непредсказуем заранее и ограничивается активностью респондентов. По необходимости выборки могут делиться на подвыборки по некоторым критериям. Например по половому признаку, по возрастным диапазонам и так далее.

Репрезентативность - ключевой параметр выборки. Репрезентативность означает насколько правильно и полно наша выборка (кусочек от целого) описывает генеральную совокупность (целое). Подвох здесь в том, что одна и та же выборка может быть репрезентативной для решения одного вопроса и не быть таковой для другого. Выборка должна сохранять пропорции генеральной совокупности по составу. К примеру, если в мире мужчин и женщин примерно поровну, а в нашей выборке 10 мужчин и 250 женщин, то мы должны прийти к выводу, что с этой выборкой что-то не так и исправить это. Что же касается объема выборки, то тут чем больше - тем лучше. Увеличение количества респондентов очень положительно влияет на снижение погрешностей исследования, до поры до времени... Погрешность выборки рассчитывается по формуле:

n – объем выборки,

Z – коэффициент (равен 1,96 для доверительного уровня 95%)

p – доля респондентов с наличием исследуемого признака,

q = 1 – p – доля респондентов, у которых исследуемый признак отсутствует

∆ – предельная ошибка выборки.


Значения p и q обычно принимаются за 0,5, поскольку точно неизвестны до проведения исследования. Но если наперед известно, что мы - к примеру - исследуем 16 психотипов, тогда р = 1/16 = 0,0625, а q = 1 – p = 1 - 0,0625 = 0,9375. В результате расчетов получится цифра в долях. Чтобы перевести её в проценты нужно умножить еще на 100.

Например, если выборка составляет 500 человек, а респондент может либо иметь интересующий признак, либо не иметь его (то есть 50/50; к примеру либо курит, либо не курит), то мы получим следующий расчет: Z = 1,96, р = 0,5, q = 0,5


∆ = 1,96 · корень(0,5 · 0,5 / 500) = 1,96 · 0,0224 = 0,044 = 4,4%


Теперь как понять эти письмена? Это означает, что реальное число курильщиков в выборке будет не 50%, как мы ожидали, а 50±4,4%. Чтобы перевести это в реальных людей умножим:


500 · (50 - 4,4)% = 228 500 · (50 + 4,4)% = 272


В выборке из 500 человек, половина из которых курильщики, реальное число курильщиков будет в пределах от 228 до 272 человек с вероятностью 95%. Все расчеты, сделанные на основании этой выборки унаследуют и её ошибку. Если такая точность не устраивает, то придется увеличивать выборку.

Эти цифры пригодятся нам, когда мы захотим узнать насколько значимым является отличие, но об этом позже.


Comments


+380956526141

Украина, г. Ужгород

©2019 Законы Звезд. Сайт создан на Wix.com

bottom of page