 |
§ 3. Расчет выборочной совокупности
.
§ 3. Расчет выборочной
совокупности
Каждый исследователь, желающий
получить достоверные данные о генеральной совокупности изучаемых явлений и
процессов, стоит перед проблемой определения объема выборочной совокупности
(я). Он определяется исходя из заданных и наличных показателей. Заданными
показателями в этом случае будут предельная ошибка репрезентативности (W или
А), коэффициент доверия (0, а наличными — дисперсия (о) изучаемых признаков и
(в некоторых случаях) численность генеральной совокупности (W).
Формулы расчета выборочной
совокупности выводятся из формул расчета ошибок репрезентативности.
р( — р) Из формулы W =
J-i-----'-, по которой рассчитывается ошибка
повторной выборки качественного
признака при коэффициенте доверия /= 1, может быть легко вычислен объем
выборки. Для
131
этого необходимо знать значение
удельного веса признака и задать предельную ошибку выборки. Обратимся к
известному примеру. Доля лиц, совершивших преступления в состоянии опьянения
(Р), составляла 35%, или 0,35. Предельную ошибку (W) зададим равной ± 5%, или
0,05. В этом случае
^ Р( - Р) = 0,35(1 W
• 0,35)
0,0025
= 91 преступление (дело,
статкарта, приговор).
Если задать ошибку, равной ± 4%,
то следует изучить 143 единицы, ± 3% - 225, ±296- 575 и т.д.
Из формулы W = J— , по которой
I П
определяется однократная
ошибка повторной выборки количественного
признака, объем выборочной совокупности можно рассчитать после нахождения
дисперсии (о) и необходимой предельной ошибки выборки (W). Вновь обратимся к
примеру о сроках лишения свободы. В нем а = = 2,29 года, W= ± 0,15 года. Найдем
объем выборочной совокупности (/?):
2,29 0,0225
= 102 единицы.
Это означает, что если нас
удовлетворяет ошибка выборки, равная ±0,15, то следует изучить 100 преступлений
(дел, статкарт и т. д.), а если она допустима в пределах ± 0,3, то достаточно
25 единиц изучения.
Выше говорилось, что коэффициент
доверия, равный 1 (/=1), недостаточно надежен, так как только 683 единицы из
1000 могут быть в пределах заданной ошибки репрезентативности. Поэтому чаще
всего при расчете объема выборочной совокупности вводится коэффициент доверия,
равный 2 (/=2), который означает, что в 954 случаях из 1000 число единиц выборочной
совокупности будет находиться в пределах заданной ошибки репрезентативности. С
этой целью в приведенные формулы, как и при расчете ошибки репрезентативности,
вводится коэффициент /.
Из формул предельных ошибок
повторной выборки для качественных и количественных признаков выведем формулы
расчета объемов выборочной совокупности.
Из д
следует и =
(качественные признаки).
Из д = /J— следует п = -~-
(количественные признаки).
V
и А
Принимая / = 2 и используя данные
предыдущих примеров, определяем объемы выборочных совокупностей для качественных
и количественных признаков:
, ч 0,35(1-0,35)
4 "*"
п (кач.) =-----^ пппг, '— -- 364
преступления;
и (колич.) =
2,29 4
= 407 преступлений.
0,0225
Расчеты выборочных совокупностей
показывают, что если повысить коэффициент доверия вдвое (/=2), то объем
выборки необходимо увеличить вчетверо, ^то означает, что в пределах тех же
ошибок репрезентативности ± 5% и ± 0,15 года теперь будет находиться не 683, а
954 единицы из 1000. В этих случаях ошибка выборки именуется двукратной,
поскольку распространяется на все единицы выборочной совокупности,
расположенные в пределах 28 нормального распределения.
Все предшествующие расчеты
производились для повторной выборки. В реальной жизни криминологические и
социально-правовые изучения проводятся, как правило, бесповторным способом,
т. е. уголовное дело, статкарта, гражданское дело и т. д. по какому-то признаку
изучаются или респонденты (при анкетировании) опрашиваются единожды. В этом
случае применяются формулы для бесповторной выборки.
Из д =
- — следует и =
NtP( - Р)
= —-------i-------'—-
+ tP( - Р)
Л/ЬЧ
2,2
> = ',—1--7Г следует л = —
/1 I, N
) £f,, т, и
Эти формулы расчета выборочных
совокупностей для качественных и количественных признаков являются наиболее полными.
В них учтены коэффициент доверия, кратность предельной ошибки и бесповторность
выборки. Пользуясь этими формулами, рассчитаем выборочные совокупности для
известных данных.
Итак, дано:
Р (удельный вес признака)
А (предельная ошибка выборки)
/ (коэффициент доверия)
N (генеральная совокупность)
= 35 %, или 0,35;
= 5 %, или 0,05;
= 2;
— 5000.
п =
п (выборочная совокупность)
5000 • 4 • 0,35 • (1 -
0,35) _ 4600 O.OD25 5000 + 4 0,35 (1-0,35) ~ 13,42
= 343 преступления.
Если уменьшить ошибку выборки до
±3%, то выборочная совокупность должна быть увеличена до 848 единиц, если до ±
2 % — объем выборки должен составить 1575 единиц.
Второй пример решим применительно
к количественному признаку.
Дано:
о (дисперсия) =
2,29 года;
Д (предельная ошибка
выборки) = 0,15 года;
t (коэффициент
доверия) = 2;
N (генеральная
совокупность) = 3000.
(выборочная совокупность)
3000 4 2,29 27480
0,0225 3000 + 4 2,29 67,5 +
9,16
= 358 преступлений.
Увеличение генеральной
совокупности вдвое, т. е. до 6000, увеличит выборку ненамного, лишь до 381
единицы. Это говорит о том, что объем генеральной совокупности — относительно
второстепенный параметр даже при расчете объема бесповторной выборки, хотя он
и стоит в формуле расчета. При повторной выборке объем генеральной совокупности
не имеет никакого значения, поэтому он отсутствует в формуле расчета как
дисперсии, так и численности выборки. Следовательно, там, где численность
генеральной совокупности по тем или иным причинам точно не известна, ею можно
пренебречь и рассчитывать выборочную совокупность по формулам повторной выборки
или использовать приблизительную численность генеральной совокупности.
Для определения объема повторной
выборки по качественному признаку можно использовать табл. 6. Как и табл. 5 (о
пределах ошибок), она рассчитана применительно к коэффициенту доверия, равному
2 (/=2).
Таблица 6
Число наблюдений, необходимое для
того, чтобы ошибка не превысила заданного предела (t=2)
|
Удельный вес
|
Предел ошибки, %
|
|
наблюдений, %
|
|
|
|
1
|
2
|
3
|
4
|
5
|
10
|
|
10 (90)
|
3600
|
900
|
400
|
230
|
150
|
37
|
|
15 (85)
|
5100
|
1300
|
570
|
320
|
210
|
52
|
|
20 (80)
|
6400
|
1600
|
710
|
400
|
260
|
65
|
|
25 (Z5i
|
75ПП
|
19ПП
|
аза
|
470
|
ям
|
76
|
|
30 (70)
|
8400
|
2100
|
930
|
530
|
340
|
85
|
|
35 (65)
|
9100
|
2300
|
1010
|
570
|
370
|
92
|
|
40 (60)
|
9600
|
2400
|
1070
|
600
|
390
|
97
|
|
45 (55)
|
9900
|
2500
|
1100
|
620
|
400
|
100
|
|
50 (50)
|
10 000
|
2500
|
1110
|
630
|
400
|
100
|
Примечание. Таблица приводится в
сокращенном виде.
Предположим, что удельный вес
изучаемого признака равен 25%. Находим этот показатель в первой графе табл. 6.
Рассматривая строку (она подчеркнута), на которой находится 25% (75%), слева
направо, мы увидим, что при заданной ошибке ± 1% численность выборки должна
составить 7500 единиц, при ± 2% -1900, при ± 3% - 830, при ± 4% - 470, при + 5%
- 300 единиц и т. д. Исходя из того, какая ошибка может быть признана допустимой
при том или ином изучении, и определяется объем выборочной совокупности.
В криминологических и других
социально-правовых исследованиях чаще всего бывает достаточной выборка до
300—400 единиц. Даже при максимальной колеблемости качественного признака 50%
(дисперсия -- 0,25) предельная двукратная ошибка выборки составляет ±5%, при
удельном весе признака 20% (80%) — ±4%, при удельном весе признака 10% (90%) —
± 3%.
.
Назад
|
 |