 |
§ 7. Анализ вариационных рядов
.
§ 7. Анализ вариационных рядов
С вариационными рядами мы
встречались при обосновании выборочного наблюдения, изучении структурных и
вариационных группировок, относительных и средних величин. К ним мы вынуждены
будем обращаться и в последующих темах. Из предыдущего мы знаем, что
вариационный ряд представляет собой группировку по одному признаку и с
единственным показателем в сказуемом — меняющимся числом единиц совокупности,
выраженных в абсолютных или относительных величинах.
Таблица 10 Распределение
преступлений по возрасту субъектов
|
Возраст, лет
|
До 15
|
16-20
|
21-25
|
26-30
|
31-35
|
36-40
|
41-45
|
46-50
|
51-60
|
|
Преступления, %
|
3
|
11
|
22
|
26
|
19
|
10
|
5
|
3
|
1
|
Обратимся к общеизвестному
вариационному ряду -- распределению преступлений по возрасту их субъектов.
Примером может служить табл. 10 с усредненными показателями для многих стран.
Представленный в табл. 10
интервальный вариационный ряд отражает вполне определенную связь между
варьирующим возрастом и изменением частот (процентами лиц, совершивших преступления).
По данным мировой, российской и региональной статистики наблюдается практически
одна и та же тенденция распределения правонарушителей по возрасту: с начала
возраста уголовной ответственности идет рост преступной активности, в 25—30
лет (с некоторыми колебаниями) ее уровень достигает апогея, а затем наступает
постепенное снижение'. В этом проявляется определенная закономерность изменения
частот в вариационных рядах, называемая закономерностью распределения,
которая выявляется в больших совокупностях, где случайные отклонения
взаимоуничтожаются.
В выявлении реальных
закономерностей распределения заключается основная суть анализа вариационных
рядов. Все вариации, подчиняясь своей в основе указанной закономерности, имеют
много типов особенностей (отклонений), каждая из которых связана с теми или
иными причинами, установление которых играет важную роль в статистическом
анализе.
Обстоятельства, определяющие тип
закономерностей распределения, изучаются на основе качественного (криминологического,
уголовно-правового, уголовно-процессуального, административно-правового,
гражданско-правового и т.д.) анализа сути того или иного явления, а именно —
тех его свойств и условий, которые определяют изменчивость варьирующего признака.
Но к такому изучению приводит лишь выявленный тип закономерностей рядов
распределения.
Обратимся к данным табл. 10.
Удельный вес преступников с увеличением их возраста растет (прямая
зависимость), но, достигнув какого-то уровня, несмотря на продолжающееся увеличение
возраста, снижается до минимума (обратная зависимость). Однако максимум
удельного веса (мода) находится не посредине ряда (интервал 31—35 лет), а
сдвинут к более молодому возрасту (26—30 лет). Близко к моде располагается
доля 21—25 лет и только потом идет 31—35 лет.
Такой сдвиг к молодому возрасту
неслучаен. На качественном уровне криминологического анализа давно
установлено, что лица молодежного возраста, не имея необходимого жизненного
опыта и устойчивых позитивных ориентации, попав в сложные жизненные ситуации,
вступают в конфликт с законом чаще, чем люди более зрелого возраста. Это
связано, с одной стороны, с недостаточным уровнем их социальной зрелости, с
другой -со сложностью возрастной ситуации (ослабление прежнего социального
контроля со стороны семьи, школы, старших; переход к самостоятельности;
физическое достижение взрослости; рост материальных и физических потребностей;
необходимость самообеспечения, определения в жизни и т. д.), к правильному
решению которой они чаше всего не готовы. Следовательно, объяснение этого
традиционного сдвига лежит не в физиологических, а социальных особенностях
возрастного характера.
Приведенные объяснения лежат за
пределами юридической статистики, но к ним трудно прийти на основе только
логических умозаключений, даже в данном несложном вопросе. Для этого надо выявить
особенности реального статистического распределения значений признака. Чтобы
зафиксировать характер имеющихся отклонений, надо сопоставить реальное
распределение с каким-то его эталоном. Такой эталон — теоретическая кривая распределения,
которая выражает общую закономерность распределения, исключающего влияние
случайных факторов. Эта кривая распределения называется кривой Лапласа—Гаусса,
или нормальным распределением. В качестве эталона используются также распределение
Пуассона и некоторые другие, но они практически не применяются юридической
статистикой.
Учитывая, что общая
характеристика нормального распределения относительно полно рассматривалась в
главе о выборочном наблюдении, в данном параграфе будут изложены лишь его
особенности, необходимые для сравнительного анализа вариационных рядов.
Нормальное распределение
выражается сложной формулой
где Р — кривая нормального
распределения; х — варианты; х — средняя арифметическая вариант; о — среднее
квадратическое отклонение; е и л — математические постоянные: е = 2,7182 и к =
3,1415.
В конечном итоге кривая
нормального распределения зависит только от двух параметров: средней
арифметической (х) и среднего квадратического распределения (о). От их значений
зависит расположение центра распределения кривой на оси х и различия вариантов
около этого центра (рис. 1 и 2), а также определенные асимметрии левой и правой
ветвей относительно центра (рис. 3 и 4).
Рис.2
х > Mo
х < Mo
В нормальном распределении левая
и правая ветви кривой симметричны, а средняя арифметическая, мода и медиана равны.
Однако при соблюдении этого равенства кривые могут существенно различаться
между собой.
Если средняя арифметическая
величина (х) небольшая, то кривая располагается ближе к оси ординат (У), если
— большая, то кривая сдвинута вправо от оси Рх (рис. 1, кривые 1 и 2).
Если среднее квадратическое
отклонение (о) большое, то кривая распределения является высоковершинной (рис.
2, кривая I), что свидетельствует о скоплении частот в середине, о типичности
и надежности средней. Такое положение в статистике называют положительным
эксцессом.
Если среднее квадратическое
отклонение небольшое, то кривая распределения является низковершинной (рис. 2,
кривая 2), что свидетельствует о значительной разбросанности частот ряда и
недостаточной надежности средней. В статистике указанные особенности называют
отрицательным эксцессом.
Нормальное распределение
симметрично по отношению к средней арифметической величине (х). Однако
симметричных реальных распределений намного меньше, чем асимметричных. В
асимметричном распределении средняя арифметическая, мода и медиана не
совпадают, и их отклонения друг от друга измеряются с помощью коэффициента
асимметрии (КА), который рассчитывается по следующей формуле:
где КА — коэффициент асимметрии;
х — средняя арифметическая; Мо — мода; а — среднее квадратическое отклонение.
Суть перечисленных параметров нам
известна. Из их соотношения в формуле следует:
если средняя арифметическая
больше моды (Г > Мо), то коэффициент асимметрии положительный, и это означает
правостороннюю асимметрию, т. е. правая часть кривой оказывается длиннее левой
(рис. 3);
если средняя арифметическая
меньше моды (Г < Мо), то коэффициент асимметрии будет со знаком минус
(отрицательный), что означает левостороннюю асимметрию, т. е. левая часть кривой
длиннее правой (рис. 4).
Вспомним наш пример (см. табл.
10), в котором наибольшая частота совершаемых преступлений падает на интервал
26—30 лет, а не на средний интервал (31-35 лет). Из этого можно предположить,
что мы имеем дело с отрицательным коэффициентом асимметрии.
Модальный интервал в примере
равен 26-30 годам, которому соответствует 26%-ная частота совершения
преступлений. Модальная величина (Мо) в модальном интервале рассчитывается по
известной нам формуле Мо =*,,+»-/Мо ~ /1
где Ха = 26 лет (минимальная
граница модального интервала); i = 5 лет (величина модального интервала); /Мо =
26 (частота модального интервала);/, = 22 года (частота интервала,
предшествующая модальному);^ = 19 (частота интервала его следующего за модальным).
При приведенных данных имеем:
Величина *арифм = 28,97 года
(порядок расчета средней арифметической интервального ряда изложен в § 3
настоящей главы). Напомним лишь основные действия расчета: вначале определяется
середина каждого интервала путем сложения двух его границ и деления полученной
суммы на два (например, (26+30) : 2=28); затем середину каждого интервала
умножаем на его частоту (28 • 26 преступлений = 728); после этого полученные
произведения складываем (общая сумма произведений середины интервалов на
частоту равна 2897); разделив эту сумму (2897) на общую сумму частот (100), мы
получим среднюю арифметическую, равную 28,97 года.
Это означает, что средняя
арифметическая больше моды С* > Мо или 28,97 > 27,5), т. е. мы имеем дело
с правосторонней асимметрией и положительным коэффициентом асимметрии. Для
расчета КА необходимо знать среднее квадратическое отклонение. Найдем его из
табл. 11.
Таким образом,
Таблица 11
Расчет среднего арифметического
отклонения
|
Возраст лиц (х), лет
|
Доли преступлений (/)
|
Середина интервала
(*ср.)
|
Произведения
(Л*р.)
|
Отклонения
(*ср.-*)
|
Дисперсия
(*ср. - *)
|
|
до 15 16-20 21-25 26-30 31-35
36-40 41-45 46-50 51-60
|
3 11
22 26 19 10 5 3 1
|
14,5 18 23 28 33 38 43 48 55,5
|
43,5 198 506 728 627 380 215
144 55,5
|
-14,47 -10,97 -5,97 -0,97 +4,03
+9,03 + 14,03 +19,03 +26,53
|
209,4 120,3 35,6 0,9 16,2 81,5
196,8 362,1 703,8
|
|
|
1/ = юо
|
|
I/V"
2897
|
1(хср.-х) = 1726,6
|
Если изобразить полученные
результаты графически, то при имеющихся данных х = 28,97 и Мо = 27,5, откуда 1с
> Mo, ах — — Мо = 1,47, мы получим график с правосторонней асимметрией и
положительным коэффициентом КА = 0,1. Он будет близок к графику, изображенному
на рис. 3.
Мы провели полный расчет
коэффициента асимметрии с ее графическим изображением для иллюстрации
аномальных возможностей вариационных рядов, по многочисленным показателям
которых можно проводить углубленный статистический сравнительный анализ.
При моделировании рядов
распределения в целях сравнения реального вариационного ряда с нормальным
распределением можно проверить их соответствие на основе выравнивания фактического
распределения по кривой нормального распределения. Для этого частоты
фактического распределения сравниваются с теоретическими частотами, которые
вычисляются на основе имеющихся фактических данных, находят нормированные
отклонения, а затем по их величине рассчитывают частоты теоретического
нормального отклонения.
Математической статистикой также
разработано несколько показателей, по которым можно судить о том, как согласуется
фактическое распределение. Эти показатели называются критерием согласия. Их
много. Наибольшее распространение имеет критерий согласия Пирсона (критерий
% - хи-квадрат), который рассчитывается по формуле
Для оценки близости эмпирического
распределения к теоретическим определяют вероятность достижения хи-квадратом
величины P(-i) при случайных колебаниях. Если вероятность выше"* 0,05, то
отклонения фактических частот от теоретических можно считать случайными, а если
меньше, то эмпирическое распределение является принципиально отличным от
рассчитанного теоретического. Для простоты расчетов статистиками разработаны
специальные таблицы вероятностей Дх)> которые обычно приводятся в виде
приложений к учебникам по общей теории статистики.
Следующий критерий согласия —
критерий Колмогорова (критерий лямбда), который обозначается символом А.
(лямбда). Этот критерий используется при анализе близости фактического и теоретического
распределений путем сравнения кумулятивных (накопительных, фактических и
теоретических) частот в вариационном ряду. Он рассчитывается по формуле
где Р — разность между
фактической и теоретической частотой; п — число наблюдений.
По полученным результатам также в
специальной таблице можно найти искомую вероятность для критерия согласия
лямбда.
Вышеизложенные вопросы
выравнивания фактического распределения по кривой нормального распределения, а
также критерии согласия Пирсона и Колмогорова в силу недостаточной
математической подготовки юристов практически не используются в юридической
статистике. Исходя из реальных потребностей юридической науки и практики,
небольшого объема курса юридической статистики, названные методы представлены в
учебнике в кратком изложения лишь для ознакомления будущих юристов. Эти
методы широко распространены среди экономистов, социологов и других
специалистов, к результатам исследований которых нередко обращаются и юристы.
Объем изложения упомянутых методов в учебнике дает возможность более или менее
адекватно оценить их при чтении специальной литературы, а по необходимости — и
использовать в своей аналитической работе. При этом очень важно не скатиться к
статистическому механицизму, примеры которого до сих пор не изжиты. Обратимся
к одному из них.
Закономерности распределения в
вариационном ряду косвенно используются в модульной теории социума. В ней
социум исследуется в виде взаимосогласованной гармоничной системы, состоящей
из элементов и частей, между которыми существуют слаженные отношения,
выражающиеся в устойчивых пропорциях (распределениях), которые могут измеряться
в удельных весах или долях. В связи с этим было высказано предположение о
наличии в социуме самых разных положительных и отрицательных девиаций
(текучесть кадров, неявка на работу, травматизм, гомосексуализм и лесбиянство,
алкоголизм, уклонение от участия в выборах, богачи, таланты, мигранты и т.
д.), доля которых якобы не превышает 4-10%.
Закономерности распределения тех
или иных явлений в обществе действительно существуют, но их доли, хотя и в
некоторых пределах, относительно подвижны и зависимы от складывающихся
социальных условий. Вспомним, например, распределение женщин и мужчин в
структуре выявленных преступников, в котором доля женщин всегда была меньше
удельного веса мужчин и в зависимости от условий (экономическая стабильность,
война, кризис и т.д.) составляла 12—20—30%. Можно было бы привести множество
других более или менее устойчивых распределений. Но никакой «константы
необходимой дисгармонии в обществе» или криминальной сфере не наблюдалось. Тем
не менее, одним из поклонников этой теории было выдвинуто ничем не
аргументированное предположение о якобы устойчивом, повсеместном и необходимом
удельном весе преступников в структуре населения (независимо от исторических
традиций, социальных условий жизни, уровня криминализации общественно опасных
действий в уголовном законодательстве и других обстоятельств в той или иной
стране), равном 5,6% от общей численности населения (в течение года).
Исходя из этих недостоверных
выводов, автор, широко используя статистические и математические методы
относительных и средних величин, «с легкостью» рассчитал латентную преступность
по более чем 90 странам. Подход прост: на основе численности населения в той
или иной стране он исчислял общее число ежегодно наличествующих (5,6 %)
преступников и путем вычитания из этого числа количества выявленных
правонарушителей получал латентную преступность. Обратимся к его непосредственным
расчетам. В 1985 г. в Швеции насчитывалось 8,35 млн человек населения, среди
которых автор нашел 467 600 выявлен- ' ных и невыявленных преступников. Вычтя
из этой суммы общее число установленных преступников, он получил 122 803 человека
«незарегистрированных преступников» (термин автора этой теории).
В действительности в 1985 г. в Швеции было только зарегистрировано 1 018 349 преступлений, или 12 184 деяния на 100 тыс.
населения, что составляет 12,2% его общей численности. Для их совершения 5,6%
(«необходимый» удельный вес преступников в обществе) правонарушителей должны
были в течение года совершить более чем по 2 зарегистрированных деяния каждый.
Но кроме учтенной преступности, в Швеции существует латентная, уровень которой
примерно соотносится с уровнем зарегистрированных деяний. Аналогичные данные
можно получить по США (если учитывать всю преступность, а не только индексную),
Великобритании, Германии, Дании, Финляндии и другим странам, где число
преступлений на 100 тыс. населения в последние годы превышает 8 тыс. (или 8%).
Я привожу этот беспрецедентный
пример статистических упражнений с одной целью: статистика и математика и
выявляемые с их помощью законы динамики и распределения применимы в социальных
и юридических науках лишь тогда, когда они опираются на адекватные базовые
показатели. Если последние неверны, никакие статистические измерения и расчеты,
какими бы точными они ни были, не приведут к объективным результатам. Немецкий
математик К.Гаусс обоснованно предостерегал: математика -это мельница. Она
перемелет все, что угодно, но получится ли мука, будет зависеть от того, что в
нее было засыпано.
Закономерности статистических
распределений вполне могут быть использованы в модульной теории социума, в том
числе и для изучения распределения криминальных и иных противоправных
отклонений, но эти закономерности должны отражать реалии, а не предположения.
Структурная схема средних величин
Средние величины
Степенные
Конкретные
|
Средняя арифметическая
|
|
Мода
|
|
Средняя геометрическая
|
|
Медиана
|
|
Средняя гармоническая
|
|
|
|
Средняя квадратическая
|
|
|
|
|
|
Размах вариации
|
|
|
|
|
|
|
|
Среднее линейное отклонение
|
|
|
|
|
|
|
|
Дисперсия
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Коэффициент вариации
|
|
|
|
|
.
Назад
|
 |