12. Методика построения рядов распределения
Для атрибутивных и вариационных рядов применяют различные способы построения.
1. Построение атрибутивных рядов распределения. Атрибутивные ряды распределения обычно представляются в форме таблицы, причем в подлежащем такой таблицы перечисляются варианты атрибутивного признака, по которому строится ряд распределения. Как правило, число таких вариантов конечно. Если вариантов слишком много, то можно объединить некоторые из них (сущностно подобные) в классы, которые и будут новыми вариантами атрибутивного признака. В сказуемом таблицы отражаются частоты или частости каждого варианта, либо накопленные частоты или накопленные частости. Ряды распределения могут строиться по накопленным частотам, которые показывают, какое количество единиц имеет величину варианта не больше данной. Если вместо абсолютных частот взять частости, то аналогично получают и накопленные частости.
2. Построение дискретных вариационных рядов производится в следующей последовательности:
1) располагают варианты изучаемого признака в ранжированном порядке;
2) производят разноску единиц совокупности по вариантам (группировкам). Для этого строят таблицу;
3) подсчитывают количество единиц в каждой группе, т.е. определяют частоту каждого варианта. Частоты можно заменять частостями или использовать накопленные частоты (частости).
3. Построение интервального вариационного ряда производится в следующей последовательности:
1) выбирают оптимальное число групп (интервалов признака), на которые следует разбить совокупность. Число групп выбирается так, чтобы отразить многообразие значений признака в совокупности. Число групп устанавливается по формуле: к= 1 + 3,32lg N = 1,44 × lnN+ 1 (формула Стерджесса), где к– число групп; N — численность совокупности;
2) устанавливают длину интервала (шаг), которую рассчитывают по формуле:
3) определяют границы всех интервалов. Нижняя граница первого интервала принимается за хmin, верхняя граница первого интервала находится по формуле: xmin + h.
В качестве нижней границы второго интервала принимается верхняя граница первого, а верхнюю границу второго интервала получают прибавлением к верхней границе шага h. Процедуру повторяют до тех пор, пока не будут определены границы последней группы;
4) разносят единицы совокупности по интервалам;
5) подсчитывают единицы совокупности в каждом интервале.
Если полученные указанными выше способами группировки не удовлетворяют требованиям анализа, то производят перегруппировку. Ряды распределения используются в статистике как средство систематизации и упорядочивания материалов наблюдения, как метод изучения структуры явлений, анализа самих распределений и вариативности группировочного признака.