Вариационные ряды: определение, виды, основные характеристики. Методика расчета
моды, медианы, средней арифметической в медико-статистических исследованиях
(показать на условном примере).

Вариационный ряд – это ряд числовых значений изучаемого признака, отличающихся друг от друга по своей величине и расположенных в определенной последовательности(в восходящем или убывающем порядке). Каждое числовое значение ряда называют вариантой (V), а числа, показывающие, как часто встречается та или иная варианта в составе данного ряда, называется частотой (р).

Общее число случаев наблюдений, из которых вариационный ряд состоит, обозначают буквой n. Различие в значении изучаемых признаков называется вариацией. В случае если варьирующий признак не имеет количественной меры, вариацию называют качественной, а ряд распределения – атрибутивным (например, распределение по исходу заболевания, по состоянию здоровья и т.д.).

Если варьирующий признак имеет количественное выражение, такую вариацию называют количественной, а ряд распределения – вариационным.

Вариационные ряды делятся на прерывные и непрерывные – по характеру количественного признака, простые и взвешенные – по частоте встречаемости вариант.

В простом вариационном ряду каждая варианта встречается только один раз (р=1), во взвешенном – одна и та же варианта встречается несколько раз (р>1). Примеры таких рядов будут рассмотрены далее по тексту. Если количественный признак носит непрерывный характер, т.е. между целыми величинами имеются промежуточные дробные величины, вариационный ряд называется непрерывным.

Например: 10,0 – 11,9

14,0 – 15,9 и т.д.

Если количественный признак носит прерывный характер, т.е. отдельные его значения (варианты) отличаются друг от друга на целое число и не имеют промежуточных дробных значений, вариационный ряд называют прерывным или дискретным.

Используя данные предыдущего примера о частоте пульса

у 21 студентов, построим вариационный ряд (табл. 1).

Таблица 1

Распределение студентов-медиков по частоте пульса (уд/мин)

Таким образом, построить вариационный ряд – означает имеющиеся числовые значения (варианты) систематизировать, упорядочить, т.е. расположить в определенной последовательности (в восходящем или убывающем порядке) с соответствующими им частотами. В рассматриваемом примере варианты расположены в восходящем порядке и выражены в виде целых прерывных (дискретных) чисел, каждая варианта встречается несколько раз, т.е. мы имеем дело со взвешенным, прерывным или дискретным вариационным рядом.

Как правило, если число наблюдений в изучаемой нами статистической совокупности не превышает 30, то достаточно все значения изучаемого признака расположить в вариационном ряду в нарастающем, как в табл. 1, или убывающем порядке.

При большом количестве наблюдений (n>30) число встречающихся вариант может быть очень большим, в этом случае составляется интервальный или сгруппированный вариационный ряд, в котором для упрощения последующей обработки и выяснения характера распределения варианты объединены в группы.

Обычно число групповых вариант колеблется от 8 до 15.

Их должно быть не меньше 5, т.к. иначе это будет слишком грубое, чрезмерное укрупнение, что искажает общую картину варьирования и сильно сказывается на точности средних величин. При числе групповых вариант более 20-25 увеличивается точность вычисления средних величин, но существенно искажаются особенности варьирования признака и усложняется математическая обработка.

При составлении сгруппированного ряда необходимо учесть,

− группы вариант должны располагаться в определенном порядке (в восходящем или нисходящем);

− интервалы в группах вариант должны быть одинаковыми;

− значения границ интервалов не должны совпадать, т.к. неясно будет, в какие группы относить отдельные варианты;

− необходимо учитывать качественные особенности собираемого материала при установлении пределов интервалов (например, при изучении веса взрослых людей интервал 3-4 кг допустим, а для детей первых месяцев жизни он не должен превышать 100 г.)

Построим сгруппированный (интервальный) ряд, характеризующий данные о частоте пульса (число ударов в минуту) у 55 студентов-медиков перед экзаменом: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

Для построения сгруппированного ряда необходимо:

1. Определить величину интервала;

2. Определить середину, начало и конец групп вариант вариационного ряда.

● Величина интервала (i) определяется по числу предполагаемых групп (r), количество которых устанавливается в зависимости от числа наблюдений (n) по специальной таблице

Число групп в зависимости от числа наблюдений:

В нашем случае, для 55 студентов, можно составить от 8 до 10 групп.

Величина интервала (i) определяется по следующей формуле –

i = V max-V min/r

В нашем примере величина интервала равна 82- 58/8= 3.

Если величина интервала представляет собой дробное число, полученный результат следует округлить до целого числа.

Различают несколько видов средних величин:

● средняя арифметическая,

средняя геометрическая,

● средняя гармоническая,

● средняя квадратическая,

● средняя прогрессивная,

● медиана

В медицинской статистике наиболее часто пользуются средними арифметическими величинами.

Средняя арифметическая величина (М) является обобщающей величиной, которая определяет то типичное, что характерно для всей совокупности. Основными способами расчета М являются: среднеарифметический способ и способ моментов (условных отклонений).

Среднеарифметический способ применяется для вычисления средней арифметической простой и средней арифметической взвешенной. Выбор способа расчета средней арифметической величины зависит от вида вариационного ряда. В случае простого вариационного ряда, в котором каждая варианта встречается только один раз, определяется средняя арифметическая простая по формуле:

где: М – средняя арифметическая величина;

V – значение варьирующего признака (варианты);

Σ – указывает действие – суммирование;

n – общее число наблюдений.

Пример расчета средней арифметической простой. Частота дыхания (число дыхательных движений в минуту) у 9 мужчин в возрасте 35 лет: 20, 22, 19, 15, 16, 21, 17, 23, 18.

Для определения среднего уровня частоты дыхания у мужчин в возрасте 35 лет необходимо:

1. Построить вариационный ряд, расположив все варианты в возрастающем или убывающем порядке Мы получили простой вариационный ряд, т.к. значения вариант встречаются только один раз.

M = ∑V/n = 171/9 = 19 дыхательных движений в минуту

Вывод. Частота дыхания у мужчин в возрасте 35 лет в среднем равна 19 дыхательным движениям в минуту.

Если отдельные значения вариант повторяются, незачем выписывать в линию каждую варианту, достаточно перечислить встречающиеся размеры вариант (V) и рядом указать число их повторений (р). такой вариационный ряд, в котором варианты как бы взвешиваются по числу соответствующих им частот, носит название – взвешенный вариационный ряд, а рассчитываемая средняя величина – средней арифметической взвешенной.

Средняя арифметическая взвешенная определяется по формуле: M= ∑Vp/n

где n – число наблюдений, равное сумме частот – Σр.

Пример расчета средней арифметической взвешенной.

Длительность нетрудоспособности (в днях) у 35 больных острыми респираторными заболеваниями (ОРЗ), лечившихся у участкового врача на протяжении I-го квартала текущего года составила: 6, 7, 5, 3, 9, 8, 7, 5, 6, 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6, 7 дней.

Методика определения средней длительности нетрудоспособности у больных с ОРЗ следующая:

1. Построим взвешенный вариационный ряд, т.к. отдельные значения вариант повторяются несколько раз. Для этого можно расположить все варианты в возрастающем или убывающем порядке с соответствующими им частотами.

В нашем случае варианты расположены в возрастающем порядке

2. Рассчитаем среднюю арифметическую взвешенную по формуле: M = ∑Vp/n = 233/35 = 6,7 дней

Распределение больных с ОРЗ по длительности нетрудоспособности:

Длительность нетрудоспособности (V) Число больных (p) Vp
∑p = n = 35 ∑Vp = 233

Вывод. Длительность нетрудоспособности у больных с острыми респираторными заболеваниями составила в среднем 6,7 дней.

Мода (Мо) – наиболее часто встречающаяся варианта в вариационном ряду. Для распределения, представленного в таблице, моде соответствует варианта, равная 10, она встречается чаще других – 6 раз.

Распределение больных по длительности пребывания на больничной койке (в днях)

V
p

Иногда точную величину моды установить трудно, поскольку в изучаемых данных может существовать несколько наблюдений, встречающихся «наиболее часто».

Медиана (Ме) – непараметрический показатель, делящий вариационный ряд на две равные половины: в обе стороны от медианы располагается одинаковое число вариант.

Например, для распределения, указанного в таблице, медиана равна 10, т.к. по обе стороны от этой величины располагается по 14 вариант, т.е. число 10 занимает центральное положение в этом ряду и является его медианой.

Учитывая, что число наблюдений в этом примере четное (n=34), медиану можно определить таким образом:

Me = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

Это означает, что середина ряда приходится на семнадцатую по счету варианту, которой соответствует медиана, равная 10. Для распределения, представленного в таблице, средняя арифметическая равна:

M = ∑Vp/n = 334/34 = 10,1

Итак, для 34 наблюдений из табл. 8, мы получили: Мо=10, Ме=10, средняя арифметическая (М) равна 10,1. В нашем примере все три показателя оказались равными или близкими друг к другу, хотя они совершенно различны.

Средняя арифметическая является результативной суммой всех влияний, в формировании ее принимают участие все без исключения варианты, в том числе и крайние, часто нетипичные для данного явления или совокупности.

Мода и медиана, в отличие от средней арифметической, не зависят от величины всех индивидуальных значений варьирующего признака (значений крайних вариант и степени рассеяния ряда). Средняя арифметическая характеризует всю массу наблюдений, мода и медиана – основную массу

Статистический ряд распределения – это упорядоченное распределение единиц совокупности на группы по определённому варьирующему признаку.
В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения .

Наличие общего признака является основой для образования статистической совокупности, которая представляет собой результаты описания или измерения общих признаков объектов исследования.

Предметом изучения в статистике являются изменяющиеся (варьирующие) признаки или статистические признаками.

Виды статистических признаков .

Атрибутивными называют ряды распределения , построенные по качественным признакам. Атрибутивный – это признак, имеющий наименование, (например профессия: швея, учитель и т.д.).
Ряд распределения принято оформлять в виде таблиц. В табл. 2.8 приведён атрибутивный ряд распределения.
Таблица 2.8 - Распределение видов юридической помощи, оказанной адвокатами гражданам одного из регионов РФ.

Вариационный ряд – это значения признака (или интервалы значений) и их частоты.
Вариационными рядами называют ряды распределения , построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот.
Вариантами считаются отдельные значения признака, которые он принимает в вариационном ряду.
Частоты – это численности отдельных вариантов или каждой группы вариационного ряда, т.е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, её объём.
Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100 %. Вариационный ряд позволяет по фактическим данным оценить форму закона распределения.

В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды .
Пример дискретного вариационного ряда приведен в табл. 2.9.
Таблица 2.9 - Распределение семей по числу занимаемых комнат в отдельных квартирах в 1989 г. в РФ.

В первой колонке таблицы представлены варианты дискретного вариационного ряда, во второй – помещены частоты вариационного ряда, в третьей – показатели частости.

Вариационный ряд

В генеральной совокупности исследуется некоторый количественный признак. Из нее случайным образом извлекается выборка объема n , то есть число элементов выборки равно n . На первом этапе статистической обработки производят ранжирование выборки, т.е. упорядочивание чисел x 1 , x 2 , …, x n по возрастанию. Каждое наблюдаемое значение x i называется вариантой . Частота m i – это число наблюдений значения x i в выборке. Относительная частота (частость) w i – это отношение частоты m i к объему выборкиn : .
При изучении вариационного ряда также используют понятия накопленной частоты и накопленной частости. Пусть x некоторое число. Тогда количество вариантов, значения которых меньше x , называется накопленной частотой: для x i n называется накопленной частостью w i max .
Признак называется дискретно варьируемым, если его отдельные значения (варианты) отличаются друг от друга на некоторую конечную величину (обычно целое число). Вариационный ряд такого признака называется дискретным вариационным рядом.

Таблица 1. Общий вид дискретного вариационного ряда частот

Значения признака x i x 1 x 2 x n
Частоты m i m 1 m 2 m n

Признак называется непрерывно варьирующим, если его значения отличаются друг от друга на сколь угодно малую величину, т.е. признак может принимать любые значения в некотором интервале. Непрерывный вариационный ряд для такого признака называется интервальным.

Таблица 2. Общий вид интервального вариационного ряда частот

Таблица 3. Графические изображения вариационного ряда

Ряд Полигон или гистограмма Эмпирическая функция распределения
Дискретный
Интервальный
Просматривая результаты проведенных наблюдений, определяют, сколько значений вариантов попало в каждый конкретный интервал. Предполагается, что каждому интервалу принадлежит один из его концов: либо во всех случаях левые (чаще), либо во всех случаях правые, а частоты или частости показывают число вариантов, заключенных в указанных границах. Разности a i – a i +1 называются частичными интервалами. Для упрощения последующих расчетов интервальный вариационный ряд можно заменить условно дискретным. В этом случае серединное значение i -го интервала принимают за вариант x i , а соответствующую интервальную частоту m i – за частоту этого интервала.
Для графического изображения вариационных рядов наиболее часто используются полигон, гистограмма, кумулятивная кривая и эмпирическая функция распределения.

В табл. 2.3 (Группировка населения России по размеру среднедушевого дохода в апреле 1994г.) представлен интервальный вариационный ряд .
Удобно ряды распределения анализировать при помощи графического изображения, позволяющего судить и о форме распределения. Наглядное представление о характере изменения частот вариационного ряда дают полигон и гистограмма .
Полигон используется при изображении дискретных вариационных рядов .
Изобразим, например графически распределение жилого фонда по типу квартир, (табл. 2.10).
Таблица 2.10 - Распределение жилого фонда городского района по типу квартир (цифры условные).


Рис. Полигон распределения жилого фонда


На оси ординат могут наноситься не только значения частот, но и частостей вариационного ряда.
Гистограмма принимается для изображения интервального вариационного ряда . При построении гистограммы на оси абсцисс откладываются величины интервалов, а частоты изображаются прямоугольниками, построенными на соответствующих интервалах. Высота столбиков в случае равных интервалов должна быть пропорциональна частотам. Гистограмма – график, на котором ряд изображен в виде смежных друг с другом столбиков.
Изобразим графически интервальный ряд распределения, приведённый в табл. 2.11.
Таблица 2.11 - Распределение семей по размеру жилой площади, приходящейся на одного человека (цифры условные).
N п/п Группы семей по размеру жилой площади, приходящейся на одного человека Число семей с данным размером жилой площади Накопленное число семей
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
ВСЕГО 115 ----


Рис. 2.2. Гистограмма распределения семей по размеру жилой площади, приходящейся на одного человека


Используя данные накопленного ряда (табл. 2.11), построим кумуляту распределения.


Рис. 2.3. Кумулята распределения семей по размеру жилой площади, приходящейся на одного человека


Изображение вариационного ряда в виде кумуляты особенно эффективно для вариационных рядов, частоты которых выражены в долях или процентах к сумме частот ряда.
Если при графическом изображении вариационного ряда в виде кумуляты оси поменять, то мы получим огиву . На рис. 2.4 приведена огива, построенная на основе данных табл. 2.11.
Гистограмма может быть преобразована в полигон распределения, если найти середины сторон прямоугольников и затем эти точки соединить прямыми линиями. Полученный полигон распределения изображён на рис. 2.2 пунктирной линией.
При построении гистограммы распределения вариационного ряда с неравными интервалами по оси ординат наносят не частоты, а плотность распределения признака в соответствующих интервалах.
Плотность распределения – это частота, рассчитанная на единицу ширины интервала, т.е. сколько единиц в каждой группе приходится на единицу величины интервала. Пример расчета плотности распределения представлен в табл. 2.12.
Таблица 2.12 - Распределение предприятий по числу занятых (цифры условные)
N п/п Группы предприятий по числу занятых, чел. Число предприятий Величина интервала, чел. Плотность распределения
А 1 2 3=1/2
1 До 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
ВСЕГО 147 ---- ----

Для графического изображения вариационных рядов может также использоваться кумулятивная кривая . При помощи кумуляты (кривой сумм) изображается ряд накопленных частот. Накопленные частоты определяются путём последовательно суммирования частот по группам и показывают, сколько единиц совокупности имеют значения признака не больше, чем рассматриваемое значение.


Рис. 2.4. Огива распределения семей по размеру жилой площади, приходящейся на одного человека

При построении кумуляты интервального вариационного ряда по оси абсцисс откладываются варианты ряда, а по оси ординат накопленные частоты.

Статистические ряды распределения представляют собой упорядоченное расположение единиц изучаемой совокупности на группы по группировочному признаку.

Различают атрибутивные и вариационные ряды распределения.

Атрибутивный - это ряд распределения, построенный по качественным признакам. Он характеризует состав совокупности по различным существенным признакам.

По количественному признаку строится вариационный ряд распределения. Он состоит из частоты (численности) отдельных вариантов или каждой группы вариационного ряда. Данные числа показывают, насколько часто встречаются различные варианты (значения признака) в ряду распределения. Сумма всех частот определяет численность всей совокупности.

Численности групп выражаются в абсолютных и относительных величинах. В абсолютных величинах выражается числом единиц совокупности в каждой выделенной группе, а в относительных величинах - в виде долей, удельных весов, представленных в процентах к итогу.

В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды распределения. В дискретном вариационном ряде распределения группы составлены по признаку, изменяющемуся дискретно и принимающему только целые значения.

В интервальном вариационном ряде распределения группиро-вочный признак, составляющий основание группировки, может принимать в определенном интервале любые значения.

Вариационные ряды состоят из двух элементов: частоты и варианты.

Вариантой называют отдельное значение варьируемого признака, которое он принимает в ряду распределения.

Частота - это численность отдельных вариант или каждой группы вариационного ряда. Если частоты выражены в долях единицы или в процентах к итогу, то их называют частостями.

Правила и принципы построения интервальных рядов распределения строятся по аналогичным правилам и принципам построения статистических группировок. Если интервальный вариационный ряд распределения построен с равными интервалами, частоты позволяют судить о степени заполнения интервала единицами совокупности. Для проведения сравнительного анализа заполненности интервалов определяют показатель, который будет характеризовать плотность распределения.

Плотность распределения - это отношение числа единиц совокупности к ширине интервала.

Вариационными называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами считаются отдельные значения признака, которые он принимает в вариационном ряду, т е. конкретное значение варьирующего признака. Частоты - это численности отдельных вариантов или каждой группы вариационного ряда, т. е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем.

Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100%.

В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды.

Как известно, вариация количественных признаков может быть дискретной (прерывной) или непрерывной.

В случае дискретной вариации величина количественного признака принимает только целые значения. Следовательно, дискретный вариационный рядхарактеризует распределение единиц совокупности по дискретному признаку. Примером дискретного вариационного ряда является распределение семей по числу комнат в отдельных квартирах, приведенное в табл. 3.12.

В первой колонке таблицы представлены варианты дискретного вариационного ряда, во второй - помещены частоты вариационного ряда, а в третьей - показаны частости.

В случае непрерывной вариации величина признака у единиц совокупности может принимать в определенных пределах любые значения, отличающиеся друг от друга на сколько угодно малую величину. Построение интервальных вариационныхрядов целесообразно прежде всего при непрерывной вариации признака, а также если дискретная вариация проявляется в широких пределах, т. е. число вариантов дискретного признака достаточно велико. В табл. 3.3 представлен интервальный вариационный ряд.

Графическое изображение рядов распределения

Анализ рядов распределения можно проводить на основе их графического изображения. Линейчатые и круговые диаграммы строятся для отображения структуры совокупности.

Применяются вместе с диаграммами и такие линии, как полигон, кумулята, огива, гистограмма. При изображении дискретных вариационных рядов используется полигон.

Полигон - ломаная кривая, строится на основе прямоугольной системы координат, когда по оси Х откладываются значения признака, а по оси У - частоты.

Гладкая кривая, соединяющая точки - это эмпирическая плотность распределения.

Кумулята - ломаная кривая, строящаяся на основе прямоугольной системы координат, когда по оси Х откладываются значения признака, а по оси У - накопленные частоты.

Для дискретных рядов на оси откладываются сами значения признака, а для интервальных - середины интервалов.

На основе гистограмм можно строить диаграммы накопленных частот с последующим построением интегральной эмпирической функции распределения.

Представляются в виде рядов распределения и оформляются в виде .

Ряд распределния является одним из видов группировок.

Ряд распределения — представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку.

В зависимости от признака, положенного в основу образования ряда распределения различают атрибутивные и вариационные ряды распределения:

  • Атрибутивными — называют ряды распределения, построенные по качественными признакам.
  • Ряды распределения, построенные в порядке возрастания или убывания значений количественного признака называются вариационными .
Вариационный ряд распределения состоит из двух столбцов:

В первом столбце приводятся количественные значения варьирующегося признака, которые называются вариантами и обозначаются . Дискретная варианта — выражается целым числом. Интервальная варианта находится в пределах от и до. В зависимости от типа варианты можно построить дискретный или интервальный вариационный ряд.
Во втором столбце содержится количество конкретных вариант , выраженное через частоты или частости:

Частоты — это абсолютные числа, показывающие столько раз в совокупности встречается данное значение признака, которые обозначают . Сумма всех частот равна должна быть равна численности единиц всей совокупности.

Частости () — это частоты выраженные в процентах к итогу. Сумма всех частостей выраженных в процентах должна быть равна 100% в долях единице.

Графическое изображение рядов распределения

Наглядно ряды распределения представляются при помощи графических изображений.

Ряды распределения изображаются в виде:
  • Полигона
  • Гистограммы
  • Кумуляты
  • Огивы

Полигон

При построении полигона на горизонтальной оси (ось абсцисс) откладывают значения варьирующего признака, а на вертикальной оси (ось ординат) — частоты или частости.

Полигон на рис. 6.1 построен по данным микропереписи населения России в 1994 г.

6.1. Распределение домохозяйств по размеру

Условие : Приводятся данные о распределении 25 работников одного из предприятий по тарифным разрядам:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Задача : Построить дискретный вариационный ряд и изобразить его графически в виде полигона распределения.
Решение :
В данном примере вариантами является тарифный разряд работника. Для определения частот необходимо рассчитать число работников, имеющих соответствующий тарифный разряд.

Полигон используется для дискретных вариационных рядов.

Для построения полигона распределения (рис 1) по оси абсцисс (X) откладываем количественные значения варьирующего признака — варианты, а по оси ординат — частоты или частости.

Если значения признака выражены в виде интервалов, то такой ряд называется интервальным.
Интервальные ряды распределения изображают графически в виде гистограммы, кумуляты или огивы.

Статистическая таблица

Условие : Приведены данные о размерах вкладов 20 физических лиц в одном банке (тыс.руб) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Задача : Построить интервальный вариационный ряд с равными интервалами.
Решение :

  1. Исходная совокупность состоит из 20 единиц (N = 20).
  2. По формуле Стерджесса определим необходимое количество используемых групп: n=1+3,322*lg20=5
  3. Вычислим величину равного интервала: i=(152 — 2) /5 = 30 тыс.руб
  4. Расчленим исходную совокупность на 5 групп с величиной интервала в 30 тыс.руб.
  5. Результаты группировки представим в таблице:

При такой записи непрерывного признака, когда одна и та же величина встречается дважды (как верхняя граница одного интервала и нижняя граница другого интервала), то эта величина относится к той группе, где эта величина выступает в роли верхней границы.

Гистограмма

Для построения гистограммы по оси абсцисс указывают значения границ интервалов и на их основании строят прямоугольники, высота которых пропорциональна частотам (или частостям).

На рис. 6.2. изображена гистограмма распределения населения России в 1997 г. по возрастным группам.

Рис. 6.2. Распределение населения России по возрастным группам

Условие : Приводится распределение 30 работников фирмы по размеру месячной заработной платы

Задача : Изобразить интервальный вариационный ряд графически в виде гистограммы и кумуляты.
Решение :

  1. Неизвестная граница открытого (первого) интервала определяется по величине второго интервала: 7000 — 5000 = 2000 руб. С той же величиной находим нижнюю границу первого интервала: 5000 — 2000 = 3000 руб.
  2. Для построения гистограммы в прямоугольной системе координат по оси абсцисс откладываем отрезки, величины которых соответствуют интервалам варицонного ряда.
    Эти отрезки служат нижним основанием, а соответствующая частота (частость) — высотой образуемых прямоугольников.
  3. Построим гистограмму:

Для построения кумуляты необходимо рассчитать накопленные частоты (частости). Они определяются путем последовательного суммирования частот (частостей) предшествующих интервалов и обозначаются S. Накопленные частоты показывают, сколько единиц совокупности имеют значение признака не больше, чем рассматриваемое.

Кумулята

Распределение признака в вариационном ряду по накопленным частотам (частостям) изображается с помощью кумуляты.

Кумулята или кумулятивная кривая в отличие от полигона строится по накопленным частотам или частостям. При этом на оси абсцисс помещают значения признака, а на оси ординат — накопленные частоты или частости (рис. 6.3).

Рис. 6.3. Кумулята распределения домохозяйств по размеру

4. Рассчитаем накопленные частоты:
Наколенная частота первого интервала рассчитывается следующим образом: 0 + 4 = 4, для второго: 4 + 12 = 16; для третьего: 4 + 12 + 8 = 24 и т.д.

При построении кумуляты накопленная частота (частость) соответствующего интервала присваивается его верхней границе:

Огива

Огива строится аналогично кумуляте с той лишь разницей, что накопленные частоты помещают на оси абсцисс, а значения признака — на оси ординат.

Разновидностью кумуляты является кривая концентрации или график Лоренца. Для построения кривой концентрации на обе оси прямоугольной системы координат наносится масштабная шкала в процентах от 0 до 100. При этом на оси абсцисс указывают накопленные частости, а на оси ординат — накопленные значения доли (в процентах) по объему признака.

Равномерному распределению признака соответствует на графике диагональ квадрата (рис. 6.4). При неравномерном распределении график представляет собой вогнутую кривую в зависимости от уровня концентрации признака.

6.4. Кривая концентрации

Совокупность значений изученного в данном эксперименте или наблюдении параметра, проранжированных по величине (возрастания или убывания) называется вариационным рядом.

Предположим, что мы измерили артериальное давление у десяти пациентов с целью получить верхний порог АД: систолическое давление, т.е. только одно число.

Представим, что серия наблюдений (статистическая совокупность) артериального систолического давления в 10-ти наблюдениях имеет следующий вид (табл. 1):

Таблица 1

Составляющие вариационного ряда называются вариантами. Варианты представляют собой числовое значение изучаемого признака.

Построение из статистической совокупности наблюдений вариационного ряда - только первый шаг к осмыслению особенностей всей совокупности. Далее необходимо определить средний уровень изучаемого количественного признака (средний уровень белка крови, средний вес пациентов, среднее время наступления наркоза и т.д.)

Средний уровень измеряют с помощью критериев, которые носят название средних величин. Средняя величина - обобщающая числовая характеристика качественно однородных величин, характеризующая одним числом всю статистическую совокупность по одному признаку. Средняя величина выражает то общее, что характерно для признака в данной совокупности наблюдений.

Общеупотребительными являются три вида средних величин: мода (), медиана () и среднеарифметическая величина ().

Для определения любой средней величины необходимо использовать результаты индивидуальных наблюдений, записав их в виде вариационного ряда (табл. 2).

Мода - значение, наиболее часто встречающееся в серии наблюдений. В нашем примере мода = 120. Если в вариационном ряду нет повторяющихся значений, то говорят, что мода отсутствует. Если несколько значений повторяются одинаковое количество раз, то в качестве моды берут наименьшее из них.

Медиана - значение, делящее распределение на две равные части, центральное или срединное значение серии наблюдений, упорядоченных по возрастанию или убыванию. Так, если в вариационном ряду 5 значений, то его медиана равна третьему члену вариационного ряда, если в ряду четное количество членов, то медиана представляет собой среднее арифметическое двух его центральных наблюдений, т.е. если в ряду 10 наблюдений, то медиана равна среднему арифметическому 5 и 6 наблюдения. В нашем примере.

Заметим важную особенность моды и медианы: на их величины не оказывают влияние числовые значения крайних вариант.

Средняя арифметическая величина рассчитывается по формуле:

где - наблюденная величина в -том наблюдении, а - число наблюдений. Для нашего случая.

Средняя арифметическая величина обладает тремя свойствами:

Средняя занимает серединное положение в вариационном ряду. В строго симметричном ряду.

Средняя является обобщающей величиной и за средней не видны случайные колебания, различия в индивидуальных данных. Она отражает то типичное, что характерно для всей совокупности.

Сумма отклонений всех вариант от средней равна нулю: . Отклонение вариант от средней обозначается.

Вариационный ряд состоит из вариант и соответствующих им частот. Из десяти полученных значений цифра 120 встретилась 6 раз, 115 - 3 раза, 125 - 1 раз. Частота () - абсолютная численность отдельных вариант в совокупности, указывающая, сколько раз встречается данная варианта в вариационном ряду.

Вариационный ряд может быть простым (частоты = 1) или сгруппированным укороченным, по 3-5 вариант. Простой ряд используется при малом числе наблюдений (), сгруппированный - при большом числе наблюдений ().