В статистике средней величиной называют обобщающий показатель совокупности однородных общественных или природных явлений, который показывает типичный уровень варьирующего признака в расчете на единицу совокупности в конкретный момент времени.

Нахождение среднего - один из распространенных приемов обобщения. Средняя величина отражает то общее, что типично (характерно) для всех единиц изучаемой совокупности, но в то же время она игнорирует различия отдельных единиц. Мы уже говорили, что при неограниченном увеличении количества наблюдений (п -» оо) средняя величина, согласно закону больших чисел, будет неограниченно приближаться к его математическому ожиданию, т. е. при п -> оо можно записать х ~ М[Х], здесь х - средняя величина. То есть средняя величина - это оценка математического ожидания.

Сделаем небольшое отступление и приведем краткие сведения об оценках параметров, полученных в результате п опытов. Предположим, что надо определить по результатам п опытов некоторый параметр d. Приближенное значение этого параметра будем называть его оценкой и обозначим d. Оценка d должна удовлетворять ряду требований, чтобы в каком-то смысле быть оценкой “доброкачественной”.

Оценка d при увеличении числа опытов должна сходиться по вероятности к искомому параметру, т. е.

Оценка, обладающая таким свойством, называется состоятельной.

Кроме того, пользуясь оценкой d вместо самого параметра d, желательно не делать систематической ошибки, т. е. математическое ожидание оценки должно быть равным самому параметру:

Оценка, которая обладает данным свойством, называется несмещенной.

Было бы хорошо, если бы выбранная несмещенная оценка d была как можно менее случайной, т. е. обладала по сравнению с другими минимальной дисперсией:

Оценка, которая обладает данным свойством, называется эффективной.

В реальных условиях не всегда удается удовлетворить всем перечисленным требованиям. Тем не менее при выборе оценки любого параметра желательно эту оценку рассмотреть со всех перечисленных точек зрения.

Вернемся к средним величинам. При их вычислении при большом количестве наблюдений случайности взаимопога- шаются (это следует из закона больших чисел), следовательно, можно абстрагироваться от несущественных особенностей изучаемого явления и от количественных значений признака в каждом конкретном опыте.

Крупный вклад в обоснование и развитие теории средних величин внес А. Кетле. Согласно его учению массовые процессы формируются под влиянием двух групп причин. К первой группе общих для всех единиц массовой совокупности причин относятся те из них, которые определяют состояние массового процесса. Они формируют типичный уровень для единиц данной однородной совокупности.

Вторая группа причин формирует специфические особенности отдельных единиц массовой совокупности и, следовательно, их разброс от типичного уровня.

Эти причины не связаны с природой изучаемого явления, поэтому их называют случайными причинами.

Средняя величина, полученная по всей совокупности, называется общей, а средние величины, вычисленные по каждой группе, называются групповыми средними. Есть два вида средних величин: степенные средние (средняя арифметическая и др.), структурные средние (мода, медиана).

Рассмотрим степенные средние. Степенные средние определяются исходя из формулы

где х - среднее значение;

х { - текущее значение изучаемого признака;

т - показатель степени средней;

п - количество признаков (вариант).

В зависимости от показателя т степени средней получаем следующие виды степенных средних:

  • - среднюю гармоническую х гар, если т = -1;
  • - среднюю геометрическую эс геом, если т = 0;
  • - среднюю арифметическую х ар, если т = 1;
  • - среднюю квадратическую х квад, если т = 2;
  • - среднюю кубическую х куб., если т = 3,
  • - ИТ. д.

При использовании одних и тех же данных чем больше т в формуле (6.4), тем больше значение средней, т. е.

Приведем конкретные формулы для вычисления некоторых видов степенных средних.

При т = -1 получаем среднюю гармоническую:

В том случае, если исходные данные сгруппированы, используются взвешенные средние. В качестве веса может использоваться частота р (количество опытов, в которых появилось интересующее нас событие) или относительная частота

Запишем формулы для взвешенной средней гармонической:

При т = 0 получаем среднюю геометрическую:

т. е. получили неопределенность.

Для ее раскрытия прологарифмируем обе части формулы (6.4.)

затем подставляем т = 0 и получаем

т. е. имеем неопределенность вида Для раскрытия этой неопределенности применяем правило Лопиталя. Полученный результат потенцируется, и окончательно получаем

Широкое применение средняя геометрическая получила для нахождения средних темпов изменения в рядах динамики и в рядах распределения.

Запишем формулы для взвешенной средней геометрической.

Приведем конкретный пример нахождения средней геометрической взвешенной по формуле (6.11).

Пример 6.1

Исходные данные наблюдений приведены в табл. 6.1.

Таблица 6.1

В табл. 6.1 х. - результаты, принятые некоторой случайной величиной X в г-м опыте; р. - частота события - показывает, сколько раз в результате всех опытов появилось интересующее нас событие. Например, х = 2 появилось в 24 опытах 5 раз.

Относительная частота события (частость).

По формуле (6.11) получаем:

По формуле (6.12) имеем

При т = 1 получаем среднюю арифметическую:

Средняя арифметическая - наиболее распределенный вид среди всех видов степенных средних. Она используется в тех случаях, когда объем варьирующего признака для всей совокупности является суммой значений признаков отдельных единиц.

Приведем формулы для нахождения средней арифметической взвешенной:

При большом количестве наблюдений, согласно закону больших чисел, формула (6.15) определяет оценку математического ожидания т. е.

При т = 2 получаем среднюю квадратическую:

Она используется для вычисления среднего размера признака, выраженного в квадратных единицах.

Формулы для нахождения средней квадратической взвешенной имеют вид:

При га = 3 получаем среднюю кубическую:

Она применяется для нахождения среднего размера признака, выраженного в кубических единицах.

Формулы для вычисления средней кубической взвешенной имеют вид:

Теперь рассмотрим структурные средние: моду и медиану. В статистике, в отличие от теории вероятностей, имеем дело с оценками этих величин. Мы будем обозначать их теми же буквами, что и в главе 2, но с тильдой.

Мода в статистике (Мо) - значение случайной величины, которое встречается в статистическом ряду распределения чаще всего, т. е. имеет наибольшую частоту или относительную частоту (частость).

Например, в табл. 6.1 наибольшая относительная частота / = 0,33, поэтому мода равна Мо = 5.

Если мы имеем группированный ряд распределения с равными интервалами, то моду можно найти по формуле

где Мо нижн - нижняя граница модального интервала;

г Мо - длина модального интервала;

Рмо - частота модального интервала;

М-мо_, - частота интервала, предшествующего модальному;

М-мо +1 -- частота интервала, следующего за модальным.

Заметим, что для расчета можно использовать и относительные частоты.

Медиана в статистике - варианта, которая находится в середине ранжированного ряда распределения, т. е. значение медианы находиться по ее порядковому номеру.

Если ряд распределения имеет нечетное число элементов, номер медианы находиться по формуле

Например, в табл. 6.2 приведены величины окладов профессорско-преподавательского состава кафедры высшей математики.

Таблица 6.2

Количество элементов ряда равно 5, поэтому по формуле (6.23) находим номер медианы , следовательно, меди

ана в данном случае равна

Если ряд содержит четное число элементов, то варианта находится как средняя из двух вариант, находящихся в середине ряда.

В группированном ряду распределения медиана (так как она делит всю совокупность на две равные части) находится в каком-то из интервалов.

Кумулятивная (накопленная) частота (или относительная частота) равна или превышает полусумму всех частот ряда (для относительных частот она равна 1/2 или превышает 1/2).

В этом случае значение медианы вычисляется по формуле

где - нижняя граница медианного интервала;

Длина медианного интервала;

Полусумма частот;

Сумма частот, накопленная до начала медианного интервала;

Частота медианного интервала.

Средние величины и общие принципы их вычисления.

Средние величины относятся к обобщающим статистическим показателям, которые дают сводную (итоговую) характеристику массовых общественных явлений, так как строятся на основе большого количества индивидуальных значений варьирующего признака. Для выяснения сущности средней величины необходимо рассмотреть особенности формирования значений признаков тех явлений, по данным которых исчисляют среднюю величину.

Известно, что единицы каждого массового явления обладают многочисленными признаками. Какой бы из этих признаков мы ни взяли, его значения у отдельных единиц будут различными, они изменяются, или, как говорят в статистике, варьируют от одной единицы к другой. Так, например, заработная плата работника определяется его квалификацией, характером труда, стажем работы и целым рядом других факторов, поэтому изменяется в весьма широких пределах. Совокупное влияние всех факторов определяет размер заработка каждого работника, тем не менее, можно говорить о среднемесячной заработной плате работников разных отраслей экономики. Здесь мы оперируем типичным, характерным значением варьирующего признака, отнесенным к единице многочисленной совокупности.

Средняя величина отражает то общее, что характерно для всех единиц изучаемой совокупности. В то же время она уравновешивает влияние всех факторов, действующих на величину признака отдельных единиц совокупности, как бы взаимно погашая их. Уровень (или размер) любого общественного явления обусловлен действием двух групп факторов. Одни из них являются общими и главными, постоянно действующими, тесно связанными с природой изучаемого явления или процесса, и формируют то типичное для всех единиц изучаемой совокупности, которое и отражается в средней величине. Другие являются индивидуальными, их действие выражено слабее и носит эпизодический, случайный характер. Они действуют в обратном направлении, обусловливают различия между количественными признаками отдельных единиц совокупности, стремясь изменить постоянную величину изучаемых признаков. Действие индивидуальных признаков погашается в средней величине. В совокупном влиянии типичных и индивидуальных факторов, которое уравновешивается и взаимно погашается в обобщающих характеристиках, проявляется в общем виде известный из математической статистики фундаментальный закон больших чисел.

В совокупности индивидуальные значения признаков сливаются в общую массу и как бы растворяются. Отсюда и средняя величина выступает как «обезличенная», которая может отклоняться от индивидуальных значений признаков, не совпадая количественно ни с одним из них. Средняя величина отражает общее, характерное и типичное для всей совокупности благодаря взаимо погашению в ней случайных, нетипичных различий между признаками отдельных ее единиц, так как ее величина определяется как бы общей равнодействующей из всех причин.

Однако для того, чтобы средняя величина отражала наиболее типичное значение признака, она должна определяться не для любых совокупностей, а только для совокупностей, состоящих из качественно однородных единиц. Это требование является основным условием научно обоснованного применения средних величин и предполагает тесную связь метода средних величин и метода группировок в анализе социально-экономических явлений. Следовательно, средняя величина – это обобщающий показатель, характеризующий типичный уровень варьирующего признака в расчете на единицу однородной совокупности в конкретных условиях места и времени.

Определяя, таким образом, сущность средних величин, необходимо подчеркнуть, что правильное определение любой средней величины предполагает выполнение следующих требований:

Качественная однородность совокупности, по которой вычислена средняя величина. Это означает, что определение средних величин должно основываться на методе группировок, обеспечивающем выделение однородных, однотипных явлений;

Исключение влияния на вычисление средней величины случайных, сугубо индивидуальных причин и факторов. Это достигается в том случае, когда вычисление средней основывается на достаточно массовом материале, в котором проявляется действие закона больших чисел, и все случайности взаимно погашаются;

При вычислении средней величины важно установить цель ее расчета и так называемый определяющий показатель (свойство), на который она должна быть ориентирована. Определяющий показатель может выступать в виде суммы значений усредняемого признака, суммы его обратных значений, произведения его значений и т. п. Связь между определяющим показателем и средней величиной выражается в следующем: если все значения усредняемого признака заменить средним значением, то их сумма или произведение в этом случае не изменит определяющего показателя. На основе этой связи определяющего показателя со средней величиной строят исходное количественное отношение для непосредственного расчета средней величины. Способность средних величин сохранять свойства статистических совокупностей называют определяющим свойством.

Средняя величина, рассчитанная в целом по совокупности, называется общей средней; средние величины, рассчитанные для каждой группы, – групповыми средними. Общая средняя величина отражает общие черты изучаемого явления, групповая средняя дает характеристику явления, складывающуюся в конкретных условиях данной группы.

Средние величины могут быть как абсолютными, так и относительными (средняя заработная плата, средний процент выполнения плана).

Средняя величина всегда именованная, она имеет ту же размерность, что и признак у отдельных единиц совокупности.

Объективность и типичность статистической средней могут быть обеспечены лишь при определенных условиях. Первое условие состоит в том, что средняя должна вычисляться для качественно однородной совокупности. Второе условие – для исчисления средней должны быть использованы не единичные, а массовые данные, ибо только тогда взаимно погашаются возможные случайные отклонения.

Способы расчета могут быть разные, поэтому в статистике различают несколько видов средней величины, основными из которых являются средняя арифметическая, средняя гармоническая и средняя геометрическая.

В экономическом анализе использование средних величин является основным инструментом для оценки результатов научно-технического прогресса, социальных мероприятий, поиска резервов развития экономики. В то же время следует помнить о том, что чрезмерное увлечение средними показателями может привести к необъективным выводам при проведении экономико-статистического анализа. Это связано с тем, что средние величины, будучи обобщающими показателями, погашают, игнорируют те различия в количественных признаках отдельных единиц совокупности, которые реально существуют и могут представлять самостоятельный интерес.

Лекция 6. Средние величины

Среди показателей, характеризующих статистические совокупности, важное место занимают средние величины.

Средняя величина - показатель, который даёт обобщённую (усреднённую) характеристику единиц изучаемой совокупности. В средней величине отражается то общее, что имеется в каждой единице совокупности.

Сущность статистической обработки методом средней величины заключается в замене индивидуальных значений признака их средним показателем. При этом общий объём совокупности остаётся неизменным.

Пример: есть данные о выработке 5 рабочих: 135, 141, 153, 159, 162. Определить среднюю выработку. .

Средние величины, которые необходимо знать наизусть:

Средняя арифметическая;

Средняя гармоническая;

Средняя хронологическая;

Средняя квадратическая, кубическая;

Средняя геометрическая;

Структурные средние: мода, медиана.

1. Средняя арифметическая: чаще всего в статистике и социально-экономических исследованиях применяется арифметическая величина.

Средняя арифметическая простая рассматривается в случаях, когда значение признака повторяется один или одинаковое число раз в ряде распределения:

Где n -количество единиц совокупности.

Средняя арифметическая взвешенная применяется в случаях, когда каждое значение признака повторяется неодинаковое число раз, или частота ряда распределения превышает единицу хотя бы для одного признака:

Где f -вес.(сколько раз повторяется каждая еденица совокупности)

2. Средняя гармоническая: в ряде случаев бывают известны варианты (x) и произведения варианты на частоту (x f), в то время как сами частоты (f) неизвестны, тогда применяется средняя гармоническая, которая бывает простой и взвешенной.

Произведение x f выражается через сложный экономический показатель M (M = x f ). Для расчёта средней величины, когда x f =M =1 , применяется средняя гармоническая простая: .

Если x f =M? 1 , то для расчёта применяется средняя гармоническая взвешенная: .

Средняя гармоническая - величина, обратная средней арифметической, из обратных значений признака.

Свойства средних величин

1. Если от каждой варианты отнять или прибавить одно и то же число, то средняя увеличится или уменьшится на то же число.

2. Если каждую варианту увеличить или уменьшить в a раз, то средняя увеличится или уменьшится в столько же раз.

3. Если все частоты увеличить или уменьшить в a раз, то средняя не изменится.

4. Если все частоты увеличить или уменьшить на a , то средняя изменится непредсказуемо.

5. Средняя арифметическая суммы нескольких величин равна суме средних арифметических этих величин.

6. Алгебраическая сумма отклонений значений признака от средней арифметической всегда равна нулю.

Пример: Найти среднюю урожайность в 2003 и 2004 гг.

Где f -вес

3. Средняя хронологическая: применяется для расчёта средней величины, если исходные данные представлены на определённые даты, моменты времени:

Пример: Найти среднюю стоимость ОПФ

стоимость ОПФ

Приведем все расчеты к одному знаменателю: Х=эээ

4. Средняя квадратическая: применяется для измерения вариации признака в совокупности:

5. Средняя кубическая: .

6. Средняя геометрическая: применяется чаще всего для определения средних темпов роста в единицу времени: ,

Пример: Рассчитайте среднегодовые темпы роста

Где m=n-1.

Средняя геометрическая, чаще всего, применяется в экономических расчетах, но учитывает только начало и конец ряда и недостаточно точно отражает динамику изменения, т.е. она не учитывает сумму ряда.

7. Средняя кумулятивная:

Формула кумулятивной средней более чётко отражает динамику изменений и помогает увидеть сумму ранжированного ряда.

Все рассмотренные средние величины (кроме средней хронологической) являются степенными средними и выводятся из следующей формулы: , где получается при

k=-1 ? средняя гармоническая;

k=0 ? средняя геометрическая;

k=1 ? средняя арифметическая;

k=2 ? средняя квадратическая;

k=3 ? средняя кубическая.

Все эти показатели рассчитываются для варьирующего признака для простых средних. Если все значения признака в ряде распределения одинаковы, то все значения средних равны. Между указанными средними величинами имеет место зависимость (для одного ряда распределения):

Это неравенство называется правилом мажорантности средних величин.

8. Структурные средние:

1) Структурное среднее мода () - наиболее часто встречающееся значение ряда, другими словами, мода - это варианта, имеющая наибольшую частоту. В дискретных рядах мода определяется визуально, в интервальных рядах визуально определяется модальный интервал, а мода (точечная) определяется по формуле: , где

x 0 ? нижняя граница модального интервала;

i ? шаг интервального ряда;

f ? частота модального интервала;

f Mо-1 ? частота интервала, предшествующего модальному;

f Mо+1 ? частота интервала, следующего за модальным.

Пример: Найти Мо в дискретном и интервальном рядах.


2) Структурное среднее медиана () - значение, которое делит ранжированный ряд пополам.

В нечётных, чётных и дискретных рядах медиана определяется визуально, но в дискретных рядах она определяется с помощью накопленных частот. В интервальном ряду медианный интервал находится визуально, с помощью накопленных частот, а сама медиана (точечно) по формуле:

x 0 ? нижняя граница медианного интервала;

i ?шаг интервального ряда;

?f ? сумма накопленных частот;

S Me-1 ? сумма частот, накопленных до медианного интервала;

f Me ? частота медианного интервала.

Пример: Найти Ме в нечетных, четных, дискретных, интервальных рядах.


интервальный ряд:

Если х сред. равно Мо = Ме - это симметричное распределение, если х сред не равно Мо, не равно Ме - распределение ассиметричное.

В данной главе описывается назначение средних величин, рассматриваются их основные виды и формы, методика расчета. При изучении представленного материала необходимо усвоить требования к построению средних величин, так как их соблюдение позволяет использовать эти величины как типические характеристики значений признака по совокупности однородных единиц.

Формы и виды средних величин

Средняя величина представляет собой обобщенную характеристику уровня значений признака, которая получена в расчете на единицу совокупности. В отличие от относительной величины, которая является мерой соотношения показателей, средняя величина служит мерой признака на единицу совокупности.

Важнейшее свойство средней величины заключается в том, что она отражает то общее, что присуще всем единицам исследуемой совокупности.

Значения признака отдельных единиц совокупности колеблются в ту или иную сторону под влиянием множества факторов, среди которых могут быть существенные и случайные. Например, ставки процента по банковским ссудам определяются исходными для всех кредитных организаций факторами (уровень резервных требований и базовая ставка процента gо ссудам, предоставляемым коммерческим банкам центральным банком, и др.), а также особенностями каждой конкретной сделки в зависимости от риска, присущего данной ссуде, ее размера и срока погашения, издержек по оформлению ссуды и контролю за ее погашением и др.

В средней величине обобщаются индивидуальные значения признака и отражается влияние общих условий, наиболее характерных для данной совокупности в конкретных условиях места и времени. Сущность средней в том и заключается, что в ней взаимопогашаются отклонения значений признака отдельных единиц совокупности, обусловленные действием случайных факторов, и учитываются изменения, вызванные действием факторов основных. Средняя величина будет отражать типичный уровень признака в данной совокупности единиц, когда она рассчитана по качественно однородной совокупности. В связи с этим метод средних используют в сочетании с методом группировок.

Средние величины, характеризующие совокупность в целом, называют общими, а средние, отражающие особенность группы или подгруппы, – групповыми.

Сочетание общих и групповых средних позволяет проводить сравнения во времени и пространстве, существенно расширяет границы статистического анализа. Например, при подведении итогов переписи 2002 г. было установлено, что для России, как и для большинства европейских стран, характерно старение населения. По сравнению с переписью 1989 г. средний возраст жителей страны увеличился на три года и составил 37,7 года, мужчин – 35,2 года, женщин – 40,0 лет (по данным 1989 г. эти показатели соответственно были 34,7, 31,9 и 37,2 лет). По данным Росстата, ожидаемая продолжительность жизни при рождении в 2011 г. мужчин – 63 года, женщин – 75,6 лет.

Каждая средняя отражает особенность изучаемой совокупности по какому-то одному признаку. Для принятия практических решений, как правило, необходима характеристика совокупности по нескольким признакам. В этом случае используют систему средних величин.

Например, для достижения должного уровня доходности операций при приемлемом уровне риска банковской деятельности средние ставки процента по выданным кредитам устанавливают с учетом средних ставок процента по депозитам и другим финансовым инструментам.

Форма, вид и методика расчета средней величины зависят от поставленной цели исследования, вида и взаимосвязи изучаемых признаков, а также от характера исходных данных. Средние величины делятся на две основные категории:

  • 1) степенные средние;
  • 2) структурные средние.

Формула средней определяется значением степени применяемой средней. С увеличением показателя степени k возрастает соответственно средняя величина.

Средние величины представляют собой второй тип производных величин, находящих широкое применение в медицинской статистике. Средняя величина является сводной, обобщающей характеристикой статистической совокупности по определенному изменяющемуся количественному признаку (средний рост, средний вес, средний возраст умерших). Средняя величина отражает общее определяющее свойство всей статистической совокупности в целом, заменяя его одним числом с типичным значением данного признака. Средняя величина нивелирует, ослабляет случайные отклонения индивидуальных наблюдений в ту или иную сторону и характеризует постоянное свойство явлений.

В медицине средние величины могут использоваться для характеристики физического развития, основных антропометрических признаков (морфологических и функциональных: рост, вес, динамометрия и др.) и их динамики (средние величины прироста или убыли признака). Разработка этих показателей и их сочетаний в виде стандартов имеет большое практическое значение для анализа здоровья населения (в особенности детей, спортсменов). Эпидемиологи рассчитывают среднее число заболеваний в очаге, распределение очагов по срокам и средние сроки производства дезинфекции.

В демографических и медико-социальных исследованиях рассчитываются: средняя продолжительность предстоящей жизни, средний возраст умерших, средняя численность населения и т.д.

В экспериментально-лабораторных исследованиях также используются средние величины: температура, число ударов пульса в минуту, уровень артериального давления, средняя скорость или среднее время реакции на тот или иной раздражитель, средние уровни содержания биохимических элементов в крови и др.

И статистические коэффициенты, и средние величины представляют собой вероятностные величины, однако между ними существуют значительные различия:

  • 1) Статистические коэффициенты характеризуют признак, встречающийся только у некоторой части совокупности (так называемый альтернативный признак), который может наступить, но может и не наступить (рождение, смерть, заболевание). Средние величины характеризуют, признаки, присущие всей совокупности, но в разной степени (вес, рост, дни лечения).
  • 2) Статистические коэффициенты применяются для измерения качественных (атрибутивных или описательных) признаков, а средние - для варьирующих количественных признаков, где речь идет об отличиях в числовых размерах признака, а не о факте его наличия или отсутствия.

Основное достоинство средних величин их типичность - средняя сразу дает общую характеристику явления. В связи с этим можно выделить два основных требования для вычисления средних величин:

  • - однородность совокупности;
  • - достаточное число наблюдений.

Любое распределение случайной величины, не обязательно подчиняющееся определенному закону распределения вероятностей, характеризуется параметрами распределения: средняя величина (М), среднее квадратическое отклонение (), коэффициент вариации (Сv) и др.

Например, при изучении распределения 10 больных по срокам лечения, мы получим ряд числовых значений: 38, 13, 17, 20, 14, 18, 25, 32, 23, 25 - неупорядоченный ряд.

Рассчитать параметры распределения можно, пользуясь и таким рядом. Однако охарактеризовать ряд несколькими параметрами еще недостаточно, необходимо исследовать, есть ли в статистическом ряду какая-либо устойчивая закономерность. Но, пользуясь неупорядоченным рядом, возможную закономерность обнаружить сложно, поэтому строят ранжированные ряды.

Ряд, в котором дается распределение единиц изучаемой совокупности по значениям варьирующего признака, называется вариационным. Другими словами - вариационный ряд - ряд однородных величин, расположенных в возрастающем или убывающем порядке, где варианты (группы вариант) отличаются друг от друга на определенную величину, называемую интервалом (i).

Таким образом, ряд распределения больных по срокам лечения можно представить следующим образом:

13 14 17 18 20 22 23 25 32 38

1 1 1 1 1 1 1 1 1 1

Меняющийся, варьирующий признак изучаемого явления (рост, вес и др.), его числовое значение называется вариантой (V).

Числа случаев наблюдения данного признака, указывающие сколько раз встречается данная варианта, называются частотами (р).

Вариационные ряды могут быть:

  • 1) в зависимости от изучаемого явления:
    • - дискретные (прерывные) - образуются на основе прерывно меняющихся признаков, значения которых выражаются только в целых числах (частота пульса, количество студентов в группе и т.д.);
    • - интервальные (непрерывные) - образуются обычно на основе признаков, которые могут принимать любые значения и выражаются любым числом (рост, вес и т.д.)
  • 2) в зависимости от числа наблюдений:
    • - простые - варианта представлена одним числовым значением;
    • - сгруппированные - варианты группируются по определенному признаку. Например, при изучении физического развития может производиться группировка по весу: 40-44 кг; 45-49 кг. и т.д.
  • 3) в зависимости от порядка расположения вариант:
    • - возрастающие - варианты располагаются в порядке возрастания;
    • - убывающие - варианты располагаются в порядке убывания.

Отдельный вариационный ряд может одновременно включать в себя несколько характеристик. Например, простой, убывающий, прерывный; или - сгруппированный, возрастающий, непрерывный.

Виды средних величин, которые обычно используются в медицинской статистике, - это медиана, мода, средняя арифметическая. Другие виды средних: средняя гармоническая, средняя квадратическая, средняя кубическая, средняя геометрическая и другие - применяются лишь в специальных исследованиях.

Медиана (Me) - это серединная, центральная варианта, делящая вариационный ряд пополам на две равные части.

Например, если число наблюдений составляет 33, медианой будет варианта, занимающая 17-е ранговое место, так как в обе стороны от нее находится по 16 наблюдений.

В ряде с четным числом наблюдений в центре находятся две величины. Если они одинаковы по своему значению, не возникает затруднений в приближенном определении медианы, если же числовые значения двух величин различны, то за медиану принимается их полусумма.

Мода (Мо) - это чаще всего встречающаяся или наиболее часто повторяющаяся величина признака. При приближенном нахождении моды в простом (не сгруппированном) ряде, она определяется как варианта с наибольшим количеством частот.

Отличие медианы и моды от средней арифметической заключается в том, что при упрощенном, ориентировочном определении эти величины легко и быстро найти по их положению в вариационном ряду (позиционные средние), кроме того, они не зависят от значений крайних вариант или от степени рассеяния ряда.

Чаще всего используется в медицинской статистике средняя арифметическая величина (М - от латинского Media). Средняя арифметическая может быть простая и взвешенная.

Примером средней арифметической простой может служить результат измерения веса, например, 6 человек:

59 60 61 62 63 64 = 369

1 1 1 1 1 1 р = n = 6

Таким образом, средняя арифметическая простая получается как сумма величин (вариант), деленная на их число. Среднюю арифметическую простую можно вычислить лишь в тех случаях, когда каждая величина (варианта) представлена единичным наблюдением, т. е. когда частоты равны единице.

Если частоты вариант больше единицы, простая средняя неприменима - здесь надо вычислять среднюю арифметическую взвешенную, которая получается как сумма произведений вариант на соответствующие частоты, деленная на общее число наблюдений.

Например: частота пульса (число ударов в минуту) у 18 студентов после проведения атропиновой пробы составила: 86, 92, 100, 96, 90, 102, 88, 92, 80, 92, 96, 100, 86, 84, 102, 90, 86, 92.

80 84 86 88 90 92 96 100 102

1 1 3 1 2 4 2 2 2 р = n = 18

80 84 258 88 180 358 192 200 204 Vp = 1644

Средняя арифметическая простая - это частный случай средней арифметической взвешенной, поэтому формула средней арифметической взвешенной может использоваться и для расчета средней арифметической простой. В последнем случае частоты равны единице и умножение излишне.

Все три средние величины (Мо, Ме, М) совпадают (либо практически очень близки) в симметричном вариационном ряду: средняя арифметическая соответствует середине ряда (в симметричном ряду отклонения в сторону увеличения и в сторону уменьшения вариант соответственно уравновешиваются); медиана (как центральная величина) также соответствует середине ряда; мода (как наиболее насыщенная величина) приходится на наивысшую точку ряда, также находящуюся в его центре. Поэтому для всех симметричных рядов нет необходимости вычислять другие средние величины, кроме средней арифметической.

Свойства средней арифметической величины:

  • 1. Средняя величина является обобщающей характеристикой статистической совокупности по определенному изменяющемуся количественному признаку, отражает общее определяющее свойство всей статистической совокупности в целом, заменяя его одним числом с типичным значением данного признака. Средняя величина нивелирует, ослабляет случайные отклонения индивидуальных наблюдений в ту или иную сторону и характеризует постоянное свойство явлений.
  • 2. Сумма отклонений вариант от средней арифметической величины равна 0.
  • 3. В строго симметричном вариационном ряду средняя арифметическая занимает срединное положение и равна Мо, Ме.

Средние арифметические величины, взятые сами по себе без дополнительных приемов оценки, часто имеют ограниченное значение, так как они не отражают степени рассеяния (разнообразия) ряда. Одинаковые по размеру средние величины могут быть получены из рядов с различной степенью рассеяния. Средние - это величины, вокруг которых рассеяны различные варианты, и чем ближе друг к другу отдельные варианты, чем меньше рассеяние ряда, тем типичнее средняя величина.

Приближенным методом оценки разнообразия ряда может служить определение амплитуды. Амплитуда - разность между наибольшим и наименьшим значением вариант:

А = Vmax - Vmin

Но амплитуда не учитывает промежуточные значения вариант внутри ряда, кроме того, ее размеры могут зависеть и от числа наблюдений.

Основной мерой оценки разнообразия ряда является среднее квадратическое отклонение ().

Для вычисления сигмы необходимо:

определить отклонения (d) от средней (V - M);

возвести отклонения в квадрат (d 2);

  • 3) перемножить квадраты отклонений на частоты (d 2р);
  • 4) суммировать произведения квадратов отклонений на частоты;
  • 5) разделить эту сумму на число наблюдений;
  • 6) извлечь из частного квадратный корень.

При помощи сигмы можно установить степень типичности средней, пределы рассеяния ряда, пределы колебаний вокруг средней отдельных вариант. Чем меньше сигма, тем меньше рассеяние ряда, тем точнее и типичнее получается вычисленная для этого ряда средняя величина.

Применение сигмы дает возможность оценки и сравнения разнообразия нескольких однородных рядов распределения, так как - величина именная, выражается абсолютным числом в единицах изучаемой совокупности (см, кг, мг/л и т.д.). В этом случае принимаются во внимание абсолютные размеры сигмы. Например, при сравнении двух рядов распределения по признаку веса, при условии, что средние будут близки по уровню, но сигма в одном ряду будет ± 5,6 кг., а в другом ± 2,1 кг. - второй ряд менее рассеян, и его средняя более типична.

При оценке разнообразия неоднородных рядов (например, таких признаков как вес и рост), непосредственное сравнение размеров сигмы невозможно. В этом случае, для установления степени относительного разнообразия рядов, прибегают к производной величине - коэффициенту изменчивости (вариации), который является относительной величиной, выражается в % и обозначаемому буквой Сv (V).

Например, при изучении физического развития студентов - мужчин 1 курса получены следующие показатели: М (вес) = 67,5 кг.; М (рост) = 178,1 см. Соответственно = ± 2,8 кг. и ± 6,2 см. Среднее квадратическое отклонение по росту более чем в 2 раза превышает сигму по весу.

Коэффициент вариации по росту меньше, чем по весу, то есть рост оказался более устойчивым признаком, чем вес.

Различают три степени разнообразия коэффициентов вариации:

до 10% - слабое разнообразие;

10 - 20 % - среднее разнообразие;

более 20 % - сильное разнообразие.

Этот же метод вычисления коэффициента разнообразия пригоден и при анализе однородных рядов, у которых средние величины очень разнятся по размеру, а также для оценки изолированного, единичного ряда.

Пример вычисления средней арифметической (М); среднего квадратического отклонения (); коэффициента вариации (Cv).

Длительность лечения ангины у 45 больных составила: 20, 20, 19, 16, 19, 16, 14, 13, 15, 13, 12, 13, 13, 3, 12, 11, 12, 11, 10, 12, 11, 10, 11, 8, 7, 11, 11, 10, 10, 10, 9, 8, 8, 9, 5, 5, 6, 9, 5, 5, 9, 6, 7, 7, 14, и 15 дней.

Первый этап: Строим вариационный ряд, с учетом частоты встречаемости каждой варианты; даем характеристику ряда; находим произведения вариант на соответствующую частоту, суммируем полученные произведения и рассчитываем среднюю арифметическую:

Первый этап

Второй этап

Длительность лечения (в днях) V

Число больных p

Ряд простой, убывающий, прерывный

Второй этап: рассчитываем d (V-M); d 2; d 2p.

Заключение: Средняя длительность лечения ангины в поликлинике составила 11 дней. Средняя является недостаточно типичной для данного ряда, о чем свидетельствует коэффициент вариации, равный 36,5% (большая степень разнообразия признака).