Тема 5. Средние величины

1. Общие понятия.

    Пытаясь классифицировать изучаемые явления, мы сталкиваемся с необходимостью выявления общих характеристик, относящихся как к любому элементу совокупности, так и ко всей совокупности в целом. Такими общими характеристиками,  раскрывающие определенные свойства и направление развития процесса, выступают средние величины. Практическое применение средние нашли в деле налогообложения в странах древнего мира. Оно выразилось в процедуре усреднения доходов разных социальных категорий граждан. Для обработки массовых данных в статистике  разработали средние гармонические, геометрические,  квадратичные величи-ны. Также рассматриваются описательные средние величины (мода и медиа-на). Историки чаще сталкиваются с средней арифметической величиной.           

    Использование средних показателей предполагает следование

определённым правилам:

1) Качественная совокупность однородности – первоначально.

2) Средние вычисляются  по массовым данным, по сведениям  массовых источников где действует закон больших чисел.

3) Нельзя ограничиваться средней величиной по совокупности, не меньшее значение имеют средние показатели для каждого отдельного типа

2. Средняя арифметическая величина

      Средняя арифметическая величина является наиболее распространённой из средних величин. Если в исследовании автор не указывает  вид среднего показателя, то подразумевается  среднее арифметическое значение. Оно  находится путем отношения суммы всех значений признака к общему числу наблюдений.

                                 ;

- варианты  признака,  – число наблюдений. Смысл, например, средней заработной платы работников учреждения – сколько они получали бы, если зарплата была одинаковой.

        Иногда (чаще для группировок)  используют среднюю взвешенную величину:

                           

 суммирование, -значение признака, -соответствующая частота.

Т.е. при нахождении среднего взвешенного сумму произведений значений признака и соответствующих частот делят на сумму всех частот.

Таблица 3. Распределение футбольных матчей высшей лиги России по числу забитых мячей за игру.

Число забитых мячей.

0

1

2

3

4

5

6

7

Число матчей

21

41

42

37

19

10

6

3

 

( в среднеv за одну игру забивалось 2,34 мяча).

       Если в группировке значения признака заданы интервальным рядом, то при нахождении среднего арифметического берут середины интервалов. Для открытых интервалов значения признака определяют качественным анализом или же берут интервал (; )

3. Мода (mo)

     Это наиболее часто встречающееся значение признака в упорядоченной совокупности. Наиболее типичное среднее значение, оно определятся без вычислений. Как значение признака с наибольшей частотой. В нашей таблице распределений матчей  мода mo равна 2 ( соответствующая максимальная частота 42). Для интервальных рядов при вычислении моды сначала определяют интервал с наибольшей частотой затем пользуется формулой      mo= ,

где  - нижняя граница модального (с наибольшей частотой) интервала, K - его величина,- частота предыдущего интервала, частота модального интервала,- частота следующего интервала.

Моду можно найти и с помощью гистограммы:

 


                                                                                        

 

 

 

 

 

 

Подпись: Мода интервального ряда                                                                                                  

 

 

 

 

 


4. Медиана

      Медиана(me)-это величина,  определяющая значение признака, находящееся в середине упорядоченной совокупности. Медиана делит изучаемую совокупность так, что  число единиц с большим и меньшим, чем медиана, значением признака, одинаково.

     Чтобы найти медиану дискретного ряда надо построить ряд накопленных частот , поделить сумму всех частот пополам и определить по накопленным частотам величины варианта, соответствующей  той группе,  в которой накопленная частота впервые превышает половину общей численности совокупности.

Число забитых мячей

0

1

2

3

4

5

6

7

Число матчей

21

41

42

37

19

10

6

3

Ряд накопленных частот

21

62

104

141

160

170

176

179

104 - первая накопленная частота, превосходящая 89,5. Она соответствует значению X3=2. Следовательно, медиана равна

Для интервальных рядов:

1. Находят медианный интервал - интервал, которому соответствует первая из накопленных частот, превышающая полу сумму всех частот.

2. Используют формулу согласно котрой к нижней границе медианного интервала надо прибавить произведение величины этого интервала и дроби    , в которой   - это сумма частот предшествующих интервалов.

     Медиану также можно найти с помощью кумуляты. Для этого  максимальное значение признака делим на 2, и через эту точку проводим прямую параллельную оси абсцисс. Пересечение этой прямой с кумулятой будет соответствовать значению медианы.

При исследовании важно знать все 3 характеристики. Средняя взвешенная подвержена влиянию каждой варианты, мода не зависит от минимального и максимального значений, медиана зависит от количества вариант, а не от их величин (следовательно удобна при больших колебаниях или открытых интервалах).