Мода. Медиана. Способы их расчета
СОДЕРЖАНИЕ: Понятие моды и медианы как типичных характеристик, порядок и критерии их определения. Нахождение моды и медианы в дискретном и интервальном вариационном ряду. Квартили и децили как дополнительные характеристики вариационного статистического ряда.КОНТРОЛЬНАЯ РАБОТА
На тему: Мода. Медиана. Способы их расчета
Введение
Средние величины и связанные с ними показатели вариации играют в статистике очень большую роль, что обусловлено предметом ее изучения. Поэтому данная тема является одной из центральных в курсе.
Средняя является очень распространенным обобщающим показателям в статистике. Это объясняется тем, что только с помощью средней можно охарактеризовать совокупность по количественно варьирующему признаку. Средней величиной в статистике называется обобщающая характеристика совокупности однотипных явлений по какому-либо количественно варьирующему признаку. Средняя показывает уровень этого признака, отнесенный к единице совокупности.
Изучая общественные явления и стремясь выявить их характерные, типичные черты в конкретных условиях места и времени, статистики широко используют средние величины. С помощью средних можно сравнивать между собой различные совокупности по варьирующим признакам.
Средние, которые применяются в статистике, относятся к классу степенных средних. Из степенных средних наиболее часто применяется средняя арифметическая, реже – средняя гармоническая; средняя гармоническая применяется только при исчислении средних темпов динамики, а средняя квадратическая – только при исчислении показателей вариации.
Средняя арифметическая есть частное от деления суммы вариант на их число. Она применяется в тех случаях, когда объем варьирующего признака для всей совокупности образуется как сумма значений признака у отдельных ее единиц. Средняя арифметическая – наиболее распространенный вид средних, так как она соответствует природе общественных явлений, где объем варьирующих признаков в совокупности чаще всего образуется именно как сумма значений признака у отдельных единиц совокупности.
По своему определяющему свойству средняя гармоническая должна применяться тогда, когда общий объем признака образуется как сумма обратных значений вариант. Ее применяют тогда, когда в зависимости от имеющего материала веса приходиться не умножать, а делить на варианты или, что то же самое, умножать на обратное их значение. Средняя гармоническая в этих случаях – это величина обратная средней арифметической из обратных значений признака.
К средней гармонической следует прибегать в тех случаях, когда в качестве весов применяются не единицы совокупности – носители признака, а произведения этих единиц на значение признака.
1. Определение моды и медианы в статистике
Средние арифметическая и гармоническая являются обобщающими характеристиками совокупности по тому или иному варьирующему признаку. Вспомогательными описательными характеристиками распределения варьирующего признака являются мода и медиана.
Модой в статистике называется величина признака (варианта), которая чаще всего встречается в данной совокупности. В вариационном ряду это будет варианта, имеющая наибольшую частоту.
Медианной в статистике называется варианта, которая находится в середине вариационного ряда. Медиана делит ряд пополам, по обе стороны от нее (вверх и вниз) находится одинаковое количество единиц совокупности.
Мода и медиана в отличии от степенных средних являются конкретными характеристиками, их значение имеет какая-либо конкретная варианта в вариационном ряду.
Мода применяется в тех случаях, когда нужно охарактеризовать наиболее часто встречающуюся величину признака. Если надо, например, узнать наиболее распространенный размер заработной платы на предприятии, цену на рынке, по которой было продано наибольшее количество товаров, размер ботинок, пользующийся наибольшим спросом у потребителей, и т.д., в этих случаях прибегают к моде.
Медиана интересна тем, что показывает количественную границу значение варьирующего признака, которую достигла половина членов совокупности. Пусть средняя заработная плата работников банка составила 650000 руб. в месяц. Эта характеристика может быть дополнена, если мы скажем, что половина работников получила заработную плату 700000 руб. и выше, т.е. приведем медиану. Мода и медиана являются типичными характеристиками в тех случаях, когда взяты совокупности однородные и большой численности.
2. Нахождение моды и медианы в дискретном вариационном ряду
Найти моду и медиану в вариационном ряду, где значения признака заданы определенными числами, не представляет большой трудности. Рассмотрим таблицу 1. с распределение семей по числу детей.
Таблица 1. Распределение семей по числу детей
Группа семей по числу детей |
Число семей |
0 |
10 |
1 |
30 |
2 |
75 |
3 |
35 |
4 |
20 |
5 |
15 |
Итого |
185 |
Очевидно, в этом примере модой будет семья, имеющая двоих детей, так как этому значению варианты соответствует наибольшее число семей. Могут быть распределения, где все варианты встречаются одинаково часто, в этом случае моды нет или, иначе, можно сказать, что все варианты одинаково модальны. В других случаях не одна, а две варианты могут быть наибольшей частоты. Тогда будет две моды, распределение будет бимодальным. Бимодальные распределения могут указывать на качественную неоднородность совокупности по исследуемому признаку.
Чтобы найти медиану в дискретном вариационном ряд, нужно сумму частот разделить пополам и к полученному результату добавить . Так, в распределении 185 семьи по числу детей медианой будет: 185/2 + = 93, т.е. 93-я варианта, которая делит упорядоченный ряд пополам. Каково же значение 93-ей варианты? Для того чтобы это выяснить, нужно накапливать частоты, начиная, от наименьшей варианты. Сумма частот 1-й и 2-й вариант равна 40. Ясно, что здесь 93 варианты нет. Если прибавить к 40 частоту 3-й варианты, то получим сумму, равную 40 + 75 = 115. Следовательно, 93-я варианта соответствует третьему значению варьирующего признака, и медианой будет семья, имеющая двоих детей.
Мода и медиана в данном примере совпали. Если бы у нас была четная сумма частот (например, 184), то, применяя указанную выше формулу, получим номер медианной варианты, 184/2 + =92,5. Поскольку варианты с дробным номером не существует, полученный результат указывает, что медиана находится посередине между 92 и 93 вариантами.
3. Расчет моды и медианы в интервальном вариационном ряду
Описательный характер моды и медианы связан с тем, что в них не погашаются индивидуальные отклонения. Они всегда соответствуют определенной варианте. Поэтому мода и медиана не требуют для своего нахождения расчетов, если известны все значения признака. Однако в интервальном вариационном ряду для нахождения приближенного значения моды и медианы в пределах определенного интервала прибегают к расчетам.
Для расчета определенного значения модальной величины признака, заключенного в интервале, применяют формулу:
Мо = ХМо + iМо *(fМо – fМо-1 )/((fМо – fМо-1 ) + (fМо – fМо+1 )),
Где ХМо – минимальная граница модального интервала;
iМо – величина модального интервала;
fМо – частота модального интервала;
fМо-1 – частота интервала, предшествующего модальному;
fМо+1 – частота интервала, следующего за модальным.
Покажем расчет моды на примере, приведенном в таблице 2.
Таблица 2. Распределение рабочих предприятия по выполнению норм выработки
Выполнение норм выработки, % |
Численность рабочих |
90 – 95 |
6 |
95 – 100 |
12 |
100 -105 |
104 |
105 – 110 |
98 |
110 -115 |
40 |
115 и более |
20 |
Итого |
280 |
Чтобы найти моду, первоначально определим модальный интервал данного ряда. Из примера видно, что наибольшая частота соответствует интервалу, где варианта лежит в пределах от 100 до 105. Это и есть модальный интервал. Величина модального интервала равна 5.
Подставляя числовые значения из таблицы 2. в указанную выше формулу, получим:
Мо = 100 + 5 * (104 -12)/((104 – 12) + (104 – 98)) = 108,8
Смысл этой формулы заключается в следующем: величину той части модального интервала, которую нужно добавить к его минимальной границе, определяют в зависимости от величины частот предшествующего и последующего интервалов. В данном случае к 100 прибавляем 8,8, т.е. больше половины интервала, потому что частота предшествующего интервала меньше частоты последующего интервала.
Исчислим теперь медиану. Для нахождения медианы в интервальном вариационном ряду определяем сначала интервал, в котором она находится (медианный интервал). Таким интервалом будет такой, комулятивная частота которого равна или превышает половину суммы частот. Комулятивные частоты образуются путем постепенного суммирования частот, начиная от интервала с наименьшим значением признака. Половина суммы частот у нас равна 250 (500:2). Следовательно, согласно таблицы 3. медианным интервалом будет интервал со значением заработной платы от 350000 руб. до 400000 руб.
Таблица 3. Расчет медианы в интервальном вариационном ряду
Заработная плата, тыс. руб. |
Частоты |
Комулятивные частоты |
200 – 250 |
10 |
10 |
250 – 300 |
50 |
60 |
300 – 350 |
100 |
160 |
350 – 400 |
115 |
275 |
400 – 450 |
180 |
455 |
450 – 500 |
45 |
500 |
Сумма |
500 |
- |
До этого интервала сумма накопленных частот составила 160. Следовательно, чтобы получить значение медианы, необходимо прибавить еще 90 единиц (250 – 160).
При определении значения медианы предполагают, что значение единиц в границах интервала распределяется равномерно. Следовательно, если 115 единиц, находящихся в этом интервале, распределяются равномерно в интервале, равном 50, то 90 единицам будет соответствовать следующая его величина:
50 * 90/115 = 39,1
Прибавив полученную величину к минимальной границе медианного интервала, получим искомое значение медианы:
Ме = 350 +39,1 = 389,1 тыс. руб.
Формула исчисления медианы для интервального вариационного ряда имеет следующий вид:
Ме = ХМе + iМе * (f/2 – SМе-1 )/fМе,
Где ХМе – начальное значение медианного интервала;
iМе – величина медианного интервала;
f – сумма частот ряда (численность ряда);
SМе-1 – сумма накопленных частот в интервалах, предшествующих медианному;
fМе – частота медианного интервала.
Подставляя в эту формулу значения из примера, приведенного выше, получим значение медианы:
Ме = 350 + 50 * (500/2 – 160)/115 = 389,1 тыс. руб.
Следовательно, в наших примерах мода равна 108,8, а медиана – 389,1.
4. Квартили и децили – дополнительные характеристики вариационного ряда
Дополнительно к медиане для характеристики вариационного ряда исчисляют квартили, которые делят ряд по сумме частот на четыре равные части, и децили, которые делят ряд на десять равных частей. Второй квартиль равен медиане, а первый – Q1 и третий – Q3 исчисляют аналогично расчету медианы, только вместо медианного интервала берется для первого квартиля интервал, в котором находится варианта, отсекающая численности частот, а для третьего квартиля – варианта, отсекающая численности частот. Исчислим для нашего примера первый и третий квартили:
Q1 = XQ 1 +iQ 1 * (f/4 – SQ 1-1 )/fQ 1 ,
Q1 = 300 + 50 * (125–60)/100 = 332,5
Для расчета первого квартиля находим всех частот: f/4 составит 125 (500/4). Из таблицы 3 видно, что 125-я варианта находится в интервале 300 – 350.
Следовательно, XQ 1 = 300. Сумма накопленных частот до этого интервала равна 60 (SQ 1-1 ), частота этого интервала – 100. Расчет дает значение первого квартиля 332,5 тыс. руб. Это означает, что у трех четвертей всех рабочих заработная плата составляет 332,5 тыс. руб. и выше.
Рассчитаем третий квартиль. Три четверти численности частот (3/4 f) составит 375 = 500*3/ 4. 375-я варианта находится в интервале 400 – 450. Следовательно:
Q3 = XQ 3 + iQ 3 * (3/4f – SQ 3-1 )/fQ 3 ,
Q3 = 400 + 50 *(375 – 275)/180 = 427,75
Третий квартиль составляет 427,75 тыс. руб. Следовательно, заработная плата каждого четвертого работника превышает 427,75 тыс. руб.
Заключение
Исходя из контрольной работы, можно сделать вывод, что средние величины и их разновидности в статистике играют большую роль. Средние показатели широко применяются в анализе, так как именно в них находят свое проявление закономерности массовых явлений и процессов как во времени, так и в пространстве. Так, например, закономерность повышения производительности труда находит свое выражение в статистических показателях роста средней выработки на одного работающего в промышленности, закономерность неуклонного роста уровня благосостояния населения проявляется в статистических показателях увеличения средних доходов рабочих и служащих и т.д.
Широкое применение имеют такие описательные характеристики распределения варьирующего признака как мода и медиана. Они являются конкретными характеристиками, их значение имеет какая-либо конкретная варианта в вариационном ряду.
Так, чтобы охарактеризовать наиболее часто встречающуюся величину признака, применяют моду, а чтоб показать количественную границу значения варьирующего признака, которую достигла половина членов совокупности – медиану.
Таким образом, средние величины помогают изучать закономерности развития промышленности, конкретной отрасли, общества и страны в целом.