Расчет показателей вариации
СОДЕРЖАНИЕ: Порядок группировки территорий с определенным уровнем фондовооруженности, расчет доли занятых. Расчёт средних значений каждого показателя с указанием вида и формы использованных средних гармонических, абсолютных и относительных показателей вариации.Задача 1
Приводятся данные по территориям Центрального округа за 2002 год.
Задание:
Необходимо сгруппировать территории с уровнем фондовооруженности «до 240 тыс. руб. и более». В каждой группе рассчитать:
– число территорий;
– долю занятых;
– фондовооружённость.
Оформить в виде таблицы с соблюдением правил. Проанализировать полученные результаты:
№ п/п |
Численность населения на 01.01.00 г., млн. чел. |
Среднегодовая численность занятых в экономике |
Валовой региональный продукт, млрд. руб. |
Основные фонды в экономике, млрд. руб. |
Приходится в среднем стоимости фондов на 1-го занятого в экономике, тыс. руб. |
||
Всего, млн. чел. |
в % к численности населения |
||||||
фондовооруженность менее 240 тыс. руб. |
|||||||
1 |
Орловская |
0,9 |
0,37 |
41,7 |
10,2 |
54,5 |
145,7 |
2 |
Ивановская |
1,2 |
0,48 |
39,3 |
9,1 |
74,2 |
154,9 |
3 |
Владимирская |
1,6 |
0,70 |
43,6 |
16,0 |
115,2 |
164,8 |
4 |
Тульская |
1,7 |
0,77 |
44,0 |
19,1 |
150,3 |
196,5 |
5 |
Калужская |
1,1 |
0,47 |
43,8 |
10,9 |
94,9 |
200,6 |
6 |
Рязанская |
1,3 |
0,52 |
40,5 |
14,2 |
107,3 |
206,3 |
7 |
Московская |
6,4 |
2,33 |
36,1 |
100,6 |
489,3 |
209,9 |
8 |
Брянская |
1,4 |
0,55 |
38,0 |
11,9 |
119,6 |
218,9 |
Итого |
15,6 |
6,19 |
х |
192,0 |
1205,3 |
х |
|
фондовооруженность более 240 тыс. руб. |
|||||||
1 |
Москва |
8,5 |
5,05 |
59,2 |
362,5 |
1222,8 |
242,1 |
2 |
Костромская |
0,8 |
0,33 |
41,6 |
8,9 |
79,1 |
243,4 |
3 |
Смоленская |
1,1 |
0,45 |
39,6 |
12,2 |
112,6 |
251,9 |
4 |
Тверская |
1,6 |
0,63 |
39,6 |
17,7 |
162,7 |
257,8 |
5 |
Ярославская |
1,4 |
0,64 |
45,0 |
22,3 |
167,8 |
264,3 |
Итого |
13,4 |
7,10 |
х |
423,6 |
1745,0 |
х |
В каждой группе рассчитать: – число территорий. В первой группе с фондоовооруженностью менее 240 тыс. руб. число территорий – 8. Во второй группе с фондовооруженностью 240 тыс. руб. и более – 5 территорий.
Доля занятых. В группе с фондовооруженностью менее 240 тыс. руб.
Доля занятых = Сумма среднегодовой численности занятых в экономике / Сумму численности населения по 8-ми территориям*100%. Имеем 6,19/15,6*100%=39,7% чел. – доля занятых в первой группе. 7,10/13,4*100%=53,0% чел. – доля занятых во второй группе
Фондовооруженность – показатель, характеризующий оснащенность работников основными фондами. Фондовооруженность исчисляется путем деления среднегодовой стоимости основных фондов на среднесписочную численность работников. Фондовооруженность = сумма основных фондов в экономике в тыс. руб./ сумма среднегодовой численности занятых в экономике в тыс. чел. Имеем: 1205300000000/6190000=194,7 тыс. руб. – фондовооруженность в первой группе. 1745000000000/7100000=245,8 тыс. руб. – фондовооруженность во второй группе
Вывод: В группе с фондовооруженностью выше 240 тыс. руб. одновременно обнаруживается большая доля занятых человек в общей численности населения
Задача 2
Приводятся сведения по регионам Европейской части России
Задание:
Выполните расчёт средних значений каждого показателя, укажите вид и форму использованных средних. Приведите расчётные формулы. Проверьте правильность результатов.
Регионы |
Численность занятых в экономике |
Среднемесячный душевой доход населения, руб. |
Стоимость валового регионального продукта в среднем на |
||
Всего, млн. чел. |
В% от численности населения |
1-го занятого в экономике, тыс. руб. |
1 руб. стоимости основных фондов в экономике, коп. |
||
Волго-Вятский |
3,59 |
43,2 |
860 |
27,5 |
14,5 |
Центрально-Чернозёмный |
3,15 |
40,5 |
1059 |
27,9 |
12,5 |
Средняя численность занятых в экономике всего – простая, арифметическая.
(3,59 + 3,15) / 2 = 3,37
Средний % от численности населения – взвешенная, геометрическая
(3,59 + 3,15) / (3,59/43,2/100 + 3,15/40,5/100) = 6,74 / (8,31 + 7,77) = 6,74 / 16,08 = 0,419
0,419 или 41,9%
Среднемесячный душевой доход – взвешенная, арифметическая
(860 * 3,59 + 1059 * 3,15) / (3,15 + 3,59) = (3087,4 + 3335,85) / 6,74 = 6423,25 / 6,74 = 953
Средняя стоимость валового регионального продукта на 1 занятого – взвешенная, арифметическая
(27,5*3,59 + 27,9*3,15) / (3,15 + 3,59) = (98,7 + 87,9 ) / 6,74 = 186,6 / 6,74 = 27,7
Средняя стоимость валового регионального продукта на 1 руб. основных фондов – взвешенная, геометрическая
для расчета нужны данные из предыдущего пункта (которые подчеркнуты), это – валовый региональный продукт в миллиардах рублей.
(98,7 + 87,9) / (98,7/14,5 + 87,9/12,5) = 186,6 / (6,8 + 7,0) = 186,6 / 13,8 = 13,5
Задача 3
Приводятся данные за 2002 год о распределении территорий РФ по уровню среднемесячной начисленной заработной платы, тыс. руб.
Выполните расчёт абсолютных и относительных показателей вариации, коэффициент асимметрии и показатель моды, постройте на одном графике гистограмму и полигон распределения частот, выполните анализ полученных результатов.
Группы территорий РФ по уровню среднемесячной начисленной заработной платы, тыс. руб. |
Число территорий в каждой группе |
Среднее значение з/пл. |
Среднее значение зарплаты в каждой группе |
Абсолютное отклонения от средней |
Квадрат отклонения от средней |
Куб отклонения |
||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
[f ] |
[x] |
[х * f ] |
[x – x-ср. ] |
[(x – x-ср. )^2] |
[(x – x-ср. )^3] |
[(x – x-ср. )^2 * f |
[(x – x-ср. )^3 * f ] |
|
От 0,51 до 0,82 |
4 |
0,665 |
2,66 |
-0,565 |
0,3192 |
-0,1804 |
1,2768 |
-0,7216 |
От 0,82 до 1,13 |
28 |
0,975 |
27,30 |
-0,255 |
0,0650 |
-0,0166 |
1,82 |
-0,4648 |
От 1,13 до 1,44 |
19 |
1,285 |
24,42 |
+0,055 |
0,0030 |
0,0002 |
0,057 |
0,0038 |
От 1,44 до 1,74 |
11 |
1,59 |
17,49 |
+0,360 |
0,1296 |
0,0466 |
1,4256 |
0,5126 |
От 1,74 до 2,05 |
7 |
1,895 |
13,27 |
+0,665 |
0,4422 |
0,2941 |
3,0954 |
2,0587 |
Итого: |
69 |
Х |
85,14 |
Х |
Х |
Х |
7,6748 |
1,3887 |
Х ср = 1,23.
Дисперсия = 7,6748/69=0,111
Среднее квадратическое отклонение или СКО = 0,333
Ассиметрия – 0,5447
Для расчёта показателей вариации, предварительно требуется дополнить таблицу столбцами с результатами промежуточных расчетов (первые два столбца как в задании).
Среднее значение зарплаты в группе – середина интервала данной группы.
Среднее (оценка среднего, выборочное среднее) – сумма значений переменной, деленная на n (число значений переменной). Если вы имеете значения Х(1),…, X(N), то формула для выборочного среднего имеет вид:
`х =
Средняя арифметическая – одна из основных числовых характеристик вариационного ряда. (х)
– простая х = хi / n
– взвешенная х = хi fi / fi, где хi – отдельные значения признака;
fi – статистический вес
Статистический вес отражает то общее, что характерно для всех единиц совокупности. В задании рассчитывается средняя арифметическая взвешенная, где вес представлен абсолютными величинами. Сначала перейдем от интервального ряда к дискретному, используя при этом их среднее значение вместо интервальных: i ср. = (i min + i max) / 2
Для первого интервала: (0,82 + 0,51)/2 = 0,665; второго: (1,13 + 0,82)/2 = 0,975; третьего: (1,44 + 1,13) = 1,285; четвертого: (1,74 +1,44) = 1,59; пятого: (2,05 + 1,74)/2 = 1,895
Первый показатель, который рассчитывается – средняя. В данном случае мы рассчитываем взвешенную арифметическую среднюю, среднюю из значений з/п (столбец 3, который в свою очередь есть способ представления данных из столбца 1) взвешенных на количество регионов, попавших в данный интервал заработных плат (столбец 2).
В столбце 4 как раз и показаны произведения з/п на количество регионов: 0,665*4 = 2,66; 0,975*28 = 27,3; 1,285*19 = 24,415; 1,59*11 = 17,49; 1,875*7 = 13,265.
Сумма по этому столбцу поделенная на общее количество регионов – 69 – и будет средней: 85,14/69 = 1,23
Средняя арифметическая равна:
(((0,82 + 0,51)/2)*4+((1,13 + 0,82)/2 *28 + ((1,44 + 1,13)/2*19 + ((1,74 +1,44)/2*11 + ((2,05 + 1,74)/2*7)/69= 1,23
Х ср = 1,23.
Столбец 5 – промежуточный, из него будут браться значения для последующих расчетов.
Для расчета показателя «дисперсия» строится столбец 6 и столбец 8.
Выборочное среднее является той точкой, сумма отклонений наблюдений от которой равна 0. Формально это записывается следующим образом: (`х – х1) + (`х – х2) +… + (`х – хn) =0.
Для оценки степени разброса (отклонения) какого-то показателя от его среднего значения, наряду с максимальным и минимальным значениями, используются понятия дисперсии и стандартного отклонения.
Дисперсия выборки или выборочная дисперсия (от английского variance) – это мера изменчивости переменной. Термин впервые введен Фишером в 1918 году. Выборочная дисперсия вычисляется по формуле:
s2 =
где `х – выборочное среднее,
N – число наблюдений в выборке.
Дисперсия меняется от нуля до бесконечности. Крайнее значение 0 означает отсутствие изменчивости, когда значения переменной постоянны.
Стандартное отклонение, среднее квадратическое отклонение (от английского standard deviation) вычисляется как корень квадратный из дисперсии. Чем выше дисперсия или стандартное отклонение, тем сильнее разбросаны значения переменной относительно среднего.
Дисперсия показывает, как сильно фактические значения колеблются вокруг среднего значения. Дисперсия вычисляется как сумма квадратов отклонений фактических значений от средней, взвешенных на число регионов данной группы.
В столбце 6 строятся сами квадраты отклонений, а в столбце 8 – взвешенные квадраты отклонений. Делением суммы взвешенных квадратов отклонений на количество регионов получаем саму дисперсию: 7,6748/69=0,111.
Корень из дисперсии тоже является одним из абсолютных показателей вариации – среднее квадратическое отклонение или СКО = 0,333.
Для вычисления асимметрии используются столбец 7 и столбец 9. Асимметрия показывает насколько фактический ряд распределения смещен в сторону своих больших или малых значений относительно распределения по нормальному закону.
Ассиметрия – это свойство распределения выборки, которое характеризует несимметричность распределения СВ. На практике симметричные распределения встречаются редко и чтобы выявить и оценить степень асимметрии, вводят следующую меру:
Асимметрия бывает положительной и отрицательной. Положительная сдвигается влево, а отрицательная – вправо.
Ассимметрия находится как сумма кубов отклонений фактического значения от средней, взвешенных на количество регионов, и дополнительно поделенных на куб среднего квадратического отклонения.
1,3887/69=0,0201 – сумма кубов отклонений фактического значения от средней, взвешенных на количество регионов.
0,333^3=0,0369; – куб среднего квадратического отклонения
0,0201/0,0369=0,5447 – ассиметрия.
Мода представляет собой максимально часто встречающееся значение переменной (иными словами, наиболее «модное» значение переменной), например, популярная передача на телевидении, модный цвет платья или марка автомобиля и т.д., Сложность в том, что редкая совокупность имеет единственную моду. (Например: 2, 6, 6, 8, 9, 9, 9, 10 – мода = 9).
Если распределение имеет несколько мод, то говорят, что оно мультимодально или многомодально (имеет два или более «пика»).
Мода – показатель указывающий на наиболее часто встречающийся в ряде распределения вариант. В случае, когда ряд имеет интервальное распределение (как в этой задаче), моду нужно высчитывать по спец форме. Для этого берется интервал с наибольшим количеством регионов, у нас это – 0,82–1,13. Для вычисления моды нам нужны значения: нижняя граница модального (самого многочисленного по регионам) интервала – 0,82; количество регионов в модальном интервале – 28; количество регионов в домодальном и послемодальном интервалах – 4 и 19 соответственно; величина модального интервала (здесь под величиной понимается не количество регионов, а разница между нижней и верхней границей интервала) – 0,31. Мода рассчитывается как нижняя граница, плюс величина модального интервала умноженная на дробь, где в числителе – разница между количеством регионов модального и домодального интервалов, а в знаменателе – сумма из разниц количества регионов модального и домодального, модального и послемодального интервалов.
Мо = 0,82 + 0,31*[(28 – 4) / ((28 – 4) + (28 – 19))] = 0,82 + 0,31*[24 / 33] = 0,82 + 0,31*0,7272 = 0,82 + 0,225 = 1,045
Все выше перечисленное – абсолютные показатели вариации.
К абсолютным показателям вариации относятся размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, дисперсия и среднее квадратическое отклонение.
Относительные показатели вариации – это коэффициенты осцилляции, вариации, относительное линейное отклонение и др.
К относительным показателям вариации относятся: относительный размах вариации (или коэффициент осцилляции – R); коэффициент вариации, и др.
Коэффициент осцилляции высчитывается как разница между максимальным и минимальным значением ряда, поделенная на среднее значение. При интервальном распределении берутся середины крайних интервалов: (1,895 – 0,665) / 1,236 * 100% = 99,5%
Коэффициент вариации рассчитывается как отношение СКО к среднему значению: 0,333 / 1,236 * 100% = 26,9%
Мода и медиана могут быть определены графически: мода – по гистограмме, а медиана – по кумуляте.
Построим гистограмму распределения числа территорий по каждой группе по размерам заработной платы, для чего по оси х – размеры заработной платы, по оси у – число территорий
В прямоугольнике, имеющем наибольшую высоту, проводим две линии и из точки пересечения опускаем перпендикуляр на ось х. Значение х на оси абсцисс в этой точке есть мода (М0).
Для графического изображения медианы по накопленным частотам строим кумуляту. Для этого из верхней границы каждого интервала на оси абсцисс восстанавливаем перпендикуляр, соответствующий по высоте накопленной частоте с начала ряда по данный интервал. Соединив последовательно вершины перпендикуляров, получим кривую, называемую кумулятой. Из точки на оси ординат, соответствующей половине всех частот (порядковому номеру медианы), проводим прямую, параллельную оси абсцисс, до пересечения её с кумулятой. Опустив из этой точки перпендикуляр на ось абсцисс, находим значение медианы (Ме).
|
Пользуясь кумулятой, можно определить значение признака у любой единицы ранжированного ряда.
Задача 4
Структура социальных выплат в 2002 году в федеральных округах РФ (в процентах от общей суммы социальных выплат).
№ |
Виды социальных выплат |
Федеральные округа |
|
Уральский |
Южный |
||
1 |
Пенсии |
67,3 |
81,4 |
2 |
Пособия |
23,1 |
16,1 |
3 |
Стипендии |
1,0 |
1,1 |
4 |
Страховые возмещения |
8,0 |
0,7 |
5 |
Прочие выплаты |
0,6 |
0,7 |
Итого |
100,0 |
100,0 |
Задание:
Проанализируйте особенности структур, используя оценочные показатели различий структуры.
Задача на изучение различий в структуре, насколько распределение в одном регионе отличается от распределения в другом.
Простейший показатель структурных различий – Среднее абсолютное изменение. Рассчитывается он путём сложения разниц по каждой строке по модулю: | 67,3 – 81,4 | + | 23,1 – 16,1 | + | 1,0 – 1,1 | + | 8,0 – 0,7 | + | 0,6 – 0,7 | = 28,6
Показывает он накопленные отклонения по всему сравниваемому ряду. В данном случае по всем строкам суммарное отклонение составило 28,6 процентных пункта (в первой строке отклонение – 14,1; во второй – 7,0; в третьей – 0,1; в четвёртой – 7,3; в пятой – 0,1; а всего – 28,6).
Так как сумма модулей отклонений может быть не больше двух, то, поделив Среднее абсолютное отклонение на 2 можно получить показатель Интенсивности абсолютного отклонения: 28,6 / 2 = 14,3 процентных пункта. Этот показатель уже можно проинтерпретировать – различие между распределением выплат по двум федеральным округам составило 14,3% от предельно возможного (если структуры идентичны, то было бы 0%, если бы структуры были абсолютно отличные – 100%).
Вместе с модульным показателем используют ещё и показатель Квадратического отклонения.
Получается он суммированием квадратов отклонений по каждой строке, делением на количество элементов структуры (строк) и извлечением из этого квадратного корня.
Корень [(67,3 – 81,4) + (23,1 – 16,1) + (1,0 – 1,1) + (8,0 – 0,7) + (0,6 – 0,7)] / 5 = Корень [198,81 + 49 + 0,01 + 53,29 + 0,01] / 5 = Корень [301,12 / 5] = 7,77 процентных пункта.
Для этого показателя так же можно рассчитать интенсивность. Максимальное значение Квадратического отклонения для двух рядов с пятью строками это корень из соотношения 2 / 5, который равен 0,632. Если поделить показатель Квадратического отклонения на это максимальное значение получим сколько процентных пунктов наше Квадратическое отклонение составляет от предельно возможного: 7,77 / 0, 632 = 12,3% от предельно возможного.
Задача 5
Имеются фактические данные государственной статистики о системе детских оздоровительных учреждений.
Задание:
1. Определите недостающий признак-фактор и рассчитайте его отчётные и базисные значения.
2. Рассчитайте общие индексы: а) числа учреждений; б) численности отдохнувших в них детей; в) индекс недостающего признака-фактора. Представьте результаты в системе взаимосвязанных индексов.
Виды детских оздоровительных учреждений |
Число детских оздоровительных учреждений, тыс. |
Численность детей, отдохнувших в них за лето, тыс. чел. |
Численность детей, отдохнувших в среднем на одно учреждение |
Индекс числа учреждений |
Индекс численности отдохнувших людей |
Индекс в среднем на одно учреждение |
|||
1996 |
2002 |
1996 |
2002 |
1996 (гр3/гр1) |
2002 (гр4/гр2) |
1996 (гр2/гр1) |
2002 (гр4/гр3) |
(гр6/гр5) |
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
|
Загородные |
3,1 |
3,3 |
1774,1 |
2185,0 |
572,3 |
662,1 |
1,06 |
1,23 |
1,16 |
Санаторного типа |
0,4 |
0,5 |
123,7 |
183,9 |
309,3 |
367,8 |
1,25 |
1,49 |
1,19 |
Для школьников с дневным пребыванием |
25,6 |
32,9 |
1933,8 |
2772,0 |
75,5 |
84,3 |
1,29 |
1,43 |
1,12 |
Профильные |
3,4 |
4,5 |
327,6 |
446,3 |
96,4 |
99,2 |
1,32 |
1,36 |
1,03 |
Труда и отдыха |
7,5 |
8,0 |
646,7 |
583,4 |
86,2 |
72,9 |
1,07 |
0,90 |
0,85 |
Итого |
- |
- |
4805,9 |
6171,6 |
Недостающим признаком-фактором в данной задаче является численность детей, отдохнувших в среднем на одно учреждение, которое мы рассчитаем
Список литературы
1. Экономическая статистика / под редакцией Ю.Н. Иванова. – М., Инфра-М, 2002 год.
2. Практикум по общей статистики – М. Финансы и статистика 2005 год
3. Общая теория статистики – финансы и статистика 2006 год
4. Общая теория статистики: Статистическая методология в коммерческой деятельности: учебник для вузов / Под ред. А.С. Спирина и О.Е. Башиной. – М.: Финансы и статистика
5. Экономическая статистика. учебник. Под ред. Иванова Ю.Н. Москва: ИНФРА-М, 2004.