Главная              Рефераты - Разное

Учебное пособие: Методические указания по выполнению практических и лабораторных работ по статистике содержат требования по их выполнению, порядок расчетов вручную и с использованием ms excel, ппп statistica.

ВВЕДЕНИЕ

Методические указания по выполнению практических и лабораторных работ по статистике содержат требования по их выполнению, порядок расчетов вручную и с использованием MS Excel, ППП Statistica.

Часть II методических указаний характеризует расчет показателей вариации: размаха вариации, квартилей и квартильного отклонения, среднего линейного отклонения, дисперсии и среднего квадратического отклонения, коэффициентов осцилляции, вариации, асимметрии, эксцесса и других.

Расчет показателей вариации наряду с построением интервальных и дискретных вариационных рядов и расчетом средних величин, представленными в части I методических указаний, имеет большое значение для анализа рядов распределения.


1. ПРАКТИЧЕСКАЯ РАБОТА №3

РАСЧЕТ ПОКАЗАТЕЛЕЙ ВАРИАЦИИ

Цель работы: получение практических навыков в расчете различных показателей (меры) вариации в зависимости от поставленных исследованием задач.

Порядок выполнения работы:

1. Определить вид и форму (простая или взвешенная) показателей вариации.

2. Рассчитать показатели степени вариации для сгруппированных и несгруппированных данных и показатели формы распределения.

3. Сформулировать выводы.

Пример расчета показателей вариации

1. Определение вида и формы показателей вариации.

Показатели вариации делятся на две группы: абсолютные и относительные. К абсолютным относятся: размах вариации, квартильное отклонение, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение. Относительными показателями являются коэффициенты осцилляции, вариации, относительное линейное отклонение и т. д.

Размах вариации (R) является наиболее простым измерителем вариации признака и определяется по следующей формуле:

, (1)

где – наибольшее значение варьирующего признака;

– наименьшее значение варьирующего признака.

Квартильное отклонение (Q) – применяется для характеристики вариации признака в совокупности. Может использоваться вместо размаха вариации во избежание недостатков, связанных с использованием крайних значений.

, (2)

где и – соответственно первая и третья квартили распределения.

Квартили – это значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% единиц совокупности будут меньше по величине ; 25% единиц будут заключены между и ; 25% единиц будут заключены между и , и остальные 25% превосходят .

Квартили определяются по формулам:

, (3)

где – нижняя граница интервала, в котором находится первая квартиль;

– сумма накопленных частот интервалов, предшествующих интервалу, в котором находится первая квартиль;

– частота интервала, в котором находится первая квартиль.

, (4)

где Ме – медиана ряда;

, (5)

условные обозначения те же, что и для величины .

В симметричных или умеренно асимметричных распределениях Q»2/3s. Так как на квартильное отклонение не влияют отклонения всех значений признака, то его использование следует ограничить случаями, когда определение среднего квадратического отклонения затруднительно или невозможно.

Среднее линейное отклонение ( ) представляет собой среднюю величину из абсолютных отклонений вариантов признака от их средней. Его можно рассчитать по формуле средней арифметической, как невзвешенной, так и взвешенной, в зависимости от отсутствия или наличия частот в ряду распределения.

(6) - невзвешенное среднее линейное отклонение,

(7) - взвешенное среднее линейное отклонение.

Дисперсия ( ) – средний квадрат отклонений индивидуальных значений признака от их средней величины. Дисперсия вычисляется по формулам простой невзвешенной и взвешенной.

(8) - невзвешенная,

(9) - взвешенная.

Среднее квадратическое отклонение (s) – наиболее распространенный показатель вариации, представляет собой квадратный корень из значения дисперсии.

(10)

Размах вариации, квартильное отклонение, среднее линейное и квадратическое отклонения – величины именованные, имеют размерность осредняемого признака.

Для целей сравнения колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях вычисляются относительные показатели вариации. Базой для сравнения служит средняя арифметическая. Чаще всего относительные показатели выражаются в процентах и характеризуют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности.

Коэффициент осцилляции рассчитывается по формуле:

, (11)

Относительное линейное отклонение (линейный коэффициент вариации):

, (12)

Относительный показатель квартильной вариации:

(13) или (14)

Коэффициент вариации:

, (15)

Наиболее часто применяемый в статистике показатель относительной колеблемости – коэффициент вариации. Его используют не только для сравнительной оценки вариации, но и как характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (Ефимова М.Р., Рябцев В.М. Общая теория статистики: Учебник М.: Финансы и статистика, 1991 г., стр. 105).

Для получения приблизительного представления о форме распределения строят графики распределения (полигон и гистограмму).

В практике статистического исследования приходится встречаться с самыми различными распределениями. При изучении однородных совокупностей имеем дело, как правило, с одновершинными распределениями. Многовершинность свидетельствует о неоднородности изучаемой совокупности, появление двух и более вершин говорит о необходимости перегруппировки данных с целью выделения более однородных групп. Выяснение общего характера распределения предполагает оценку степени его однородности, а также вычисление показателей асимметрии и эксцесса. Симметричным является распределение, в котором частоты любых двух вариантов, равноотстоящих в обе стороны от центра распределения, равны между собой. Для симметричных распределений средняя арифметическая, мода и медиана равны между собой. В связи с этим простейший показатель асимметрии основан на соотношении показателей центра распределения: чем больше разница между средними , тем больше асимметрия ряда.

Для сравнительного анализа степени асимметрии нескольких распределений рассчитывают относительный показатель As:

. (16)

Величина показателя As может быть положительной и отрицательной. Положительная величина показателя указывает на наличие правосторонней асимметрии (правая ветвь относительно максимальной ординаты вытянута больше, чем левая). При правосторонней асимметрии между показателями центра распределения существует соотношение: . Отрицательный знак показателя асимметрии свидетельствует о наличии левосторонней асимметрии (Рисунок 1). Между показателями центра распределения в этом случае имеется такое соотношение: .


Рисунок 1 – Распределение: 1 – с правосторонней асимметрией; 2 – с левосторонней асимметрией.

Другой показатель, предложенный шведским математиком Линдбергом, рассчитывают по формуле:

, (17)

где П – процент тех значений признака, которые превосходят по величине среднюю арифметическую.

Наиболее точным и распространенным является показатель, основанный на определении центрального момента третьего порядка (в симметричном распределении его величина равна нулю):

, (18)

где - центральный момент третьего порядка:

(19) - для несгруппированных данных;

(20) - для сгруппированных данных.

σ – среднеквадратическое отклонение.

Применение этого показателя дает возможность не только определить величину асимметрии, но и ответить на вопрос о наличии или отсутствии асимметрии в распределении признака в генеральной совокупности. Оценка степени существенности этого показателя дается с помощью средней квадратической ошибки, которая зависит от объема наблюдений n и рассчитывается по формуле:

. (21)

Если отношение , асимметрия существенна, и распределение признака в генеральной совокупности не является симметричным. Если отношение , асимметрия несущественна, ее наличие может быть объяснено влиянием различных случайных обстоятельств.

Для симметричных распределений рассчитывается показатель эксцесса (островершинности). Линдбергом предложен следующий показатель для оценки эксцесса:

, (22)

где П – доля (%) количества вариантов, лежащих в интервале, равном половине среднего квадратического отклонения в ту или другую сторону от средней арифметической.

Наиболее точным является показатель, использующий центральный момент четвертого порядка:

, (23)

где - центральный момент четвертого момента;

(24) - для несгруппированных данных;

(25) - для сгруппированных данных.

На рисунке 2 представлены два распределения: одно – островершинное (величина эксцесса положительная), второе – плосковершинное (величина эксцесса отрицательная). Эксцесс представляет собой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения. В нормальном распределении отношение .


Рисунок 2 – Распределение: 1,4 – нормальное; 2 – островершинное; 3 – плосковершинное

Средняя квадратическая ошибка эксцесса рассчитывается по формуле:

, (26)

где n – число наблюдений.

Если , то эксцесс существенен, если , то несущественен.

Оценка существенности показателей асимметрии и эксцесса позволяет сделать вывод о том, можно ли отнести данное эмпирическое исследование к типу кривых нормального распределения.

2. Рассмотрим методику исчисления показателей вариации.

Пример 1.

Таблица 1 - Данные об объеме продаж валюты нескольких отделений Центробанка.

Номер отделения

Объем продаж, млн. руб.

1

10,2

2

15,7

3

24,3

4

17,5

5

16,8

6

19,2

7

15,4

Определить средний объем продаж валюты по совокупности отделений, рассчитать абсолютные и относительные показатели вариации.

Рассчитаем размах вариации:

R = = 24,3 - 10,2 = 14,1 млн. руб.

Для определения отклонений значений признака от средней и их квадратов строим вспомогательную таблицу:

Таблица 2 – Расчетная таблица

Номер отделения

1

10,2

-6,81

46,38

2

15,7

-1,31

1,72

3

24,3

7,29

53,14

4

17,5

0,49

0,24

5

16,8

-0,21

0,04

6

19,2

2,19

4,80

7

15,4

1,61

2,59

Итого

119,1

108,91

Среднее значение находим по формуле средней арифметической простой:

млн. руб.

Среднее линейное отклонение:

млн. руб.

Дисперсия:

Среднее квадратическое отклонение:

млн. руб.

Рассчитаем относительные показатели вариации.

Коэффициент осцилляции:

Относительное линейное отклонение:

Коэффициент вариации:

Для расчета показателей формы распределения строим вспомогательную таблицу:

Таблица 3 – Расчетная таблица

10,2

-6,81

-315,82

2150,743

15,7

-1,31

-2,25

2,945

24,3

7,29

387,42

2824,295

17,5

0,49

0,12

0,058

16,8

-0,21

-0,01

0,002

19,2

2,19

10,50

23,003

15,4

-1,61

-4,17

6,719

75,79

5007,764

Далее рассчитываем показатели асимметрии, эксцесса и их ошибки:

Пример 2.

Таблица 4 - Данные о товарообороте предприятий одной из отраслей промышленности.

Группы предприятий по объему товарооборота

Число предприятий

10-15

3

15-20

7

20-25

10

25-30

18

30-35

22

35-40

12

40-45

5

45-50

3

Итого

80

Определить средний объем товарооборота, структурные средние, абсолютные и относительные показатели вариации и насколько фактическое распределение согласуется с нормальным (по показателям формы распределения).

Для расчета показателей построим вспомогательную таблицу.

Таблица 5 – Расчетная таблица

12,5

3

3

37,5

-17,5

52,5

918,8

-16078,13

281367,2

17,5

7

10

122,5

-12,5

87,5

1093,8

-13671,88

170898,4

22,5

10

20

225,0

-7,5

75,0

562,5

-4218,75

31640,6

27,5

18

38

495,0

-2,5

45,0

112,5

-281,25

703,1

32,5

22

60

715,0

2,5

55,0

137,5

343,75

859,4

37,5

12

72

450,0

7,5

90,0

675,0

5062,50

37968,8

42,5

5

77

212,5

12,5

62,5

781,3

9765,63

122070,3

47,5

3

80

142,5

17,5

52,5

918,8

16078,13

281367,2

Итого

80

2400

520

5200

-3000,00

926875,0

Размах вариации:

млн. руб.

Среднее значение находим по формуле средней арифметической взвешенной:

млн. руб.

В интервальных рядах распределения мода определяется по формуле:

(27)

В нашем случае мода будет равна:

млн. руб.

В интервальном вариационном ряду медиана определяется по формуле:

(28)

В нашем случае медиана будет равна:

млн. руб.

Квартильное отклонение:

млн. руб.

где и – соответственно первая и третья квартили распределения.

Квартили определяются по формулам:

млн. руб.

млн. руб.

млн. руб.

Среднее линейное отклонение:

млн. руб.

Дисперсия:

Среднее квадратическое отклонение:

млн. руб.

Рассчитаем относительные показатели вариации.

Коэффициент осцилляции:

Относительное линейное отклонение:

Относительный показатель квартильной вариации:

Коэффициент вариации:

Определим показатели формы распределения:

3. Формулировка выводов.

Сформулируем выводы по рассчитанным показателям вариации примера 2, в котором представлен интервальный ряд распределения предприятий по объему товарооборота, млн. руб.

Размах вариации свидетельствует о том, что разница между максимальным и минимальным значением составляет 40 млн. руб. Средний объем товарооборота – 30 млн. руб. Чаще всего встречающееся значение объема товарооборота в рассматриваемой совокупности предприятий – 31,4 млн. руб., причем 50% (40 предприятий) имеют объем товарооборота менее 30,5 млн. руб., а 50% свыше.

Квартильное отклонение, равное 5, свидетельствует об умеренной асимметрии распределения, так как в симметричных или умеренно асимметричных распределениях (в рассматриваемом примере ).

Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем колеблется величина признака у единиц исследуемой совокупности. Так, средняя величина колеблемости объема товарооборота предприятий отраслей промышленности составляет: по среднему линейному отклонению - 6,5 млн. руб. (абсолютное отклонение); по среднему квадратическому отклонению - 8,1 млн. руб. Квадрат отклонений индивидуальных значений признака от их средней величины равен 65.

Разница между крайними значениями признака на 33,3% превышает среднее значение ( = 133,3%).

Относительное линейное отклонение ( = 21,7%) и относительный показатель квартильной вариации ( = 16,4%) характеризуют однородность исследуемой совокупности, что подтверждает рассчитанный коэффициент вариации, равный 27% (V =27% меньше 33%).

По рассчитанным показателям асимметрии и эксцесса можно сделать вывод, что распределение плосковершинно (Ex < 0) и наблюдается левосторонняя асимметрия (As < 0). Асимметрия и эксцесс являются несущественными.

2. ЗАДАНИЕ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ

Таблица 6 - Данные о производительности труда 10 рабочих

Произведено продукции одним рабочим за смену, штук

Табельный номер рабочего

1 вариант

2 вариант

3 вариант

4 вариант

5 вариант

6 вариант

1

11

23

43

63

85

59

2

15

27

49

75

96

48

3

18

34

45

81

79

56

4

10

37

47

63

85

39

5

11

37

45

58

90

56

6

14

25

43

63

78

61

7

13

27

45

71

85

59

8

11

37

48

75

76

47

9

9

34

39

71

69

60

10

15

25

51

63

90

54

Рассчитать показатели вариации и показатели формы распределения, сделать соответствующие выводы.

Таблица 7 – Данные о распределении населения по уровню среднедушевых денежных доходов в регионах страны

Среднедушевой денежный доход в месяц, руб.

Численность населения, тыс. чел.

1 вариант

2 вариант

3 вариант

4 вариант

5 вариант

6 вариант

до 800

12,7

10,2

13,1

30,3

15,4

2,3

800-1000

16,7

13,4

18,2

60,7

39,4

16,7

1000-1200

25,1

18,5

29,4

110,5

78,1

24,4

1200-1400

19,4

23,5

20,5

182,5

159,2

430,2

1400-1600

10,5

36,7

17,2

70,6

198,5

10,5

1600-1800

6,5

19,1

10,1

54,8

156,4

6,5

1800-2000

2,7

13,5

5,2

32,1

54,1

6,7

2000 и выше

1,3

4,2

5,1

15,7

24,9

2,7