2. Статистический анализ экономических данных в STATISTICA
2.1 Практическое задание 1. Корреляционно-регрессионный анализ в STATISTICA
№
Город
y
х1
х2
х3
х4
x5
x6
x7
1
Москва
14
101,03
35
0,4
15780
2,01
0,22
13002
2
Санкт-Петербург
14,02
98,54
36
0,42
14760
1,86
0,25
10145,6
3
Нижний-Новгород
7,03
49
17
1,83
630
0,95
0,5
5040,9
4
Ульяновск
7,01
50
17
1,85
633
0,93
0,52
5027,39
5
Пенза
8,21
57,42
19
1,43
752
1,08
0,44
5903,3
6
Самара
10
70
24
1,01
920
1,33
0,35
7100
7
Чебоксары
9,02
61,03
22
1,23
830
1,19
0,39
6494,6
8
Саранск
11
78,09
26
0,82
1028
1,44
0,37
7500
9
Челябинск
9,05
63,31
28
1,2
804
1,2
0,38
6516,5
10
Тольятти
11
77,05
29
0,81
1028
1,46
0,32
7940
11
Волгоград
12
84,03
27
0,64
1126
1,6
0,29
8900
12
Рязань
12
83
29
0,66
1127
1,59
0,25
8668
13
Красноярск
12
84
30
0,68
1096
1,59
0,29
8670,91
14
Тула
7,26
50,81
17
1,75
657
0,96
0,49
5209,8
15
Казань
7,01
55,01
16
1,85
631
0,93
0,51
5027,3
Вариант
Независимые переменные
Задания по прогнозированию
Как изменится производительность труда на московском предприятии, если
0
х1
среднегодовую численность рабочих сократить на 780 человек, а коэффициент сменности оборудования повысить до 3?
1
х1
среднегодовую стоимость основных фондов увеличить на 80 тыс. руб., а и трудоемкость единицы продукции на 0,6?
2
х3
трудоемкость единицы продукции сократить в 4 раза, а коэффициент сменности оборудования снизить в 2 раза?
3
х1
среднегодовую стоимость основных фондов увеличить на 60 тыс. руб., а коэффициент сменности оборудования – на 0,9?
4
х1
среднегодовую стоимость основных фондов сократить до 90 тыс. руб., а удельный вес потерь от брака понизить в 2 раза?
5
х1
среднегодовую стоимость основных фондов сократить до 95 тыс. руб., а трудоемкость единицы продукции понизить на 0,1?
6
х1
коэффициент сменности оборудования увеличить в 2 раза, а среднегодовой фонд заработной платы уменьшить на 92 тыс. руб.?
7
х4
коэффициент сменности оборудования уменьшить в 2 раза, а среднегодовой фонд заработной платы увеличить на 92 тыс. руб.
8
х2
коэффициент сменности оборудования увеличить на 1,5, а среднегодовой фонд заработной платы уменьшить на 32 тыс. руб.?
9
х1
коэффициент сменности оборудования уменьшить на 1,5, а среднегодовой фонд заработной платы увеличить на 32 тыс. руб.?
Критерий Фишера
Использование уровня
Использование коэффициента детерминации R2
Проверяется нулевая гипотеза H0
является статистически значимой.
Если рассчитанное в Statistica значение уровня значимости р
Рассчитанная системой Statistica величина
, то с упомянутой степенью вероятности (95 %) можно утверждать, что анализируемая регрессия является значимой.
Использование t-критерия Стьюдента
Использование
Анализируемый коэффициент а0
).
Коэффициент регрессии а0
меньше (или равно) 0,05 (для 95%-ной доверительной вероятности).
Двадцать банков, акции которых котируются на рынке, предоставили следующую информацию (см. табл.), где – x
затраты за прошлый период, y
– прибыль за прошлый период.
Необходимо:
1) дополнить таблицу до 20 значений. Данные можно не просто придумать, а взять из любых примеров деятельности банков того или иного города, приведенных в книгах по статистике, эконометрике, СМИ, Internet или любых иных источников.
2) построить график по исходным данным (Scatterplot)
3) c использованием системы STATISTICA выяснить (дать рекомендацию) акции каких банков некоторому предприятию имеет смысл приобрести, каких – придержать, а от каких – избавиться.
Таблица
Номер
банка
Затраты
x
Прибыль
y
1
4
2
2
6
10
3
5
7
4
12
3
5
17
4
6
3
10
7
6
1
8
6
3
9
15
1
10
15
4
11
5
4
12
3
8
13
13
5
14
15
3
15
5
9
Порядок выполнения задания
Кластерный анализ
– один из методов статистического многомерного анализа, предназначенный для группировки (кластеризации) совокупности элементов, которые характеризуются многими факторами, и получения однородных групп (кластеров). Задача кластерного анализа состоит в представлении исходной информации об элементах в сжатом виде без ее существенной потери.
STATISTICA предлагает несколько методов кластерного анализа. В дальнейшем будем использовать Joining
(tree clustering
) – группу иерархических методов (7 видов), которые используются в том случае, если число кластеров заранее неизвестно.
Используемый метод – Ward’s method
– метод Уорда, который хорошо работает с небольшим количеством элементов и нацелен на выбор кластеров с примерно одинаковым количеством членов. В качестве метрики расстояния пакет предлагает различные меры, но наиболее употребительными являются Euclidean distance
(евклидово расстояние). При кластеризации элементов в пакете STATISTICAследует выбирать режим: cases (rows) – строки, а при кластеризации факторов: variables (columns) – столбцы. В качестве переменных для рассматриваемого примере следует выбрать все переменные (all).