Лабораторная - Автоматизированный априорный анализ статистической совокупности в среде MS Excel
Лабораторная - Автоматизированный априорный анализ статистической совокупности в среде MS Excel
Номер предприятия
Среднегодовая стоимость основных производственных фондов, млн.руб.
Выпуск продукции, млн. руб.
1
2
4054,00
3616,00
3
4182,00
4032,00
4
4406,00
4480,00
5
2870,00
2240,00
6
4630,00
3840,00
7
4758,00
5184,00
8
3574,00
3520,00
9
4374,00
4128,00
10
5046,00
5152,00
11
1910,00
4800,00
12
5526,00
5440,00
13
4214,00
4288,00
14
4630,00
4672,00
15
5302,00
5664,00
16
6070,00
6080,00
17
4534,00
4096,00
18
5014,00
4864,00
19
3990,00
3040,00
20
5078,00
4160,00
21
5654,00
5600,00
22
3894,00
3168,00
23
3094,00
2976,00
24
5174,00
4768,00
25
4630,00
4160,00
26
4310,00
3936,00
27
3350,00
2560,00
28
4502,00
4000,00
29
5206,00
4384,00
30
6070,00
1600,00
31
4950,00
4160,00
32
3638,00
3712,00
Обобщающие статистические показатели
Признаки
Среднегодовая стоимость
Выпуск продукции
Средняя арифметическая (
4470,00
4173,87
Мода (Мо), млн. руб.
4630,00
4160,00
Медиана (Ме), млн. руб.
4518,00
4144,00
Размах вариации (R), млн. руб.
3200,
3840,00
Дисперсия (
579106,13
824093,58
Среднее квадратическое отклонение
760,99
907,79
Коэффициент вариации (Vσ
17,02
21,75
Границы диапазонов, млн. руб.
Количество значений xi
Процентное соотношение рассеяния значений xi
Первый признак
Второй признак
Первый признак
Второй признак
Первый признак
Второй признак
А
1
2
3
4
5
6
[3709,01; 5230,99]
[3266,07; 5081,66]
20
19
66,66
63,33
[2948,02; 5991,98]
[2358,27; 5989,46]
28
28
93,33
93,33
[2187,03; 6752,97]
[1450,48; 6897,25]
30
30
100,00
100,00
Обобщающие статистические
Признаки
Среднегодовая стоимость
Выпуск продукции
Стандартное отклонение
774,00
923,32
Дисперсия
599075,31
852510,60
Асимметричность As
-0,15
0,04
Эксцесс Ek
-0,34
-0,21
Доверительная
Коэффи
Предельные ошибки
для первого
для второго
для первого
для второго
0,683
1
143,88
171,64
4326,12
4002,22
0,954
2
294,61
351,44
4175,39
3822,42
Таблица 2
Аномальные единицы наблюдения
Номер предприятия
Среднегодовая стоимость основных производственных фондов, млн.руб.
Выпуск продукции, млн. руб.
11
1910,00
4800,00
30
6070,00
1600,00
Таблица 3
Описательные статистики
По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."
По столбцу "Выпуск продукции, млн.руб"
Столбец1
Столбец2
Среднее
4470
Среднее
4173,866667
Стандартная ошибка
141,3123385
Стандартная ошибка
168,5734857
Медиана
4518
Медиана
4144
Мода
4630
Мода
4160
Стандартное отклонение
774,00
Стандартное отклонение
923,3150071
Дисперсия выборки
599075,3103
Дисперсия выборки
852510,6023
Эксцесс
-0,34
Эксцесс
-0,21
Асимметричность
-0,152503649
Асимметричность
0,042954448
Интервал
3200
Интервал
3840
Минимум
2870
Минимум
2240
Максимум
6070
Максимум
6080
Сумма
134100
Сумма
125216
Счет
30
Счет
30
Уровень надежности(95,4%)
294,6096545
Уровень надежности(95,4%)
351,4440204
Таблица 4
Предельные ошибки выборки
По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."
По столбцу "Выпуск продукции, млн.руб"
Столбец1
Столбец2
Уровень надежности(68,3%)
143,8849956
Уровень надежности(68,3%)
171,6424447
Таблица 5
Выборочные показатели вариации
По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."
По столбцу "Выпуск продукции, млн.руб"
Стандартное отклонение
760,9902321
Стандартное отклонение
907,7960025
Дисперсия
579106,1333
Дисперсия
824093,5822
Коэффициент вариации, %
17,02438998
Коэффициент вариации, %
21,74952089
Таблица 6
Карман
Частота
1
3510
3
4150
5
4790
11
5430
7
6070
3
Таблица 7
Интервальный ряд распределения предприятий по стоимости основных производственных фондов
Группа предприятий по стоимости основных фондов
Число предприятий в группе
Накопленная частость группы.%
2870-3510
4
13,33%
3510-4150
5
30,00%
4150-4790
11
66,67%
4790-5430
7
90,00%
5430-6070
3
100,00%
Итого
30
1. Постановка задачи статистического исследования
Корреляционно-регрессионный анализ взаимосвязи признаков является составной частью проводимого статистического исследования деятельности 30-ти предприятий и частично использует результаты ЛР-1.
В ЛР-2 изучается взаимосвязь между факторным признаком Среднегодовая стоимость основных производственных фондов
(признак Х
) и результативным признаком Выпуск продукции
(признак Y
), значениями которых являются исходные данные ЛР-1 после исключения из них аномальных наблюдений.
Номер предприятия
Среднегодовая стоимость основных производственных фондов, млн.руб.
Выпуск продукции, млн. руб.
1
3446,00
3296,00
2
4054,00
3616,00
3
4182,00
4032,00
4
4406,00
4480,00
5
2870,00
2240,00
6
4630,00
3840,00
7
4758,00
5184,00
8
3574,00
3520,00
9
4374,00
4128,00
10
5046,00
5152,00
12
5526,00
5440,00
13
4214,00
4288,00
14
4630,00
4672,00
15
5302,00
5664,00
16
6070,00
6080,00
17
4534,00
4096,00
18
5014,00
4864,00
19
3990,00
3040,00
20
5078,00
4160,00
21
5654,00
5600,00
22
3894,00
3168,00
23
3094,00
2976,00
24
5174,00
4768,00
25
4630,00
4160,00
26
4310,00
3936,00
27
3350,00
2560,00
28
4502,00
4000,00
29
5206,00
4384,00
31
4950,00
4160,00
32
3638,00
3712,00
В процессе статистического исследования необходимо решить ряд задач.
1. Установить наличие статистической связи
между факторным признаком Х
и результативным признаком Y
графическим методом.
2. Установить наличие корреляционной связи
между признаками Х
и Y
методом аналитической группировки.
3. Оценить тесноту связи признаков Х
и Y
на основе эмпирического корреляционного отношения η
.
4. Построить однофакторную линейную регрессионную модель связи признаков Х
и Y
, используя инструмент Регрессия
надстройки Пакет анализа,
и оценить тесноту связи признаков Х
и Y
на основе линейного коэффициента корреляции r
.
5. Определить адекватность и практическую пригодность построенной линейной регрессионной модели, оценив:
а) значимость и доверительные интервалы коэффициентов а0
, а1
;
б) индекс детерминации R2
и его значимость;
в) точность регрессионной модели.
6. Дать экономическую интерпретацию:
а) коэффициента регрессии а1
;
б) коэффициента эластичности КЭ
;
в) остаточных величин εi
.
7. Найти наиболее адекватное нелинейное уравнение регрессии с помощью средств инструмента Мастер диаграмм
.
2. Выводы по результатам выполнения лабораторной работы[3]
Задача 1
Установление наличия статистической связи
между факторным признаком Х
и результативным признаком Y
графическим методом.
Статистическая связь является разновидностью стохастической (случайной) связи, при которой с изменением факторного признака Xзакономерным
образом изменяется какой–либо из обобщающих статистических показателей распределения результативного признака Y
.
Вывод:
Точечный график связи признаков (диаграмма рассеяния, полученная в ЛР-1 после удаления аномальных наблюдений) позволяет сделать вывод, что имеет (не имеет) место статистическая связь. Предположительный вид связи – линейная (нелинейная) прямая (обратная).
Задача 2
Установление наличия корреляционной связи
между признаками Х
и Y
методом аналитической группировки.
Корреляционная связь – важнейший частный случай стохастической статистической связи, когда под воздействием вариации факторного признака Хзакономерно
изменяются от группы к группе средние групповые значения
результативного признака Y
(усредняются результативные значения
, полученные под воздействием фактора
). Для выявления наличия корреляционной связи используется метод аналитической группировки.
Вывод:
Результаты выполнения аналитической группировки предприятий по факторному признаку Среднегодовая стоимость основных производственных фондов даны в табл. 2.2 Рабочего файла, которая показывает, что с увеличением значений факторного признака Х закономерно (незакономерно) увеличиваются (уменьшаются) средние групповые значения результативного признака . Следовательно, между признаками Х и Y существует корреляционная связь.
Задача 3
Оценка тесноты связи признаков Х
и Y
на основе эмпирического корреляционного отношения.
Для анализа тесноты связи между факторным и результативным признаками рассчитывается показатель η
– эмпирическое корреляционное отношение, задаваемое формулой
,
где
и
- соответственно межгрупповая и общая дисперсии результативного признака Y
- Выпуск продукции
(индекс х
дисперсии
означает, что оценивается мера влияния признака Х
на Y).
Для качественной оценки тесноты связи на основе показателя эмпирического корреляционного отношения служит шкала Чэддока:
Значение η
0,1 – 0,3
0,3 – 0,5
0,5 – 0,7
0,7 – 0,9
0,9 – 0,99
Сила связи
Слабая
Умеренная
Заметная
Тесная
Весьма тесная
Результаты выполненных расчетов представлены в табл. 2.4 Рабочего файла.
Вывод:
Значение коэффициента η =0,9028, что в соответствии с оценочной шкалой Чэддока говорит о весьма тесной степени связи изучаемых признаков.
Задача 4
Построение однофакторной линейной регрессионной модели связи изучаемых признаков с помощью инструмента Регрессия
надстройки Пакет анализа
и оценка тесноты связи на основе линейного коэффициента корреляции r
.
4.1.
Построение регрессионной модели заключается в нахождении аналитического выражения связи между факторным признаком X
и результативным признаком Y.
Инструмент Регрессия
на основе исходных данных (xi, yi
), производит расчет параметров а0
и а1
уравнения однофакторной линейной регрессии
, а также вычисление ряда показателей, необходимых для проверки адекватности построенного уравнения исходным (фактическим) данным.
Примечание. В результате работы инструмента Регрессия
получены четыре результативные таблицы (начиная с заданной ячейки А75
). Эти таблицы выводятся в Рабочий файл без нумерации, поэтому необходимо присвоить им номера табл.2.5 – табл.2.8 в соответствии с их порядком
.
Вывод:
Рассчитанные в табл.2.7 (ячейки В91 и В92) коэффициенты а0 и а1 позволяют построить линейную регрессионную модель связи изучаемых признаков в виде уравнения -695,5510+1,0894х.
4.2.
В случае линейности функции связи для оценки тесноты связи
признаков X
и Y,
устанавливаемой по построенной модели, используется линейный коэффициент корреляции r
.
Значение коэффициента корреляции r
приводится в табл.2.5 в ячейке В78
(термин "МножественныйR
").
Вывод:
Значение коэффициента корреляции r =0,9132, что в соответствии с оценочной шкалой Чэддока говорит о весьма тесной степени связи изучаемых признаков.
Задача 5
Анализ адекватности и практической пригодности построенной линейной регрессионной модели.
Анализ адекватности регрессионной модели преследует цель оценить, насколько построенная теоретическая модель взаимосвязи признаков отражает фактическую зависимость между этими признаками, и тем самым оценить практическую пригодность синтезированной модели связи.
Оценка соответствия построенной регрессионной модели исходным (фактическим) значениям признаков X
и Y
выполняется в 4 этапа:
1) оценка статистической значимости коэффициентов уравнения а0
, а1
и определение их доверительных интервалов для заданного уровня надежности;
2) определение практической пригодности построенной модели на основе оценок линейного коэффициента корреляции r
и индекса детерминации R2
;
3) проверка значимости уравнения регрессии в целом по F
-критерию Фишера;
4) оценка погрешности регрессионной модели.
5.1
Оценка статистической значимости коэффициентов уравнения и определение их доверительных интервалов
Так как коэффициенты уравненияа0
, а1
рассчитывались, исходя из значений признаков только для 30-ти пар (xi, yi
), то полученные значения коэффициентов являются лишь приближенными оценками
фактических параметров связи а0
, а1
. Поэтому необходимо:
1. проверить значения коэффициентов на неслучайность (т.е. узнать, насколько они типичны для всей генеральной совокупности предприятий отрасли);
2. определить (с заданной доверительной вероятностью 0,95
и 0,683
) пределы, в которых могут находиться значения а0
, а1
для генеральной совокупности предприятий.
Для анализа коэффициентов а0
, а1
линейного уравнения регрессии используется табл.2.7, в которой:
– значения коэффициентов а0
, а1
приведены в ячейках В91
и В92
соответственно;
– рассчитанный уровень значимости коэффициентов уравнения приведен в ячейках Е91
и Е92
;
– доверительные интервалы коэффициентов с уровнем надежности Р=0,95
и Р=0,683
указаны в диапазоне ячеек F91:I92
.
5.1.1 Определение значимости коэффициентов уравнения
Уровень значимости – это величина α
=1–Р
, где Р
– заданный уровень надежности (доверительная вероятность).