Регрессионный анализ
Задача
Некоторая фирма занимается поставками различных грузов на короткие расстояния внутри города. Необходимо оценить стоимость таких услуг, зависящую от затрачиваемого на поставку времени. В качестве наиболее важного фактора, влияющего на время доставки, выбрано пройденное расстояние. Были собраны исходные данные о десяти поставках (табл.).
Расстояние, км
|
3,5
|
2,4
|
4,9
|
4,2
|
3,0
|
1,3
|
1,0
|
3,0
|
1,5
|
4,1
|
Время, мин
|
16
|
13
|
19
|
18
|
12
|
11
|
8
|
14
|
9
|
16
|
Постройте график исходных данных, определите по нему характер зависимости между расстоянием и потраченным временем, постройте уравнение регрессии, проанализируйте силу регрессионной связи и сделайте прогноз поездки на 2 км.
Решение
Для расчёта стоимости услуг, зависящих от затрачиваемого на поставку времени, вычислим суммы (рис. 1):
t
|
y(t)
|
|
|
|
|
|
|
|
|
1
|
3,50
|
16,00
|
12,25
|
56,00
|
256,00
|
15,22
|
2,63
|
2
|
2,40
|
13,00
|
5,76
|
31,20
|
169,00
|
12,30
|
1,70
|
3
|
4,90
|
19,00
|
24,01
|
93,10
|
361,00
|
18,95
|
28,58
|
4
|
4,20
|
18,00
|
17,64
|
75,60
|
324,00
|
17,08
|
12,14
|
5
|
3,00
|
12,00
|
9,00
|
36,00
|
144,00
|
13,89
|
0,09
|
6
|
1,30
|
11,00
|
1,69
|
14,30
|
121,00
|
9,37
|
17,88
|
7
|
1,00
|
8,00
|
1,00
|
8,00
|
64,00
|
8,57
|
25,27
|
8
|
3,00
|
14,00
|
9,00
|
42,00
|
196,00
|
13,89
|
0,09
|
9
|
1,50
|
9,00
|
2,25
|
13,50
|
81,00
|
9,90
|
13,67
|
10
|
4,10
|
16,00
|
16,81
|
65,60
|
256,00
|
16,82
|
10,36
|
сумма
|
|
|
|
|
|
|
|
13,60
|
a1 =
|
2,66
|
a0 =
|
5,91
|
r2 =
|
0,92
|
91,83%
|
8,17
|
Рис .1 - График исходных данных
Вывод: существует сильная связь между исходными данными.
Задача
В таблице приведены данные по объемам собранного урожая овощей из тепличного хозяйства за последний год (по месяцам), а также данные о затраченной электроэнергии, воде и удобрениях.
Месяц
|
Объем собранного урожая
|
Факторы, влияющие на урожай
|
Электроэнергия, кВт
|
Удобрения, тонн
|
Вода, литр
|
t
|
y
|
x
1
|
x
2
|
x
3
|
январь
|
140
|
165
|
138
|
134
|
февраль
|
138
|
164
|
139
|
128
|
март
|
158
|
158
|
157
|
168
|
апрель
|
144
|
159
|
142
|
147
|
май
|
142
|
148
|
144
|
146
|
июнь
|
134
|
152
|
136
|
140
|
июль
|
122
|
143
|
122,5
|
132
|
август
|
125
|
146
|
128
|
135
|
сентябрь
|
124
|
148
|
119
|
125
|
октябрь
|
138
|
150
|
142
|
126
|
ноябрь
|
157
|
156
|
159
|
143
|
декабрь
|
161
|
160
|
164
|
150
|
Необходимо определить степень влияния каждого отдельного фактора на результат (объем урожая). Для этого необходимо построить графики исходных данных, построить уравнения регрессии, проанализировать силу регрессионной связи (по коэффициенту детерминации) и сделать прогноз урожая по двум-трем значениям (в пределах прогноза исходных данных).
Решение
Строим графики исходных данных (рис. 2, 3):
Рис. 2 - График зависимости урожая от удобрения
Рис. 3 - График зависимости урожая от воды
Численные коэффициенты функции регрессии для первой зависимости:
Численные коэффициенты функции регрессии
X1
i
|
Y
i
|
X1
i
І
|
X1
i
Y
i
|
Y
i
І
|
Y
i
p
|
(Y
i
p
-y)І
|
(Y
i
-y)І
|
165
|
140
|
27225
|
23100
|
19600
|
152,5778
|
151,9747
|
0,0625
|
164
|
138
|
26896
|
22632
|
19044
|
151,4485
|
125,4073
|
5,0625
|
158
|
158
|
24964
|
24964
|
24964
|
144,673
|
19,56251
|
315,0625
|
159
|
144
|
25281
|
22896
|
20736
|
145,8022
|
30,82711
|
14,0625
|
148
|
142
|
21904
|
21016
|
20164
|
133,3803
|
47,19267
|
3,0625
|
152
|
134
|
23104
|
20368
|
17956
|
137,8974
|
5,534888
|
39,0625
|
143
|
122
|
20449
|
17446
|
14884
|
127,734
|
156,6506
|
333,0625
|
146
|
125
|
21316
|
18250
|
15625
|
131,1218
|
83,32442
|
232,5625
|
148
|
124
|
21904
|
18352
|
15376
|
133,3803
|
47,19267
|
264,0625
|
150
|
138
|
22500
|
20700
|
19044
|
135,6388
|
21,26283
|
5,0625
|
156
|
157
|
24336
|
24492
|
24649
|
142,4144
|
4,684729
|
280,5625
|
160
|
161
|
25600
|
25760
|
25921
|
146,9315
|
44,64219
|
430,5625
|
1849
|
1683
|
285479
|
259976
|
237963
|
738,2566
|
1922,25
|
Среднее значение
|
140,25
|
Коэффициент детерминации r2
=0,384059.
Коэффициент детерминации низкий поэтому модель не адекватна.
Численные коэффициенты функции регрессии для первой зависимости, представляем расчеты виде таблицы:
Численные коэффициенты функции регрессии
X2
i
|
Y
i
|
X2
i
І
|
X2
i
Y
i
|
Y
i
І
|
Y
i
p
|
(Y
i
p
-y)І
|
(Y
i
-y)І
|
138
|
140
|
19044
|
19320
|
19600
|
137,5802
|
7,127725
|
0,0625
|
139
|
138
|
19321
|
19182
|
19044
|
138,5088
|
3,031641
|
5,0625
|
157
|
158
|
24649
|
24806
|
24964
|
155,224
|
224,2202
|
315,0625
|
142
|
144
|
20164
|
20448
|
20736
|
141,2947
|
1,091391
|
14,0625
|
144
|
142
|
20736
|
20448
|
20164
|
143,1519
|
8,421225
|
3,0625
|
136
|
134
|
18496
|
18224
|
17956
|
135,723
|
20,49389
|
39,0625
|
122,5
|
122
|
15006,25
|
14945
|
14884
|
123,1866
|
291,1588
|
333,0625
|
128
|
125
|
16384
|
16000
|
15625
|
128,294
|
142,9452
|
232,5625
|
119
|
124
|
14161
|
14756
|
15376
|
119,9365
|
412,64
|
264,0625
|
142
|
138
|
20164
|
19596
|
19044
|
141,2947
|
1,091391
|
5,0625
|
159
|
157
|
25281
|
24963
|
24649
|
157,0812
|
283,29
|
280,5625
|
164
|
161
|
26896
|
26404
|
25921
|
161,7243
|
461,1463
|
430,5625
|
1690,5
|
1683
|
240302,3
|
239092
|
237963
|
1856,658
|
1922,25
|
Среднее значение
|
140,25
|
Коэффициенты регрессии — сдвиг а0
и наклон а1
прямой у:
a0=
|
9,430782
|
a1=
|
0,928619
|
Коэффициент детерминации r2
=0,965877.
Коэффициент детерминации высокий, поэтому модель адекватна и можно делать прогноз.
Прогноз на три шага вперед y13=120.9, y14=154.3, y15=142.2.
Численные коэффициенты функции регрессии для первой зависимости, представляем расчеты виде таблицы:
Численные коэффициенты функции регрессии
X
3i
|
Y
i
|
X
3i
І
|
X
3i
Y
i
|
Y
i
І
|
Y
i
p
|
(Y
i
p
-y)І
|
(Y
i
-y)І
|
134
|
140
|
17956
|
18760
|
19600
|
135,8979
|
18,94079
|
0,0625
|
128
|
138
|
16384
|
17664
|
19044
|
131,1502
|
82,80727
|
5,0625
|
168
|
158
|
28224
|
26544
|
24964
|
162,8018
|
508,5838
|
315,0625
|
147
|
144
|
21609
|
21168
|
20736
|
146,1847
|
35,22048
|
14,0625
|
146
|
142
|
21316
|
20732
|
20164
|
145,3934
|
26,4545
|
3,0625
|
140
|
134
|
19600
|
18760
|
17956
|
140,6456
|
0,156535
|
39,0625
|
132
|
122
|
17424
|
16104
|
14884
|
134,3153
|
35,22048
|
333,0625
|
135
|
125
|
18225
|
16875
|
15625
|
136,6892
|
12,67937
|
232,5625
|
125
|
124
|
15625
|
15500
|
15376
|
128,7763
|
131,6463
|
264,0625
|
126
|
138
|
15876
|
17388
|
19044
|
129,5676
|
114,1144
|
5,0625
|
143
|
157
|
20449
|
22451
|
24649
|
143,0195
|
7,670238
|
280,5625
|
150
|
161
|
22500
|
24150
|
25921
|
148,5586
|
69,03215
|
430,5625
|
1674
|
1683
|
235188
|
236096
|
237963
|
1042,526
|
1922,25
|
Среднее значение
|
140,25
|
Коэффициенты регрессии — сдвиг а0
и наклон а1
прямой у:
a0=
|
29,86486
|
a1=
|
0,791291
|
Коэффициент детерминации r2
=0,542347.
Коэффициент детерминации низкий, поэтому модель не адекватна.
Задача
Санаторный комплекс ежегодно заключает с пекарней договор на выпечку хлеба сорта С1
. Чтобы полностью использовать свои производственные мощности пекарня также выпекает хлеб сорта С2
, который пускает в свободную продажу. В таблице приведены данные выпуска хлеба (тыс. шт.) пекарней за последний год
Месяц
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
11
|
12
|
С1
|
1
|
2,3
|
1,5
|
0,5
|
4
|
5
|
2
|
3,5
|
1
|
4,5
|
2,5
|
1,5
|
С2
|
9
|
6,5
|
8,1
|
8,7
|
4
|
0,2
|
7,6
|
5
|
8,7
|
2
|
7
|
8,4
|
Проанализируйте график исходных данных и постройте регрессионную модель функции производственных возможностей пекарни. Проверьте удовлетворительность модели и сделайте прогноз выпуска хлеба С2
, если санаторный комплекс сделает заказ хлеба С1
3 тысячи булок.
Решение
Рис. 4 - График исходных данных
Суммы, необходимые для расчета коэффициентов линейной регрессии и коэффициента детерминации вычислим с помощью таблицы, учитывая данные зависимости объема собранного урожая от количества электроэнергии.
x
|
y
|
x2
|
xy
|
yp
|
(yp
-ycp
)2
|
(y-ycp
)2
|
1
|
9
|
1
|
9
|
8.981453
|
7.370065
|
7.471111
|
2.3
|
6.5
|
5.29
|
14.95
|
6.533438
|
0.071167
|
0.054444
|
1.5
|
8.1
|
2.25
|
12.15
|
8.039909
|
3.144387
|
3.361111
|
0.5
|
8.7
|
0.25
|
4.35
|
9.922997
|
13.36875
|
5.921111
|
4
|
4
|
16
|
16
|
3.332187
|
8.611173
|
5.137778
|
5
|
0.2
|
25
|
1
|
1.449098
|
23.20897
|
36.80444
|
2
|
7.6
|
4
|
15.2
|
7.098364
|
0.691721
|
1.777778
|
3.5
|
5
|
12.25
|
17.5
|
4.273731
|
3.971792
|
1.604444
|
1
|
8.7
|
1
|
8.7
|
8.981453
|
7.370065
|
5.921111
|
4.5
|
2
|
20.25
|
9
|
2.390642
|
15.02356
|
18.20444
|
2.5
|
7
|
6.25
|
17.5
|
6.15682
|
0.012066
|
0.537778
|
1.5
|
8.4
|
2.25
|
12.6
|
8.039909
|
3.144387
|
4.551111
|
å=29.3
|
å=75.2
|
å=95.79
|
å=137.95
|
å=85.98811
|
å=91.34667
|
Находим коэффициенты регрессии — сдвиг а0
и наклон а1
прямой у:
a0=
|
10,86454
|
a1=
|
-1,88309
|
Коэффициент детерминации r2
=0,941338.
Коэффициент детерминации высокий поэтому модель адекватна и можно делать прогноз.
Если санаторный комплекс сделает заказ хлеба С1
3 тысячи булок, то прогноз С2
=-1,88309*3000+10,86454=5215,7.
Транспортная задача
Задача
Заводы некоторой автомобильной фирмы расположены в городах А, В и С. Основные центры распределения продукции сосредоточены в городах D и E. Объемы производства указанных трех заводов равняются 1000, 1300 и 1200 автомобилей ежеквартально.
Величины квартального спроса в центрах распределения составляют 2300 и 1400 автомобилей соответственно.
Стоимости перевозки автомобилей по железной дороге по каждому из возможных маршрутов приведены в таблице
Стоимость перевозки автомобилей, руб./шт.
D
|
E
|
А
|
80
|
215
|
В
|
100
|
108
|
С
|
102
|
68
|
Постройте математическую модель, позволяющую определить количество автомобилей, перевозимых из каждого завода в каждый центр распределения, таким образом, чтобы общие транспортные расходы были минимальны.
Задаем целевую функцию и ограничения с помощью «Поиска решений»:
;
Получаем:
Стоимость перевозки автомобилей, руб./шт
|
D
|
Е
|
V
|
Издержки
|
А
|
80
|
215
|
1000
|
В
|
100
|
108
|
1300
|
С
|
102
|
68
|
1200
|
Спрос
|
2300
|
1400
|
291600
|
Продукция
|
D
|
Е
|
Сумма
|
А
|
1000
|
0
|
1000
|
В
|
1300
|
0
|
1300
|
С
|
0
|
1200
|
1200
|
Y
|
0
|
200
|
200
|
Сумма
|
2300
|
1400
|
Задача
Постройте транспортную модель для исходных данных задачи 2.1 при условии, что квартальный спрос в пункте распределения D упал до 1900 автомобилей, а выпуск на заводе В увеличился до 1500 автомобилей за квартал.
Решение
Задаем целевую функцию и ограничения с помощью «Поиска решений»:
;
Получаем:
Стоимость перевозки автомобилей, руб./шт
|
D
|
Е
|
F
|
V
|
Издержки
|
А
|
80
|
215
|
0
|
1000
|
В
|
100
|
108
|
0
|
1500
|
С
|
102
|
68
|
0
|
1200
|
Спрос
|
1900
|
1400
|
400
|
273200
|
Продукция
|
D
|
Е
|
F
|
Сумма
|
А
|
1000
|
0
|
0
|
1000
|
В
|
900
|
200
|
400
|
1500
|
С
|
0
|
1200
|
0
|
1200
|
Сумма
|
1900
|
1400
|
400
|
Задача
Три электрогенерирующие станции мощностью 25, 40 и 30 миллионов кВт×ч поставляют электроэнергию в три города. Максимальная потребность в электроэнергии этих городов оценивается в 30, 35 и 24 миллионов кВт×ч. Цены за миллион кВт-ч в данных городах приведены в табл. 4.4.
Стоимость за электроэнергию, руб. /млн. кВтч
Города
|
1
|
2
|
3
|
Станция
|
1
|
600
|
700
|
400
|
2
|
320
|
300
|
350
|
3
|
500
|
480
|
450
|
В августе на 20% возрастает потребность в электроэнергии в каждом из трех городов. Недостаток электроэнергии могут восполнить из другой электросети по цене 1000 за 1 миллион кВт-ч. Но третий город не может подключиться к альтернативной электросети. Электрогенерирующие станции планируют разработать наиболее экономичный план распределения электроэнергии и восполнения ее недостатка в августе. Сформулируйте эту задачу в виде транспортной модели.
Решение
Задаем целевую функцию и ограничения с помощью «Поиска решений»:
;
Получаем:
Стоимость за электроэнергию, руб. /млн. кВтч
|
Города
|
Издержки
|
1
|
2
|
3
|
Мощность
|
Станция
|
1
|
600
|
700
|
400
|
25
|
2
|
320
|
300
|
350
|
40
|
3
|
500
|
480
|
450
|
30
|
4
|
1000
|
1000
|
10000
|
12
|
Потребление
|
36
|
42
|
29
|
48570
|
Города
|
1
|
2
|
3
|
Сумма
|
Станция
|
1
|
0
|
0
|
25
|
25
|
2
|
24
|
16
|
0
|
40
|
3
|
0
|
26
|
4
|
30
|
4
|
12
|
0
|
0
|
12
|
Сумма
|
36
|
42
|
29
|
Задача
Найти тремя методами опорный план ТЗ, в которой запасы на трех складах равны 210, 170, 65 ед. продукции, потребности четырех магазинов равны 125, 90, 130, 100 ед. продукции, тарифы перевозки в рублях за единицу продукции следующие:
Решение
Проверка сбалансированности задачи показывает, что суммарный объем запасов равен суммарному объему потребностей, т.е. введение фиктивных столбцов или строк не потребуется
Результаты нахождения опорного плана различными методами представлены в табл.
Транспортная таблица с опорным планом северо-западного угла
Пункты
отправления,
|
Пункты потребления,
|
Запасы, ед. продукции
|
|
|
|
|
|
125
5
|
85
8
|
1
|
2
|
210/85/0
|
|
2
|
5
5
|
130
4
|
35
9
|
170/165/35/0
|
|
9
|
2
|
3
|
65
1
|
65/0
|
Потребность,
ед. продукции
|
125/0
|
90/5/0
|
130/0
|
100/65/0
|
Опорный план
, найденный методом северо-западного угла
[ед.товара]
Соответствующая ЦФ (общие затраты на перевозку)
[руб.].
Транспортная таблица с опорным планом минимального элемента
Пункты
отправления,
|
Пункты потребления,
|
Запасы, ед. продукции
|
|
|
|
|
|
5
|
45
8
|
130
1
|
35
2
|
210/80/45/0
|
|
125
2
|
45
5
|
4
|
9
|
170/45/0
|
|
9
|
2
|
3
|
65
1
|
65/0
|
Потребность,
ед. продукции
|
125/0
|
90/45/0
|
130/0
|
100/35/0
|
Опорный план
, найденный методом минимального элемента
[ед.товара]
[руб.]
Транспортная таблица с опорным планом Фогеля
|
|
|
|
|
Штрафы строк,
|
|
5
|
8
|
110
1
|
100
2
|
210/110/0
|
1
|
1
|
1
|
7
|
|
125
2
|
25
5
|
20
4
|
9
|
170/45/25/0
|
2
|
1
|
1
|
1
|
|
9
|
65
2
|
3
|
1
|
65/0
|
1
|
1
|
–
|
–
|
|
125/0
|
90/25/0
|
130/20/0
|
100/0
|
Штрафы столбцов,
|
3
|
3
|
2
|
1
|
–
|
3
|
2
|
1
|
–
|
3
|
3
|
7
|
–
|
3
|
3
|
–
|
На первом шаге нахождения опорного плана методом Фогеля возникает ситуация равенства значений максимальных штрафов транспортной матрицы
Минимальные тарифы в этих столбцах также совпадают
.
Поэтому необходимо сравнить суммарные штрафы
клеток (2,1) и (3,2)
;
.
Т.к.
, то выбираем на первом шаге для заполнения клетку (2,1).
Опорный план
[ед.товара],
[руб.]
Задача
Найти тремя методами опорный план ТЗ, в которой запасы на трех складах равны 160, 140, 170 ед. продукции, потребности четырех магазинов равны 120, 50, 200, 110 ед. продукции, тарифы перевозки в рублях за единицу продукции следующие:
Решение
Суммарный объем запасов равен суммарному объему потребностей
Транспортная таблица с опорным планом северо-западного угла
Пункты отправления,
|
Пункты потребления,
|
Запасы, ед. продукции
|
|
|
|
|
|
120
7
|
40
8
|
1
|
2
|
160/40/0
|
|
4
|
10
5
|
130
9
|
8
|
140/130/0
|
|
9
|
2
|
70
3
|
100
6
|
170/100/0
|
фиктивный склад
|
0
|
0
|
0
|
10
0
|
10/0
|
Потребность,
ед. продукции
|
120/0
|
50/10/0
|
200/70/0
|
110/10/0
|
Опорный план
, найденный методом северо-западного угла [ед.товара].
Соответствующая ЦФ (общие затраты на перевозку)
Транспортная таблица с опорным планом минимального элемента
Пункты отправления,
|
Пункты потребления,
|
Запасы, ед. продукции
|
|
|
|
|
|
7
|
8
|
160
1
|
2
|
160/0
|
|
110
4
|
5
|
9
|
30
8
|
140/30/0
|
|
9
|
50
2
|
40
3
|
80
6
|
170/120/80/0
|
фиктивный склад
|
10
0
|
0
|
0
|
0
|
10/0
|
Потребность,
ед. продукции
|
120/110/0
|
50/0
|
200/40/0
|
110/30/0
|
Опорный план
, найденный методом минимального элемента
Транспортная таблица с опорным планом Фогеля
|