F(x) =
F(x) =
|
0,2158· (0.7
-x-4,3
), при x≥0,7
|
0, при x<0,7
|
3) Для нахождения математического ожидания воспользуемся формулой:
4) Центральный момент k-ого порядка вычисляется по формуле:
Начальный момент k-ого порядка определяется равенством:
Выразим центральные моменты 3 и 4 порядка через начальные моменты:
μ3
=ν3
- 3ν1
ν2
+ 2ν1
3
μ4= ν4
- 4ν1
ν3
+ 6ν1
2
ν2
- 3ν1
4
Вычислим начальный моменты 2,3,4-го порядков:
Коэффициенты ассиметрии и эксцесса расчитываются по формулам:
Подставляя известные значения получаем:
5) Для определения вероятности воспользуемся формулой для расчета вероятности попадания СВ в интервал:
P(x1≤X)=1-P(X<x1)=1-F(x1)
Подставляя известные значения получаем:
Ответ:
1) значения параметра «а» равно 0.9277.
2) функция распределения имеет вид:
F(x) =
|
0,2158· (0.7
-x-4,3
), при x≥0,7
|
0, при x<0,7
|
3) математическое ожидание Mx
=0,9122, дисперсия Дx
=0,0839, среднее квадратическое отклонение годового дохода равно σ =0,2897.
4) значения третьего и четвертого центральных моментов равно
3
=0,127 и
4
=1,8859 соответственно, коэффициенты ассиметрии и эксцесса равны AS
=5,222 и EC
=264,7405.
5) размер годового дохода Х1
в тыс. у.е., не ниже которого с вероятностью Р окажется годовой доход случайного выбранного налогоплательщика равен 0,8045.
Задание 6
Производится «n
» независимых испытаний, в каждом из которых события А
может появиться с вероятностью Р
.
Требуется
:
1)Определить вероятность того, что событие А
появится при n
– испытаниях равно k
- раз.
2)Определить вероятность того, что событие А
появится при n
– испытаниях более m
- раз.
3)Определить вероятность того, что событие А
появится при n
– испытаниях не менее k
1
- раз, но не более k
2
- раз.
4)Вычислить среднее число появления события А
при n
– испытаниях и среднее квадратическое отклонение числа появлений события А
.
5)Определить с какой вероятностью должно появляться события А
в каждом из «n
» - опытов при условии, что вероятность не появления события А
ни в одном из «n
» - опытов равна Р0
.
Дано:
n=10; k=4; P=0.6; m=2; k1
=3; k2
=6; P0
=0.3; q=0.4
Найти:
1) Р(m=3)-?
2) Р(m>1)-?
3) Р(2≤m≤5)-?
4) m
x
-?;
-?
5) Р1
(А)-?
Решение:
Поскольку испытания независимы и р=const, то используем схему Бернулли. Обозначим Х число испытаний в которых событие А наступило. Х={1,2,..10}
X принадлежит биномиальному закону распределения.
1) Для расчёта вероятности наступления события k раз применяем формулу Бернулли
2) Для того, чтобы найти вероятность того, что событие наступит более m раз воспользуемся формулой ) Р(m>1)=1 – [Р(0)+Р(1)+Р(2)]
3) Для нахождения вероятности наступления события не менее m1
, но не более чем m2
раз (m1
≤m≤m2
) воспользуемся формулой
4) Так как Х принадлежит биномиальному распределению, то
5)
Ответ:
1) Р(k=3)=0.1114
2) Р(x>2)=0.88694
3) Р(3≤x≤6)=0.6045
4) m
x
=6;
2.4
=1.54
5) p=0.1204
Задание 7
Дискретная двумерная случайная величина (X
,
Y
) описывается законом распределения вероятностей, заданного рядом распределения вероятностей, представленным в таблице:
Xi
Yj
|
X1
|
X2
|
Y1
|
P11
|
P12
|
Y2
|
P21
|
P22
|
Y3
|
P31
|
P32
|
Требуется:
1. Определить частные законы распределения компонент X
и Y
случайного вектора соответственно.
2. Определить условный закон распределения случайной величины X
при условии, что Y
приняла значение yj
.
3. Определить условный закон распределения случайной величины Y
при условии, что X
приняла значение xi
.
4. Вычислить математические ожидания и дисперсии компонент X
и Y
.
Дано: P11
=0,15; P12
=0,10
P21
=0,25; P22
=0,15
P31
=0,15; P32
=0,20
Yj
=Y2
Xj
=X1
Решение:
1)Определим закон распределения компонент случайного вектора X, для этого воспользуемся формулой:
, где
представляет собой не что иное, как вероятность того, что случайная величина X примет значение
, таким образом получим ряд распределения случайной величины X.
В результате получим закон распределения:
Произведем проверку, для этого сложим вероятности:
P(X) = 0,55+0,45=1;
Следовательно закон распределения Х вычислен правильно.
Определим закон распределения компонент случайного вектора Y, для этого воспользуемся формулой:
Получим следующий закон распределения:
Y
|
Y1
|
Y2
|
Y3
|
P(Y)
|
0,25
|
0,40
|
0,35
|
Проверка:
P(Y) =0,25+0,40+0,35=1
2) Для того чтобы определить условный закон распределения случайной величины Х, при условии, что величина Y приняла значение Yj
, воспользуемся формулой:
где n = 1,2, а P(Yj
) - вероятность того, что Y примет значение Yj
,определенное из закона распределения компоненты Y. Подставив данные в формулу, получаем:
Проверка: 0,625+0,375=1;
Мы определили условный закон распределения случайной величины Х, при условии, что величина Y приняла значение Y2.
3) Аналогично определим условный закон распределения случайной величины Y, при условии, что величина Х приняла значение Хi
.
:
Проверка:
Мы определили условный закон распределения случайной величины Y, при условии, что величина X приняла значение X1.
4) Вычислим математическое ожидание компонент X и Y:
х1
=1, x2
=2 следовательно
y1
=1, y2
=2, y3
=3 следовательно
Задача №8
Случайная величина Y
связана со случайными величинами xi
(i= 1,…,3) функциональной зависимостью вида
.
Известны математические ожидания случайных величин
и средние квадратические отклонения,
Задана также нормированная корреляционная матрица:
Требуется:
1. Вычислить математическое ожидание случайной величины Y
.
2. Вычислить среднее квадратическое отклонение случайной величины Y
.
3. В предположении нормального закона распределения случайных величин xi
записать выражение для плотности распределения случайной величины Y
.
Дано: а1
=-0.69; a2
=2.78; a3
=-2.61; b=8.33;
mx1
=1.33; mx2
=-0.98; mx3
=2.12;
σx1
=0.68; σx2
=1.53; σx3
=0.95;
rx1x2
=-0.15; rx1x3
=0.74; rx2x3
=0.86
Найти:
1) my
-?
2) σy
-?
3) f(y)-?
Решение:
1) Т.к. случайная величина Y является линейной функцией от аргументов X1
,X2
,X3
(Y(X1
,X2
,X3
)), то для определения
МОЖ Y воспользуемся теоремой МОЖ линейной функции:
МОЖ линейной функции равно той же линейной функции от МОЖ её аргументов:
M[Y]=
2) 2) Для вычисления среднего квадратического отклонения случайной величины Y,
сначала воспользуемся формулой для нахождения дисперсии Dy
линейной функции
Найдем корреляционные моменты Kij
величин xi
xj
из формулы для коэффициента корреляции:
.
Так как в задаче задано СКО, то воспользуемся формулой
:
3) Найдем выражение для плотности распределения случайной величины Y
Плотность n
-мерного нормального закона распределения случайного вектора
имеет вид:
- корреляционная матрица, которая является положительно определенной симметрической матрицей,
- нормированная корреляционная матрица
Составим корреляционную матрицу вектора
K12
=K21
=-0.156;
K13
=K31
=0.478;
K23
=K32
=1.25
Для диагонального элемента
К11
=(0.68)2
=0.4624;
К22
=(1.53)2
=2.3409;
К33
=(0.95)2
=0.9025
Получаем корреляционную матрицу:
Составим матрицу коэффициентов функциональной зависимости
:
Рассчитаем корреляционную матрицу СВ Y:
Определитель матрицы:
Вычислим обратную матрицу:
Из 1-го пункта задачи имеем:
Найдем выражение одномерной плотности распределения случайной величины Y
Ответ:
1) my
=-0.8453
2) σy
=2.433
3)
Задание 9
Пусть Х – время задержки момента начала матчей на данном стадионе. Известно среднее значение времени задержки, которое составляет «а» минут.
Требуется:
1. Оценить вероятность того, что начало матча будет задержано не менее, чем на t минут.
2. Найти минимальное значение времени задержки начала матча t0
, при котором вероятность задержки на время не менее t0
не превышает требуемого значения Ртр
, если дополнительно известно, что среднее квадратичное отклонение времени задержки начала матчей
секунд.
Дано: t1
=2.5; a=1.1; Pтр
=0.4; b=52
Найти:
1) Р(t≥t1
)-?
2) t0
-?
Решение:
1) Обозначим x-время задержания начала матча
Для решения задачи применим 1-ое неравенство Чебышева, так как оно имеет смысл тогда, когда
и устанавливает вероятность того, что случайная величина при произвольном законе распределения попадает на интервал (
;∞), ограниченная
2) Воспользуемся вторым неравенством Чебышева, которое позволяет определить вероятность попадания случайной величины при произвольном законе распределения на интервал симметричный относительно математического ожидания:
52сек.=0.86 мин.
Ответ:
1) Вероятность того, что начало матча будет задержано не менее, чем на 2,5 минут равна 0.44
2) Минимальное значение времени задержки начала матча = 2.4596 минут
Задание 10
По заданному в таблице Приложения 4 временному ряду U
=
¦
(
T
)
требуется:
- построить диаграмму рассеивания, провести спецификацию модели тренда;
- провести идентификацию модели, ограничившись моделями линейного и квадратичного трендов;
-проверить адекватность построенных моделей по критериям случайности колебаний уровней остаточной последовательности (критерием серий или критерием поворотных точек), критерием соответствия распределения случайной компоненты нормальному закону распределения (критерием ассиметрии и эксцесса или критерием стьюдентизированного размаха), критерием проверки равенства математического ожидания случайной компоненты нулю, критерием проверки независимости значений уровней случайной компоненты (Дарбина-Уотсона);
- выполнить точечный прогноз значений зависимой переменной U по линейному и квадратичному тренду для Τ=8 и T=9;
- выполнить интервальный прогноз для линейного тренда;
-сформулировать выводы о качестве трендовых моделей.
Решение:
Дано:
T
|
F(T)
|
1
|
4.9
|
2
|
3.2
|
3
|
7.1
|
4
|
7.6
|
5
|
10
|
6
|
18
|
7
|
20
|
1)
Суть стадии спецификации заключается в том, что подбирается математическая модель, описывающая изменение процессов во времени.
Для построения диаграммы рассеивания воспользуемся программой Excel
2)
Построим линии тренда
Линейная линия тренда используется для аппроксимации данных по методу наименьших квадратов в соответствии с уравнением :
,где b константа.
Квадратичная линия тренда используется для аппроксимации данных по методу наименьших квадратов в соответствии с уравнением:
,
где
константы.
R2
– величина достоверности аппроксимации
По характеру линии тренда видим, что с увеличение времени, значение переменной Y имеет тенденцию к увеличению.
Построим линию квадратичного тренда, так как парабола имеет большое доверие.
3)
Коэффициент детерминации показывает степень соответствия трендовой модели исходным данным. Его значение может лежать в диапазоне от 0 до 1. Чем ближе коэффициент к 1, тем точнее модель описывает имеющиеся данные.
Значение коэффициента детерминации линейного тренда R2
= 0.8636
Значение коэффициента детерминации квадратичного тренда R2
= 0.9507
4)
Для проверки адекватности построенных трендовых моделей воспользуемся критериями оценки моделей.
а)
Критерий поворотных точек
.
С помощью этого критерия можно проверить случайность остатков модели. В соответствии с этим критерием каждый уровень ряда сравнивается с двумя соединенными с ними. Если он больше или меньше их, то эта точка считается поворотной. Далее подсчитывается сумма поворотных точек m. В случайном ряду чисел должно выполняться строгое неравенство:
, где N – объем выборочной совокупности.
В нашем случае число поворотных точек m=1
N=7
Данное условие не выполняется, следовательно, можно утверждать, что ряд остатков моделей не является случайным.
б) Критерий асимметрии и эксцесса.
Проверка ряда остатков на нормальность осуществляется с помощью показателей асимметрии и эксцесса (если объем выборочной совокупности не превышает 50 значений). При нормальном распределении показатели асимметрии и эксцесса равны нулю.
На основании выборочных данных строятся эмпирические коэффициенты асимметрии и эксцесса по формулам:
;
.
В дополнение к выборочным коэффициентам асимметрии и эксцесса определяют среднеквадратические отклонения коэффициентов:
;
Если одновременно выполняются следующие неравенства:
то гипотеза о нормальном характере распределения остатков принимается.
Для линейной модели
:
|
|
|
|
|
|
|
|
1
|
4,9
|
1,7786
|
3,1214
|
9,74313796
|
30,41223
|
94,928737
|
9,7438559
|
2
|
3,2
|
4,5572
|
-1,3572
|
1,84199184
|
-2,49995
|
3,3929339
|
1,8416797
|
3
|
7,1
|
7,3358
|
-0,2358
|
0,05560164
|
-0,01311
|
0,0030915
|
0,05554742
|
4
|
7,6
|
10,1144
|
-2,5144
|
6,32220736
|
-15,8966
|
39,970306
|
6,32162906
|
5
|
10
|
12,893
|
-2,893
|
8,369449
|
-24,2128
|
70,047677
|
8,36878362
|
6
|
18
|
15,6716
|
2,3284
|
5,42144656
|
12,6233
|
29,392083
|
5,42198211
|
7
|
20
|
18,4502
|
1,5498
|
2,40188004
|
3,722434
|
5,7690277
|
2,40223651
|
Сумма
|
70,8008
|
-0,0008
|
34,1557144
|
4,135524
|
243,50386
|
34,1557143
|
Так как второе неравенство не выполняется, то гипотеза о нормальном характере распределения остатков отклоняется.
Для квадратичной модели:
|
|
|
|
|
|
|
|
1
|
4,9
|
4,3262
|
0,5738
|
0,32924644
|
0,188921607
|
0,108403
|
2
|
3,2
|
4,5571
|
-1,3571
|
1,84172041
|
-2,499398768
|
3,391934
|
3,72837481
|
3
|
7,1
|
5,807
|
1,293
|
1,671849
|
2,161700757
|
2,795079
|
7,02303001
|
4
|
7,6
|
8,0759
|
-0,4759
|
0,22648081
|
-0,107782217
|
0,051294
|
3,12900721
|
5
|
10
|
11,3638
|
-1,3638
|
1,85995044
|
-2,53660041
|
3,459416
|
0,78836641
|
6
|
18
|
15,6707
|
2,3293
|
5,42563849
|
12,63793973
|
29,43755
|
13,63898761
|
7
|
20
|
20,9966
|
-0,9966
|
0,99321156
|
-0,989834641
|
0,986469
|
11,06161081
|
сумма
|
0,0027
|
12,34809715
|
8,854946062
|
40,23015
|
39,36937686
|
Так как второе неравенство не выполняется, то гипотеза о нормальном характере распределения остатков отклоняется.
в)
Критерий проверки независимости значений уровней случайной компоненты (критерий Дарбина-Уотсона).
Для проверки независимости остатков используют критерий Дарбина-Уотсона, связанный с гипотезой о наличии в ряде остатков автокорреляции первого порядка, т.е. о корреляционной зависимости соседних остатков.
Наблюдаемое значение
критерия Дарбина-Уотсона:
, где
- остатки модели.
Для линейной модели
:
|
|
|
|
|
|
1
|
4,9
|
1,7786
|
3,1214
|
9,74313796
|
20,05785796
|
2
|
3,2
|
4,5572
|
-1,3572
|
1,84199184
|
1,25753796
|
3
|
7,1
|
7,3358
|
-0,2358
|
0,05560164
|
5,19201796
|
4
|
7,6
|
10,1144
|
-2,5144
|
6,32220736
|
0,14333796
|
5
|
10
|
12,893
|
-2,893
|
8,369449
|
27,26301796
|
6
|
18
|
15,6716
|
2,3284
|
5,42144656
|
0,60621796
|
7
|
20
|
18,4502
|
1,5498
|
2,40188004
|
54,51998776
|
Сумма
|
-0,0008
|
34,1557144
|
По таблице значения критерия Дарбина – Уотсона определим для числа наблюдений n=7 критические значения нижней и верхней границы:
Так как фактически найденное d=1,5962 находится в пределах от d1
до 4 – d2
(0,7<d<2,7), то гипотеза об отсутствии автокорреляции принимается.
Для квадратичной модели
:
|
|
|
|
|
|
1
|
4,9
|
4,3262
|
0,5738
|
0,32924644
|
2
|
3,2
|
4,5571
|
-1,3571
|
1,84172041
|
3,72837481
|
3
|
7,1
|
5,807
|
1,293
|
1,671849
|
7,02303001
|
4
|
7,6
|
8,0759
|
-0,4759
|
0,22648081
|
3,12900721
|
5
|
10
|
11,3638
|
-1,3638
|
1,85995044
|
0,78836641
|
6
|
18
|
15,6707
|
2,3293
|
5,42563849
|
13,63898761
|
7
|
20
|
20,9966
|
-0,9966
|
0,99321156
|
11,06161081
|
Сумма
|
0,0027
|
12,34809715
|
31,36937686
|
При значимости α=0,05, определим по таблице значений критерия Дарбина-Уотсона для числа наблюдений n
=7 и числа независимых переменных модели k=1, критические значения d1
и d2
:
d1
=0.7
d2
=1.3
4 – dВ
=2.7
Так как фактически найденное d=2.54042 находится в пределах от dВ
до 4 – dВ
(0.7<d<2.7), то гипотеза об отсутствии автокорреляции принимается.
5) Выполним точечный прогноз значений зависимой переменной Y по линейному и квадратичному тренду для Т=8 и Т=9:
Прогноз с линейным трендом:
T
|
Y(T)
|
1
|
4.9
|
2
|
3.2
|
3
|
7.1
|
4
|
7.6
|
5
|
10
|
6
|
18
|
7
|
20
|
8
|
21.2288
|
9
|
24.0074
|
Прогноз с квадратичным трендом:
T
|
Y(T)
|
1
|
4.9
|
2
|
3.2
|
3
|
7.1
|
4
|
7.6
|
5
|
10
|
6
|
18
|
7
|
20
|
8
|
27.3415
|
9
|
34.7054
|
6)
Линия тренда – графическое представление направления изменения ряда данных. Линии тренда используются для анализа ошибок предсказания, что также называется регрессионным анализом. Линии тренда позволяют графически отображать тенденции данных и прогнозировать их дальнейшие изменения.
Регрессионный анализ – форма статистического анализа, используемого для прогнозов. Регрессионный анализ позволяет оценить степень связи между переменными, предлагая механизм вычисления предполагаемого значения переменной из нескольких уже известных значений.
Значения R в квадрате. Число от 0 до 1, которое отражает близость значений линии тренда к фактическим данным. Линия тренда наиболее соответствует действительности, когда значение R в квадрате близко к 1. Оно также называется квадратом смешанной корреляции.
Сравнивая тренды, можно утверждать, что лидирующим по качеству отображения является квадратичный тренд. Он точнее отражает характер модели, т.к. коэффициент детерминации R2
для квадратичного тренда больше соответствующего коэффициента для линейного тренда
C
писок использованной литературы:
1. Теория вероятностей. Учебник для вузов (А.В. Печенкин.,О.И. Тескин.,Г.М. Цветкова и др.). Под ред. В.С. Зарубина., А.П. Крищенко. Изд-во МГГУ им.Н.Э. Баумана.,1999 – 456 стр.
2. Кибзун А.И. Теория вероятностей и математическая статистика, 2005г.
3. Вентцель Е.С. Те ория вероятностей. Учебник для вузов – М.: «Высшая школа», 2000г.
4. Вентцель Е.С., Овчаров Л.А. Задачи и упражнения по теории вероятностей, 2004г.
5. Вентцель Е.С., Овчаров Л.А. Теория вероятностей и её инженерные приложения, 2003г.
6. Виноградов С.А. и др. Теория вероятностей и математическая статистика. Учебно-методическое пособие для практических занятий. МО, 1998 г