Главная              Рефераты - Разное

Статистические  методы выявления  наличия корреляционной связи между явлениями - реферат

МИНИСТЕРСТВО СЕЛЬСКОГО ХОЗЯЙСТВА И ПРОДОВОЛЬСТВИЯ РЕСПУБЛИКИ БЕЛАРУСЬ

УЧРЕЖДЕНИЕ ОБРАЗОВАНИЯ «БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ АГРАРНЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ»




Реферат

по курсу «Статистика» на тему:

Статистические методы выявления наличия корреляционной связи между явлениями.






Студентка 2 курса,

72эи-группы,

ФПУ,

Звонкович Анастасии



Минск 2010 г

Содержание

Введение…………………………………………………………………………..3

  1. Виды взаимосвязей, изучаемых в статистике……………………………3
  2. Статистические методы выявления наличия корреляционной связи между явлениями………………………………………………………………….5
  3. Примеры выявления корреляционной связи различными методами….8

Выводы…………………………………………………………………………...11

Список литературы………………………………………………………………12

Введение

Исследование объективно существующих связей между явлениями – важнейшая задача общей теории статистики. В процессе статистического исследования зависимостей вскрываются причинно-следственные отношения между явлениями, что позволяет выявлять факторы (признаки), оказывающие существенное влияние на вариацию изучаемых явлений и процессов.

Особо важным, при исследовании причинно-следственных связей считается первый этап, а это непосредственно выявление наличия связей между явлениями. Методы, пользуясь которыми в статистике определяется наличие связи, и стали объектом рассмотрения в данной работе.

Цель работы – это рассмотрение существующих в статистике методов, более детальное изучение некоторых из них и применение изученных методов на практике.

Необходимость выполнения работы, изучения данного материала возникла в связи с изучением курса статистики.

  1. Виды взаимосвязей, изучаемых в статистике.

Известно, что все явления в мире, в том числе общественные, взаимосвязаны и взаимообусловлены. Изучение взаимосвязей явлений – важнейшая задача статистического анализа. Связи между признаками и явлениями отличаются разнообразием.

По содержанию, прежде всего, выделяют причинно-следственные связи, выражающиеся в действии признаков (причин) на следствие (явление). Причинно-следственные связи позволяют раскрыть сущность явлений, к ним приковано основное внимание исследователей.

Связи, проявляющиеся как воздействие факторных признаков, могут быть названы факторно обусловленными.

По числу взаимодействующих факторов выделяют связи однофакторные и многофакторные. При однофакторных связях результативный признак связывается с одним фактором, а при многофакторных – с двумя и большим числом факторных признаков.

По направлению связи могут быть прямые и обратные. При прямых связях с увеличением факторного признака увеличивается и признак результативный, при обратных – с увеличением факторного признака результативный уменьшается.

Выделяют так же связи прямолинейные и криволинейные. Прямолинейные связи описываются уравнением прямой, криволинейные – уравнением какой-либо кривой (гиперболы, параболы и т.п.).

Различают связи функциональные и корреляционные.

Функциональные – это такие связи, когда изменению факторного признака на единицу соответствует изменение результативного признака на строго определенную величину. Например, с увеличением радиуса окружности на 1 см длина окружности всегда увеличивается на 6, 28 см, так как длина окружности определяется по формуле . Функциональная связь проявляется как в совокупности в целом, так и в каждой ее единице.

Корреляционные – это такие связи, когда при одном и том же значении факторного признака значения результативного признака различны, однако изменение факторного признака вызывает средние изменения результативного признака. В отличие от функциональной зависимости корреляция возникает тогда, когда зависимость результативного признака от факторного осложняется наличием ряда случайных факторов. В корреляционной связи между изменением факторного и результативного признака нет такого полного соответствия, воздействие факторов проявляется лишь в среднем при массовом наблюдении фактических данных.

Поскольку связи в экономике относятся, как правило, к многофакторным, то для принятия практических решений учитываются только так называемые основные. В свою очередь сами факторные признаки могут зависеть от изменения ряда причин (факторов). Отсюда одному и тому же значению признака-фактора соответствует целый ряд значений результативного признака. Ведь в каждом конкретном случае степень зависимости тоже может измениться.

При изучении причинно-следственных связей решающее слово должно принадлежать теории (сущности) изучаемого явления. Теоретический анализ должен показать о наличии или возможности связи между данными признаками, какие факторы влияют на формирование и изменение данного результативного признака.

При исследовании корреляционных зависимостей решается широкий круг вопросов:

1) предварительный анализ свойств изучаемой совокупности;

2) установленные факта наличия связи, определение ее направления и формы;

3) измерение степени тесноты связи между признаками;

4) нахождение аналитического (математического) выражения связи или построение регрессионной модели;

5) оценка адекватности модели, ее интерпретации и практическое использование.

  1. Статистические методы выявления наличия корреляционной связи между явлениями.

Корреляционная связь, характеризуется согласованностью в вариации значений признаков. Однако согласованность эта не всегда свидетельствует о наличии причинно-следственной связи между рассматриваемыми признаками. Так, например, согласованность в вариации значений признаков может быть следствием какой-либо одной, общей для них причины, или отражать случайное совпадение в изменениях признаков, не находящихся между собой в какой-либо связи. Неправильно возлагать полностью на статистику задачу установления наличия связи. Статистика только обнаруживает и характеризует фактическое проявление связи, указание на возможность которой дает теория изучаемого явления.

Именно теоретический анализ указывает на вытекающую из существа изучаемого явления возможность связи между признаками, процессами, сопровождающими это явление. Однако теория не может дать ответ на вопрос, проявляется ли в действительности и как проявляется теоретически возможная связь в данных конкретных условиях.

При статистическом изучении корреляционной связи между признаками исходным материалом являются данные об индивидуальных значениях этих признаков в изучаемой статистической совокупности.

Статистическая наука в настоящее время располагает большим набором приемов (методов) выявления корреляционной связи. Одни приемы можно отнести к элементарным (простейшим), другие предусматривают использование специального сложного математического аппарата.

К элементарным приемам (методам) выявления наличия корреляционной связи относятся:

  1. параллельное сопоставление рядов значений факторного и результативного признаков,
  2. графическое изображение фактических данных с помощью поля корреляции,
  3. построение групповой и корреляционной таблиц,
  4. факторные (аналитические) группировки и исчисление групповых средних.

К сложным методам изучения взаимосвязей относятся: балансовые таблицы, дисперсионный анализ, методы теории корреляции и регрессии, методы многомерного анализа, методы распознавания образов, метод главных компонентов и др.

Рассмотрим некоторые из данных методов.

При отсутствии ярко выраженной причинной связи между факторным и результативным признаками наличие и характер связи можно установить при помощи метода параллельных рядов: в одной таблице приводятся упорядоченные значения факторного признака, который обычно обозначается символом х , и соответствующие им значения результативного признака, который обычно обозначается символом у .

Наличие и характер связи определяется по степени согласованности вариации данных рядов.

Метод параллельных рядов обычно используется для установления характера связи при относительно небольшом объеме исходного материала. С помощью этого метода можно дать лишь самую общую характеристику связи. Однако при наличии большого числа значений признаков, когда одному и тому же значению признака-фактора, как правило, соответствует несколько различных значений результативного признака, восприятие параллельных рядов сильно затрудняется. В этих случаях целесообразно для установления наличия связи воспользоваться методом построения корреляционных таблиц.

Построение корреляционной таблицы начинают с группировки значений факторного и результативного признаков. В корреляционной таблице, как правило, в подлежащем указывается факторный признак х, а в сказуемом – результативный признак у.

В корреляционной таблице указываются частоты: сколько раз данная величина одного признака повторяется в сочетании с соответствующей величиной другого признака. Итоговые графа и строка отражают распределение единиц совокупности по рассматриваемым признакам.

Если частоты в корреляционной таблице расположены на «главной» диагонали (из левого верхнего угла в правый нижний угол), но можно предположить наличие прямой корреляционной зависимости между признаками. Если же частоты расположены по «вспомогательной» диагонали (из левого нижнего угла в правый верхний угол), то предполагают наличие обратной связи между признаками.

Корреляционная таблица позволяет сжато, компактно и достаточно наглядно изложить исходный материал. Поэтому даже расчеты по методам корреляции и регрессии можно вести по корреляционной таблице.

Корреляционная зависимость устанавливается и на основе факторных (аналитических) группировок. Для этого необходимо изучаемую совокупность расчленить на группы по величине факторного признака и по каждой группе вычислить групповые средние значения результативного признака. Эти средние величины, исчисленные на единицу совокупности по каждой группе, являются сопоставимыми, и в зависимости от направления их изменения можно установить наличие и направление связи между исследуемыми признаками.

Важную роль в статистических исследованиях взаимосвязей явлений играет индексный метод. Как известно, в любой системе индексов отображается связь между результативным и факторным признаками явлений, посредством индексов устанавливается влияние отдельных причин (факторов) на изменение результативного признака.

В статистике широко применяются балансовые построения как метод анализа связей и пропорций, особенно на макроэкономическом уровне. Путем составления балансов связывают в единую систему абсолютные уровни, характеризующие движение ресурсов. Балансовая формула (в схематическом выражении «приход – расход») характеризует единый процесс движения материальных ресурсов и показывает взаимосвязь и пропорции элементов этого процесса.

На исследовании вариации (количественных различий) факторных и результативных признаков основан регрессионно-корреляционный метод. При анализе корреляционных зависимостей решаются две практические задачи: во-первых, необходимо обнаружить саму зависимость в фактическом материале, а во-вторых, измерить силу, или тесноту, связи, то есть степень ее приближения к связи функциональной. Первая задача решается соответствующей обработкой фактического материала и составлением уравнения корреляционной связи – чего вполне достаточно для выявления наличия связи. Тип уравнения выбирается на основе теоретического анализа и исследования исходных фактических данных.

В большинстве случаев связи изучаются по уравнению прямой вида: , где – результативный признак, – факторный, и – параметры уравнения прямой. Уравнение прямой, описывающей корреляционную связь является уравнением связи, или регрессии, а сама прямая – линией регрессии. Параметры уравнения прямой находятся выравниванием по способу наименьших квадратов, которое приводит к системе двух уравнений.

  1. Примеры выявления корреляционной связи различными методами.

Более наглядным является рассмотрение изученных методов на примере конкретных данных. Примерим на практике следующие методы:

  1. метод параллельных рядов;
  2. метода факторных (аналитических) группировок;
  3. регрессионно-корреляционный метод.

Рассмотрим метод параллельных рядов на примере данных по 24 хозяйствам района о массе внесенных органических удобрений и уровнях урожайности зерновых . Данные представим в виде таблицы.

Таблица 1. Масса внесенных органических удобрений и уровни урожайности зерновых в хозяйствах района

№ пп

Масса внесенных органических удобрений на 1 га посевов, т (x )

Урожайность ц/га (у)

№ пп

Масса внесенных органических удобрений на 1 га посевов, т (x )

Урожайность ц/га (у)

1

1

16

13

9

27

2

2

16

14

10

26

3

2

15

15

10

29

4

3

18

16

10

32

5

4

21

17

11

30

6

4

22

18

12

30

7

5

21

19

12

33

8

6

23

20

13

30

9

7

25

21

14

32

10

7

24

22

15

33

11

8

26

23

15

35

12

8

25

24

16

35

Данные о массе внесенных органических удобрений в тоннах на 1 га посевов зерновых (факторные признаки) расположим в порядке их возрастания (табл. 1).

Сравнивая данные таблицы, можно заметить, что чем больше масса внесенных органических удобрений, тем выше уровень урожайности зерновых, хотя и не во всех хозяйствах. Следовательно, можно говорить о наличии прямой связи между значениями факторного и результативного признаков.

При помощи метода факторных (аналитических) группировок построим на основе исходных данных, приведенных в табл. 1 факторную группировку зависимости уровня урожайности зерновых от массы внесенных органических удобрений (табл. 2).

Таблица 2. Зависимость уровня урожайности зерновых от массы внесенных органических удобрений в хозяйствах района

Группы хозяйств по массе внесенных органических удобрений, т/га

Число хозяйств

Общая сумма урожайности по группам хозяйств, ц

Уровень урожайности в среднем по группам хозяйств, ц/га

1 -- 4

6

108

18,0

5 – 8

6

144

24,0

9 – 12

7

207

29,6

13 – 16

5

165

33,0

Итого

24

624

26,0

Сравнивая групповые средние, можно заметить, что по мере увеличения массы внесенных удобрений на 1 га посевов урожайность от группы к группе закономерно возрастает. Это свидетельствует о положительной корреляционной связи между изучаемыми признаками.

Для выявления наличия корреляционной связи можно так же использовать регрессионно-корреляционный метод. Связь между уровнем урожайности зерновых и массой внесенных удобрений на 1 га посевов можно представить в виде прямой: ,

где – уровень урожайности зерновых; – масса внесенных органических удобрений, т/га; – свободный член уравнения, который в данном случае представляет собой средний уровень урожайности при x= 0, то есть когда удобрения не вносятся; коэффициент регрессии, показывающий насколько в среднем увеличится уровень урожайности с увеличением количества удобрений на 1 т.

Вычислим параметры и и тем самым уравнение прямой, или уравнение связи, для нашего примера (из табл.1). Как видно из формул для нахождения и следует подсчитать , , и . Сделаем это в табл. 3.

Таблица 3. Выравнивание по уравнению прямой

№ пп

Масса внесенных органических удобрений на 1 га посевов, т (x )

Урожайность зерновых, ц/га (y )

xy

Выровненные значения уровней урожайности зерновых, ц/га ()

1

1

16

16

1

16,1

2

2

16

32

4

17,4

3

2

15

30

4

17,4

4

3

18

54

9

18,8

5

4

21

84

16

20,1

6

4

22

88

16

20,1

7

5

21

105

25

21,4

8

6

23

138

36

22,7

9

7

25

175

49

24,0

10

7

24

168

49

24,0

11

8

26

208

64

25,3

12

8

25

200

64

25,3

13

9

27

243

81

26,3

14

10

26

260

100

28,0

15

10

29

290

100

28,0

16

10

32

320

100

28,0

17

11

30

330

121

29,3

18

12

30

360

144

30,6

19

12

33

396

144

30,6

20

13

30

390

169

32,0

21

14

32

448

196

33,3

22

15

33

495

225

34,6

23

15

35

525

225

34,6

24

16

35

560

256

36,0

Итого

204

624

5915

2198

623,9

Следовательно, уравнение связи между уровнем урожайности зерновых и массой внесенных органических удобрений будет: .

Оно означает, что с увеличением на 1 т массы внесенных удобрений в расчете на 1 га посевов урожайность будет увеличиваться в среднем на 1,32 ц/га. Величина 14,8 показывает уровень урожайности зерновых при , то есть когда удобрения не вносятся.

Подставив в это уравнение регрессии конкретные значения , находим для всех 24 хозяйств выровненные (их еще называют теоретическими) значения уровней урожайности зерновых (см. последний столбец табл.3). Суммы фактических (эмпирических) уровней урожайности и теоретических значений практически совпадают: 624 и 623,9, расхождение значений произошло из-за округлений. Незначительность отклонений фактических и выровненных значений по каждому хозяйству может служить подтверждением прямолинейности связи между уровнем урожайности и массой внесенных удобрений.

Выводы

Изучены некоторые основные статистические методы выявления корреляционной связи между явлениями. Так же рассмотрены примеры использования статистических методов на конкретных данных, в которых получены результаты, подтверждающие действие этих методов на практике.

При небольшом количестве исходных данных достаточно использовать наиболее простой из рассмотренных методов: параллельное сопоставление рядов значений факторного и результативного признаков. При большем количестве данных, либо неоднозначности результатов, полученных при использовании первого метода, можно воспользоваться методом факторных (аналитических) группировок, который позволяет установить наличие и направление связи между явлениями исследуемого признака.

Для выявления связи и более детального ее рассмотрения наиболее подходящим является регрессионно-корреляционный метод.

Рассмотренные методы удобно применять при действии одного, двух факторов. Но на большинство явлений чаще всего действие оказывают множество факторов. Поэтому чаще используются не данные методы, а множественная корреляция, с помощью которой изучается зависимость результативного признака от нескольких факторов. Но непосредственно для установления наличия корреляционной связи между явлениями в статистике достаточным является использование описанных выше методов.

Список литературы.

  1. Учеб. Пособие / И.Е.Теслюк, В.А.Тарловская, И.Н.Терлиженко и др. – 2-е изд. – Мн.: Ураджай, 2000. – 360 с.
  2. Статистика: показатели и методы анализа: справ.пособие / Н.Н.Бондаренко, Н.С.Бузыгина, Л.И.Василевская и др.; Под ред. М.М.Новикова. – Мн.: «Современная школа», 2005. – 628 с.
  3. Неганова Л.М. Статистика: Конспект лекций. – М.: Юрайт-Издат, 2007 – 220с.