Главная              Рефераты - Математика

Курс лекций Математические методы в психологии - реферат

Материалы к курсу

«МАТЕМАТИЧЕСКИЕ МЕТ ОДЫ В ПСИХОЛОГИИ»

ЧАСТЬ 1

@Преподаватель: Голев Сергей Васильевич, адъюнкт-профессор психологии (доцент).

@Ассистент: Голева Ольга Сергеевна, магистр психологии

(ОМУРЧ «Украина» ХФ. – 2008 г.)

ИПИС ХГУ - 2008 г. )

В лекциях были использованы материалы следующих авторов:

Годфруа Ж. Что такое психология? М.: Мир, 1996. Т 2 . Куликов Л. В. Психологическое исследование: методические рекомендаций по проведению. - СПб., 1995. Немов Р.С. Психология: Экспериментальная педагогическая психология и психодиагностика. - М., 1999.- Т. 3. Практикум по общей экспериментальной психологии / Под ред. А.А. Крылова. - Л. ЛГУ, 1987. Сидоренко Е.В . Методы математической обработки в психологии. –СПб.: ООО «Речь», 2000. -350 с. Шевандрин Н.И. Психодиагностика, коррекция и развитие личности. - М.: Владос, 1998.-С.123. Суходольский Г.В. Математические методы в психологии. – Харьков: Изд-во Гуманитарный Центр, 2004. – 284 с.

Курс «Математические методы в психологии»

(Материалы для самостоятельного изучения студентами)

Лекция № 1

ВВЕДЕНИЕ В КУРС «МАТЕМАТИЧЕСКИЕ МЕТОДЫ В ПСИХОЛОГИИ»

Вопросы:

1.Математика и психология

2.Методологические вопросы применения математики в психологии

3.Математическая психология

3.1.Введение

3.2.История развития

3.3.Психологические измерения

3.4.Нетрадиционные методы моделирования

4.Словарь по математическим методам в психологии

5.Список рекомендованной литературы по курсу

Вопрос 1. МАТЕМАТИКА И ПСИХОЛОГИЯ

Существует мнение, неоднократно высказывавшееся круп­ными учеными прошлого: область знания становится наукой, лишь применяя математику. С этим мнением, возможно, не со­гласятся многие гуманитарии. А зря: именно математика позво­ляет количественно сравнивать явления, проверять правильность словесных утверждений и тем самым добираться до истины либо приближаться к ней. Математика делает обозримыми длинные и подчас туманные словесные описания, проясняет и экономит мысль.

Математические методы позволяют обоснованно прогно­зировать будущие события, вместо того, чтобы гадать на кофей­ной гуще или как-либо иначе. В общем, польза от применения математики велика, но и труда на ее освоение требуется много. Однако он окупается сполна.

Психология в своем научном становлении неизбежно должна была пройти и прошла путь математизации, хотя не во всех стра­нах и не в полной мере. Точной даты начала пути математизации, пожалуй, не знает ни одна наука. Однако для психологии в каче­стве условной даты начата этого пути можно принять 18 апреля

1822 г . Именно тогда в Королевском немецком научном обществе Иоганн Фридрих Гербарт прочел доклад «О возможности и необ­ходимости применять в психологии математику». Основная идея доклада сводилась к упомянутому выше мнению: если психоло­гия хочет быть наукой, подобно физике, в ней нужно и можно применять математику.

Спустя два года после этого программного по своей сути док­лада И. Ф. Гербарт издал книгу «Психология как наука, заново ос­нованная на опыте, метафизике и математике». Эта книга приме­чательна во многих отношениях. Она, на мой взгляд (см. Г.В Суходольский, [8]), явилась пер­вой попыткой создания психологической теории, опирающейся на тот круг явлений, которые непосредственно доступны каждо­му субъекту, а именно на поток представлений, сменяющих друг друга в сознании. Никаких эмпирических данных о характеристиках этого потока, полученных, подобно физике, эксперимен­тальным путем, тогда не существовало. Поэтому Гербарт в отсут­ствие этих данных, как он сам писал, должен был придумывать гипотетические модели борьбы всплывающих и исчезающих в сознании представлений. Облекая эти модели в аналитическую форму,например φ =α(l-exp[-βt]) ,где t—время, φ—скорость изменения представлений, α и β — константы, зависящие от опы­та, Гербарт, манипулируя числовыми значениями параметров, пы­тался описать возможные характеристики смены представлений.

По-видимому, И. Ф. Гербарту первому принадлежит мысль о том, что свойства потока сознания — это величины и, следова­тельно, они в дальнейшем развитии научной психологии подле­жат измерению. Ему также принадлежит идея «порога сознания», и он первый употребил выражение «математическая психология».

У И. Ф. Гербарта в Лейпцигском университете нашелся уче­ник и последователь, позднее ставший профессором философии и математики, — Мориц-Вильгельм Дробиш. Он воспринял, раз­вил и по-своему реализовал программную идею учителя. В слова­ре Брокгауза и Ефрона о Дробише сказано, что еще в 30-х годах Х1Х века он занимался исследованиями по математике и психо­логии и публиковался на латинском языке. Но в 1842г . М.В.Дро­биш издал в Лейпциге на немецком языке монографию под не­двусмысленным названием: «Эмпирическая психология соглас­но естественнонаучному методу».

На мой взгляд, эта книга М.-В. Дробиша дает замечательный пример первичной формализации знаний в области психологии сознания. Там нет математики в смысле формул, символики и рас­четов, но там есть четкая система понятий о характеристиках пото­ка представлений в сознании как взаимосвязанных величинах. Уже в предисловии М.-В. Дробиш написал, что эта книга предваряет другую, уже готовую, — имеется в виду книга по математической психологии. Но поскольку его коллеги-психологи недостаточно подготовлены в математике, постольку он счел необходимым про­демонстрировать эмпирическую психологию сначала безо всякой математики, а лишь на твердых естественнонаучных основах.

Не знаю, подействовала ли эта книга на тогдашних филосо­фов и богословов, занимавшихся психологией. Скорее всего — нет. Но она, несомненно, подействовала, как и работы И. Ф. Гербарта, на лейпцигских ученых с естественнонаучным образованием.

Лишь через восемь лет, в 1850 г . в Лейпциге вышла в свет вто­рая основополагающая книга М.-В. Дробиша—«Первоосновы математической психологии». Таким образом, у этой психологи­ческой дисциплины тоже есть точная дата появления в науке. Не­которые современные психологи, пишущие в области математи­ческой психологии, ухитряются начинать ее развитие с американ­ского журнала, появившегося в 1963 г. Воистину, «все новое — это хорошо забытое старое». Целое столетие до американцев развива­лась математическая психология, точнее — математизированная психология. И начало процессу математизации нашей науки по­ложили И. Ф. Гербарт и М.-В. Дробиш.

Надо сказать, что по части новаций математическая психоло­гия Дробиша уступает сделанному его учителем — Гербартом. Правда, Дробиш к двум борющимся в сознании представлениям добавил третье, а это сильно усложнило решения. Но главное, по-моему, в другом. Большую часть объема книги составляют приме­ры численного моделирования. К сожалению, ни современники, ни потомки не поняли и не оценили научного подвига, совершен­ного М.-В. Дробишем: у него ведь не было компьютера для чис­ленного моделирования. А в современной психологии математи­ческое моделирование — это продукт второй половины XX века. В предисловии к нечаевскому переводу гербартианской психоло­гии российский профессор А. И. Введенский, знаменитый своей «психологией без всякой метафизики», весьма пренебрежитель­но отозвался о попытке Гербарта применять в психологии мате­матику. Но не такова была реакция естествоиспытателей. И пси­хофизики, в частности Теодор Фехнер, и знаменитый Вильгельм Вундт, работавшие в Лейпциге, не могли пройти мимо основопо­лагающих публикаций И.Ф.Гербартаи М.-В. Дробиша. Ведь имен­но они математически реализовали в психологии идеи Гербарта о психологических величинах, порогах сознания, времени реакций сознания человека, причем реализовали с использованием совре­менной им математики.

Основные методы тогдашней математики—дифференциальное и интегральное исчисления, уравнения сравнительно несложных за­висимостей — оказались вполне пригодными для выявления и опи­сания простейших психофизических законов и различных реакций человека Но они не годились для изучения сложных психических явлений и сущностей. Не зря В.Вундт категорически отрицал воз­можность эмпирической психологии исследовать высшие психичес­кие функции. Они оставались, по Вундту, в ведении особой, по сути метафизической, психологии народов.

Математические средства для изучения сложных многомерных объектов, в том числе высших психических функции — интеллекта, способностей, личности, стали создавать англоязычные ученые. Сре­ди других результатов оказалось, что рост потомков как бы стремит­ся возвратиться к среднему росту предков. Появилось понятие «рег­рессия», и были получены уравнения, выражающие эту зависимость. Был усовершенствован коэффициент, раньше предложенный фран­цузом Бравэ. Этот коэффициент количественно выражает соотно­шение двух изменяющихся переменных, т. е. корреляцию. Теперь этот коэффициент — одно из важнейших средств многомерного анализа данных, дажесимвол сохранил аббревиатурный: малое латинское «г» от английского relation — отношение.

Еще будучи студентом Кембриджа, Фрэнсис Гальтон заметил, что рейтинг успешности сдачи экзаменов по математике,—а это был выпускной экзамен, —- изменяется от нескольких тысяч до немногих сотен баллов. Позднее, связав это с распределением талантов, Галь­тон пришел к мысли о том, что специальные испытания позволяют прогнозировать дальнейшие жизненные успехи людей. Так в 80-х гг. XIX века родился гальтоновский метод тестов.

Идею тестов подхватили и развили французы—А. Бит, В. Анри и другие, создавшие первые тесты для селекции социально отсталых детей. Это послужило началом психологической тестологии, что, в свою очередь, повлекло за собой развитие психологических измере­ний.

Большие массивы числовых результатов измерений по тестам— в баллах, стали объектом многочисленных исследований, в том чис­ле математико-психологических. Особая роль здесь принадлежит ан­глийскому инженеру, работавшему в Америке, —Чарльзу Спирмену

Во-первых , Ч. Спирмен, полагавший, что для вычисления корреляции между рядами целочисленных баллов, или рангов, нужна специальная мера, перепробовав разные варианты (я читал его объемную статью в Американском психологическом журнале за 1904 г.), остановился, наконец, на той форме коэффициента корреляции рангов, которая с тех пор носит его имя.

Во-вторых , имея дело с большими массивами числовых ре­зультатов по тестам и корреляций между этими результатами, Ч. Спирмен предположил, что эти корреляции вовсе не выражают взаимовлияние результатов, а эксплицируют их совместную из­менчивость под влиянием обшей латентной психической причи­ны, или фактора, например интеллекта. Соответственно этому Спирмен предложил теорию «генерального» фактора, определя­ющего совместную изменчивость переменных тестовых результа­тов, а также разработал метод выявления этого фактора по корре­ляционной матрице. Это был первый метод факторного анализа, созданный в психологии и для психологических целей.

У однофакторной теории Ч. Спирмена быстро нашлись оппоненты. Противоположную, многофакторную теорию, объясня­ющую корреляции, предложил Леон Терстоун. Ему же принадле­жит первый метод мультифакторного анализа, основанный на применении линейной алгебры. После Ч. Спирмена и Л. Терстоуна факторный анализ, не только стал одним из важнейших мате­матических методов многомерного анализа данных в психологии, но и вышел далеко за ее пределы, превратился в общенаучный метод анализа, данных.

С конца 20-х гг XX века математические методы все шире про­никают в психологию и творчески используются в ней. Интен­сивно развивается психологическая теория измерений. На основе аппарата цепей Маркова разрабатываются стохастические моде­ли научения в психологии поведения. Созданный в области био­логии Рональдом Фишером дисперсионный анализ становится основным математическим методом в генетической психологии. Математические модели из теории автоматического регулирова­ния и шенноновская теория информации широко применяются в инженерной и общей психологии. В итоге современная научная психология во многих своих отраслях математизирована значительным образом. При этом вновь появляющиеся математичес­кие новации нередко заимствуются психологами для своих целей. К примеру, появление алгоритмического языка для задач управ­ления, предложенного А. А. Ляпуновым и Г. А. Шестопалом, по­чти сразу же бьшо использовано В.Н.Пушкиным для составления алгоритмов деятельности железнодорожного диспетчера.

Должен возникнуть во­прос: какими особыми свойствами обладает математика, если одни и те же математические методы успешно применяются в различ­ных науках. Отвечая на этот вопрос, следует обратиться к предме­ту математики и ее объектам.

На протяжении многих столетий считалось, что предметом математики является все сущее — природа в широком смысле. Математики древности полагали, что математические формы име­ют божественное происхождение. Так, Платон рассматривал гео­метрические фигуры как идеальные эйдосы, т. е. образы, создан­ные высшими богами для копирования людьми, конечно, уже не в той совершенной форме. А знаменитый Пифагор видел в числах и определенных числовых сочетаниях предустановленную гармо­нию небесных сфер.

Религиозное мировоззрение людей веками связывало боже­ственное творение мира с математическими средствами, с помо­щью которых выражаются законы природы. Глубоко религиозный сэр Исаак Ньютон верил, что «книга природы написана на языке математики», и широко использовал математические методы в своей натуральной философии.

Надо сказать, что, даже отказавшись от веры в божественное тво­рение мира, многие математики продолжали считать природу пред­метом математики. Нам широко известна формулировка, данная в свое время Ф. Энгельсом : «Предметом математики служат простран­ственные формы и количественные отношения материального мира». Еще и сегодня можно встретить эту формулировку в учебной литера­туре. Правда, появились и другие трактовки предмета — как наибо­лее абстрактных моделей всего сущего. Но здесь, намой взгляд, пред­мет математики опять-таки сужен до служебной функции — моде­лирования и снова природы в широком смысле.

Спрашивается, а правильно ли это, отказавшись от идеи тво­рения, по-прежнему считать природу предметом математики? Ведь это не только не последовательно. Дело в том, что один и тот же природный закон можно выразить математически по-разному и в пределах научной точности нельзя доказать, какое из выраже­ний истинно. Примером могут служить логарифмический закон Вебера—Фехнера и степенной закон Стивенса, которые, как по­казал Ю. М. Забродин, оба выводятся при определенных допуще­ниях из некоего обобщенного психофизического закона. То об­стоятельство, что один и тот же математический метод описывает явления из разных наук, тоже свидетельствует не в пользу приро­ды как предмета математики.

Так если не природа, то что же является предметом математи­ки? Мой ответ, несомненно, крайне удивит многих представите­лей физико-математических наук: предметом математики явля­ется ее собственный продукт—те математические объекты, из ко­торых состоит математика как наука.

Математический объект — это продукт человеческой мысли, материализованный хотя бы в одной из пяти основных форм: вер­бальной, графической, табличной, символической или аналити­ческой. Конечно, древний мыслитель мог найти в природе аналоги математическим объектам — геометрическим формам, числам, как-либо физически воплощенным (прямая тростинка, пять кам­ней и т. п.). Но ведь математическую сущность надо было абстра­гировать от материальной природной формы. Лишь после этого она становилась математической, а не физической (биологичес­кой и т.д.). И сделать это мог только человек. В длинном ряду по­колений — и для практических целей, и ради интереса — люди создавали тот мир математических объектов (включая отношения и операции над объектами, которые тоже суть математические объекты), который называется математикой.

Подобно психологии, математика — это обширная и бурно развивающаяся область знаний. Но она также далеко не однород­на: в ее составе выделяются не только многочисленные отрасли, но и «разные математики». Существуют «чистая» и прикладная, «непрерывная» и дискретная, «не конструктивная» и конструк­тивная, формально-логическая и содержательная математики.

Пожалуй, так же как нет психолога, знающего все отрасли психо­логии, так нет и математика, знающего все отрасли и направле­ния современной математики. Ведь даже энциклопедии и спра­вочники наряду с классическими, традиционными разделами, общими для всех, содержат различные дополнительные, причем отнюдь не новые разделы математических сведений. Обилие и разнообразие математических теорий и методов порождает про­блемы выбора и практического использования математики за ее пределами, в том числе в психологии. Но об этом мы поговорим в последней главе книги.

Абстрактный характер математики, ее независимость от при­роды в широком смысле и позволяют использовать математичес­кие методы в самых разных приложениях. Разумеется, при этом важно, чтобы метод был адекватен объекту, для изучения которо­го применяется.

Для того чтобы завершить рассмотрение общих вопросов, оста­новимся на том, что понимается под математическими методами.

В каждой науке, помимо ее предмета, предполагают существу­ющими особые, свойственные данной науке методы. Так, для со­временной психологии характерным является метод тестов. Ис­пользуемые в ней методы наблюдения, беседы, эксперимента и т.д., о которых пишется в учебниках, не являются специфичными для психологии и широко используются в других науках. Вообще, за редким исключением, современные научные методы универ­сальны и применяются везде, где можно.

Аналогично обстоит дело с математикой. И хотя большинство математиков убеждены в специфичности аксиоматического под­хода, математической индукции и доказательств, на самом деле все эти методы используются и за пределами математики.

Как я уже отмечал, математические объекты существуют в тек­стах и мыслях думающих о них людей в одной, нескольких или всех из пяти основных форм — словесной, графической, табличной, символической и аналитической. Это названия объектов, геомет­рические фигуры или чертежи и графики, различные таблицы, сим­волы объектов, операций и отношений, наконец, различные фор­мулы, которыми выражаются отношения между объектами. Так вот математические методы представляют собой правила или процедуры построения, преобразования, метризации и вы­числения математических объектов—всего четыре основных типа методов. Среди каждого из них есть простые и сложные, как, на­пример, суммирование двух чисел и факторизация корреляцион­ной матрицы. Пятый тип — комбинированный из основных — открывает неограниченные возможности конструирования новых математических методов, необходимых для определенных науч­ных приложений.

Заканчивая, отмечу, что многие методы играют служебную роль в самой математике, как, в частности, доказательства теорем или определенные строгости изложения, так приветствуемые ма­тематиками. Для практических приложений математических ме­тодов за пределами математики, в том числе в психологии, мате­матические строгости и тонкости не нужны: они затеняют суть результатов, в которых математика должна находиться на заднем плане, как, например, логарифмическая основа психофизического закона Вебера—Фехнера.

Вопрос 2. МЕТОДОЛОГИЧЕСКИЕ ВОПРОСЫ ПРИМЕНЕ­НИЯ МАТЕМАТИКИ В ПСИХОЛОГИИ

Маститые психологи, имеющие базовое гуманитарное об­разование, критически относятся к применению математичес­ких методов в психологии, сомневаются в их полезности. Их аргументы таковы: математические методы создавались в на­уках, объекты которых не сравнимы по сложности с психоло­гическими объектами; психология слишком специфична, что бы в ней была польза от математики.

Первый аргумент в определенной мере справедлив. Поэто­му именно в психологии создавались математические методы, специально рассчитанные на сложные объекты, например, кор­реляционный и факторный анализы. Но второй аргумент явно ошибочен: психология не специфичнее многих других наук, где применяется математика. И сама история психологии подтверждает это. Вспомним идеи И. Гербарта и М.-В. Дробиша, да и весь путь развития современной психологии. Он подтверждает расхожую истину: область знания становится наукой, когда на­чинает применять математику.

Остапук Ю. В., Суходольский Г. В. Об индивидных, субъектных и личностных проявленияхиндивидуальнойтревожности//Ананьевскиечтения - 2003. СПб., Изд-во СПбГУ. С. 58-59.

В психологии всегда было много мигрантов из естественных наук, а в XX веке — из наук технических. Неплохо подго­товленные в области математики мигранты, естественно, при­меняли доступную им математику в новой психологической об­ласти, не достаточно учитывая существенную психологическую специфику, которая, конечно, существует в психологии, как и в любой науке. В результате в психологических отраслях появи­лась масса математических моделей, малоадекватных в содер­жательном отношении. Особенно это относится к психомет­рии и инженерной психологии, но и к общей, социальной и другим «популярным» психологическим отраслям.

Малоадекватные математические формализмы отталкива­ют от себя гуманитарно ориентированных психологов и под­рывают доверие к математическим методам. А между тем миг­ранты в психологию из естественных и технических наук уве­рены в необходимости математизации психологии вплоть до такого уровня, когда само существо психики будет выражено математически. При этом считается, что в математике доста­точно методов для психологического использования и психо­логам нужно только выучить математику.

В основе этих воззрений лежит ошибочная, как я считаю, мысль о всесилии математики, о ее способности, так сказать, вооружившись пером и бумагой, открывать новые тайны, по­добно тому, как в физике был предсказан позитрон.

При всем моем уважении и даже любви к математическим методам, должен сказать, что математика не всесильна; она яв­ляется одной из наук, но, благодаря абстрактности своих объек­тов, легко и с пользой применимой в других науках. Действи­тельно , в любой науке полезен расчет, и важно представлять за­кономерности в лаконичной символической форме, использо­вать наглядные схемы и чертежи. Однако, применение мате­матических методов за пределами математики должно приво­дить к утрате математической специфики.

Идущая из глубины веков вера в то, что «книга природы написана на языке математики», идущем от господа Бога — создавшего всего и вся, привела к тому, что и в языке и в мышле­нии ученых закрепились выражения «математические модели», «математические методы» в экономике, биологии, психологии, физике, но как могут существовать математические модели в физике? Ведь в ней должны быть и, конечно, существуют фи­зические модели, построенные с помощью математики. И со­здают их физики, владеющие математикой, или математики, владеющие физикой.

Короче говоря, в математической физике должны быть математико-физические модели и методы, а в математической психологии — математико-психологические. Иначе, в тради­ционном варианте «математических моделей» имеет место ма­тематический редукционизм.

Редукционизм вообще является одной из основ математи­ческой культуры: всегда сводить неизвестную, новую задачу к известной и решать ее апробированными методами. Именно математический редукционизм служит причиной появления малоадекватных моделей в психологии и других науках.

Еще недавно среди наших психологов было распространен­ным мнение: психолога должны формулировать задачи для ма­тематиков, которые смогут их корректно решить. Это мнение явно ошибочное: решать специфические задачи могут лишь спе­циалисты, но являются ли таковыми в психологии математи­ки, — нет, конечно. Рискну утверждать, что математикам также трудно решать психологические задачи, как психологам — за­дачи математические: ведь надо изучать ту научную область, к которой задача относится, а на это годы нужны и еще интерес к «чужой» научной области, в которой иные критерии научных достижений. Так, математику для научной стратификации не­обходимо совершать «математические» открытия—доказывать новые теоремы. Причем же здесь психологические задачи? Их должны решать сами психологи, которым надо научиться ис­пользовать подходящие математические методы. Таким обра­зом, снова возвращаемся к вопросу об адекватности и полезности математических методов в психологии.

Не только в психологии, но в любой науке, полезность ма­тематики состоит в том, что ее методы обеспечивают возмож­ность количественных сравнений, лаконичные символические интерпретации, обоснованность прогнозов и решений, эксп­ликацию правил управления. Но все это — при условии адек­ватности применяемых математических методов.

Адекватность — это соответствие: метод должен соответ­ствовать содержанию, причем соответствовать в том смысле, что бы отображение не математического содержания матема­тическими средствами было гомоморфным. К примеру, обыч­ные множества не адекватны для описания процессов позна­ния: в них не отображается частота необходимых повторений. Адекватными здесь будут лишь мультимножества. Читатель, познакомившийся с содержанием текста предыдущих глав, лег­ко поймет, что рассмотренные математические методы в целом адекватны для психологических приложений, а в деталях адек­ватность нужно оценивать конкретно.

Общее правило таково: если психологический объект харак­теризуется конечным набором свойств, то адекватный метод ото­бразит весь набор, а если, что-то не отобразится, то и адекват­ность снижается. Таким образом, мерой адекватности служит ко­личество отображаемых методом содержательных свойств. При этом важны два обстоятельства: наличие конкурирующих, эк­вивалентных по возможности применения, методов и возмож­ность взаимных вербально-символических, табличных, графи­ческих и аналитических отображений результатов.

Среди конкурирующих методов следует выбирать наибо­лее простые, либо понятные, и желательно проверять результат разными методами. Например, дисперсионным анализом и ма­тематическим планированием эксперимента можно обоснован­но выявлять зависимости в науке.

Не следует ограничиваться одной-двумя из математичес­ких форм, нужно, по видимости (а она всегда существует) использовать их все, создавая определенную избыточность в ма­тематическом описании результатов.

Важнейшим условием конкретного применения математи­ческих методов является, — помимо их понимания, разумеет­ся, — содержательная и формальная интерпретация. В психо­логии следует различать и уметь выполнять четыре вида интер­претаций; психолого-психологические, психолого-математи­ческие, математико-математические и (обратные) математико-психологические. Они организованы в цикл.

Любая научно-исследовательская или практическая задача в психологии сначала подвергается психолого-психологическим интерпретациям, посредством которых от теоретических воз­зрений переходят к операционально определяемым понятиям и эмпирическим процедурам. Затем наступает черед психоло­го-математических интерпретаций, с помощью которых вы­бираются и реализуются математические методы эмпиричес­кого исследования. Полученные данные надо обработать и в процессе обработки осуществляются математико-математичес­кие интерпретации. Наконец, результаты обработки следует интерпретировать содержательно, т. е. выполнить математико-психологическую интерпретацию уровней значимости, аппрок­симированных зависимостей и т. д. Цикл замкнулся, и либо за­дача решена и можно переходить к другой, либо необходимо уточнить предыдущую и повторить исследование. Такова логи­ка действий в применении математики, — и не только в психо­логии, но и в других науках.

И последнее. Нельзя досконально изучить все рассмотрен­ные в этой книге математические методы впрок, раз и навсег­да. Для овладения любым достаточно сложным методам нуж­ны многие десятки, а то и сотни обучающих попыток. Но по­знакомится с методами и попытаться их понять в общем и це­лом нужно впрок, а с деталями можно познакомится в даль­нейшем, по мере надобности.

Вопрос 3. Математическая психология

3.1. Введение

Математическая психология — это раз­дел теоретической психологии, использую­щий для построения теорий и моделей математический аппарат.

«В рамках математической психологии должен осуществляться принцип абстракт­но-аналитического исследования, в кото­ром изучается не конкретное содержание субъективных моделей действительности, а общие формы и закономерности психи­ческой деятельности» [Крылов, 1995].

Объект математической психологии : естественные системы, обладающие пси­хическими свойствами; содержательные психологические теории и математические модели таких систем. Предмет — разра­ботка и применение формального аппарата для адекватного моделирования систем, обладающих психическими свойствами. Метод — математическое моделирование.

Процесс математизации психологии начался с момента ее выделения в экспе­риментальную дисциплину. Этот процесс проходит ряд этапов.

Первый применение математических методов для анализа и обработки резуль­татов экспериментального исследования, а также выведение простых законов (конец XIX в. — начало XX в.). Это время разра­ботки закона научения, психофизического закона, метода факторного анализа.

Второй (40-50-е гг.) — создание моде­лей психических процессов и поведения человека с использованием ранее разрабо­танного математического аппарата.

Третий (60-е гг. по настоящее время) — выделение математической психологии в отдельную дисциплину, основная цель которой — разработка математического аппарата для моделирования психических процессов и анализа данных психологи­ческого эксперимента.

Четвертый этап еще не наступил. Этот период должен характеризоваться станов­лением психологии теоретической и отми­ранием — математической.

Часто математическую психологию отождествляют с математическими мето­дами, что является ошибочным. Математическая психология и математические методы соотносятся друг с другом так же, как теоретическая и экспериментальная психология.

3.2. История развития

Термин «математическая психология» стал применяться с появлением в 1963 г. в США «Руководства по математической психологии» [Handbook, 1963]. В эти же годы здесь начинает издаваться журнал «Journal of Mathematical Psychology».

Проведенный в лаборатории математи­ческой психологии ИП РАН анализ работ позволил выделить основные тенденции развития математической психологии.

В 60—70-е гг. получили широкое рас­пространение работы по моделированию обучения, памяти, обнаружения сигналов, поведения, принятия решений. Для их разработки использовался математический аппарат вероятностных процессов, теории игр, теории полезности и др. Было завер­шено создание математической теории обучения. Наиболее известны модели Р. Буша, Ф. Мостеллера, Г. Бауэра, В. Эс-теса, Р. Аткинсона. (В последующие годы наблюдается снижение количества работ по данной проблематике.) Появляется множество математических моделей по психофизике, например С. Стивенса, Д. Экмана, Ю. Забродина, Дж. Светса, Д. Грина, М. Михайлевской, Р. Льюса (см. разд. 3.1). В работах по моделированию группового и индивидуального поведения, в том числе в ситуации неопределенности, использовались теории полезности, игр, риска и стохастические процессы. Это модели Дж. Неймана, М. Цетлина, В. Кры­лова, А. Тверского, Р. Льюса. В рассматри­ваемый период создавались глобальные математические модели основных психи­ческих процессов.

В период до 80-х гг. появляются пер­вые работы по психологическим измере­ниям: осуществляется разработка методов факторного анализа, аксиоматики и мо­делей измерения, предлагаются различные классификации шкал, ведется работа над созданием методов классификации и гео­метрического представления данных,

строятся модели, основанные на лингвис­тической переменной (Л. Заде).

В 80-е гг. особое внимание уделяется уточнению и развитию моделей, связан­ных с разработкой аксиоматики различных теорий.

В психофизике это: современная теория обнаружения сигналов (Д. Свете, Д. Грин), структуры сенсорных прост­ранств (Ю. Забродин, Ч. Измайлов), слу­чайных блужданий (Р. Льюс, 1986), разли­чения Линка и др.

В области моделирова­ ния группового и индивидуального поведения : модель решения и действия в психомотор­ных актах (Г. Коренев, 1980), модель це­ленаправленной системы (Г. Коренев), «деревья» предпочтения А. Тверского, мо­дели системы знаний (Дж. Грино), веро­ятностная модель научения (А. Дрынков, 1985), модель поведения в диадном взаи­модействии (Т. Савченко, 1986) моделиро­вание процессов поиска и извлечения ин­формации из памяти (Р. Шифрин, 1974), моделирование стратегий принятия реше­ний в процессе обучения (В. Венда, 1982) и др.

В теории измерения:

множество моделей многомерного шкалирования (МШ), в которых просле­живается тенденция к снижению точности описания сложных систем — модели пред­почтения, неметрическое шкалирование, шкалирование в псевдоевклидовом прост­ранстве, МШ на «размытых» множествах (Р. Шепард, К. Кумбс, Д. Краскал, В. Кры­лов, Г Головина, А. Дрынков);

• модели классификации: иерархичес­кие, дендритные, на «размытых» множест­вах (А. Дрынков, Т. Савченко, В. Плюта);

• модели конфирматорного анализа, позволяющие формировать культуру про­ведения экспериментального исследова­ния;

• применение математичеекого моде­лирования в психодиагностике (А. Анастази, П. Клайн, Д. Кендалл, В. Дружинин)

В 90-х гг. глобальные математические модели психических процессов практичес­ки не разрабатываются, однако значительно возрастает количество работ по уточнению и дополнению существующих моделей, продолжает интенсивно развиваться тео­рия измерений, теория конструирования тестов; разрабатываются новые шкалы, более адеквантые реальности (Д. Льюс, П. Саппес, А. Тверски, А. Марли); широко внедряется в психологию синергетический подход к моделированию.

Если в 70-е гг. работы по математичес­кой психологии в основном появлялись в США, то в 80-е наблюдается бурный рост ее развития в России, в настоящее время, к сожалению, заметно снизившийся из-за недостаточного финансирования фунда­ментальной науки.

Наиболее значимые модели появились в 70-е-начале 80-х гг., далее они дополня­лись и уточнялись. В 80-е гг. интенсивно развивалась теория измерений. Эта работа продолжается и сегодня. Особенно важно, что многие методы многомерного анализа получили широкое применение в экспе­риментальных исследованиях; появляется множество специально ориентированных на психологов программ анализа данных психологического тестирования.

В США большое внимание уделяется чисто математическим вопросам модели­рования. В России же, наоборот, матема­тические модели зачастую не обладают достаточной строгостью, что приводит к неадекватному описанию реальности.

Математические модели в психологии. В математической психологии принято выделять два направления: математичес­кие модели и математические методы. Мы нарушили эту традицию, так как считаем, что нет необходимости выделять отдельно методы анализа данных психологического эксперимента. Они являются средством построения моделей: классификации, ла­тентных структур, семантических прост­ранств и др.

3.3. Психологические измерения

В основе применения математических методов и моделей в любой науке лежит измерение. В психологии объектами изме­рения являются свойства системы психики или ее подсистем, таких, как восприятие, память, направленность личности, способ­ности и т.д. Измерение — это приписы­вание объектам числовых значений, отражающих меру наличия свойства у дан­ного объекта.

Назовем три важнейших свойства пси­ хологических измерений.

1. Существование семейства шкал, допускающих различные группы преобра­зований.

2. Сильное влияние процедуры изме­рения на значение измеряемой величины.

3. Многомерность измеряемых психо­логических величин, т. е. существенная их зависимость от большого числа парамет­ров.

В психологических измерениях исполь­зуются различные классификации типов шкал. Тип шкалы определяется природой измеряемой величины.

Общая концепция измерения впервые была в достаточно развитом виде сформу­лирована Д. Скоттом и П. Суппесом. Даль­нейшее развитие она получила в работах П. Суппеса и Дж. Зиннеса, Д. Льюса и Е. Галантера и др. В последнее время об­щая теория измерений интенсивно разви­вается И. Пфанцаглем, а также Д. Льюсом и Л. Неренсом. В этой концепции широко используется понятие реляционной сис­темы (системы с отношениями), введенное А. Тверским.

С. Стивенс пытался создать свою сис­тему шкальных типов, основываясь на понятиях эмпирической операции и ма­тематической структуры. Он различает четыре вида шкал: наименований, поряд­ка, интервалов и отношений.

Типы шкал обусловливаются видом функции f, осуществляющей допустимые преобразования ψ = f (φ).

*Если f — моно­тонная функция, то соответствующая шка­ла является шкалой порядка;

*если f — ли­нейная функция, то соответствующая шкала — это шкала интервалов;

*если f оп­ределяет преобразование подобия, то со­ответствующая шкала — шкала отноше­ний.

К. Кумбс расширяет классификацию Стивенса введением шкал, частично упо­рядоченных и сложных (комбинированных из двух частей: объектов и расстояний). Он различает три основных типа неметричес­ких шкал и девять типов сложных, однако если рассматривать лишь сами объекты, то комбинированные шкалы тождественны номинальным.

Классификация Торгенсона, как и Кумбса, опирается на предположение о том, что шкальные типы следует тракто­вать как формальные математические модели. Его классификация включает следующие типы шкал: порядковые — без начала отсчета и с началом отсчета, ин­тервальные — без начала отсчета и с нача­лом отсчета.

Суппес и Зиннес переосмыслили тео­рию классификации Стивенса в терминах классов числового приписывания: для дифференциации шкал существенны лишь свойства числовых приписываний с точки зрения допустимых преобразований, но никак не эмпирические операции. К. Берка (1987) считает, что вполне достаточно различать метрические и неметрические типы шкал, которые представляют два эмпирико-математических метода шкали­рования и измерения. Таким образом, ин­тервальную шкалу можно трактовать как специфический вариант шкалы порядка, т. е. шкалы неметрического типа.

Американские авторы в публикациях 90-х гг. (см. журнал «Journal of Mathematical Psychology») описывают множество работ по применению теории измерений к раз­работке шкал для ранжирования и выбора альтернатив (В. Malakooty,1991), для из­мерения нетранзитивного аддитивного объединения (P. Fishburn, 1991) и экспе­риментов с использованием попарного сравнения по шкалам отношений (I. Basak, 1992). Полемика вокруг основ измерений не прекращается.

Анализ существующих методов прямых оценок различия показал, что шкалы, с которыми работает испытуемый, не соот­ветствуют природе психологического ме­ханизма, лежащего в основе оценивания. Поэтому был предложен подход, основан­ный на «нечетких» множествах (Л. Заде, 1974). Суть его в том , что используются так называемые «лингвистические» пере­менные вместо числовых переменных или в дополнение к ним; отношения между переменными описываются «нечеткими» («размытыми») высказываниями, а слож­ные отношения описываются «нечеткими» алгоритмами.

Первая — создание теории однородных сред, элементами которых являются уст­ройства, подобные нейронам.

Вторая компьютерная графика, помогающая решать задачи с помощью актуализации образного мышления. Когнитивная интерактивная компьютерная графика является средством воздействия на правополушарное мышле­ние человека в процессе научного твор­чества.

Третья специалисты различных направлений в области ИИ считают важ­ным развитие работ, касающихся представ­лений знаний и манипулирования ими (экспертные системы).

4.4.Нетрадиционные методы моделирования

Моделирование на «размытых» множествах

Нетрадиционный подход к моделиро­ванию связан с приписыванием элементу некоторой числовой оценки, которая не может объясняться объективной или субъ­ективной вероятностью, а трактуется как степень принадлежности элемента к тому или иному множеству. Множество таких элементов называется «нечетким», или «размытым» множеством.

Каждое слово х естественного языка можно рассматривать как сжатое описа­ние нечеткого подмножества М(х) полного множества области рассуждений U, где М(х) есть значение х. В этом смысле весь язык как целое рассматривается в качестве системы, в соответствии с которой нечет­ким подмножествам множества U припи­сываются элементарные или составные символы (т. е. слова, группы слов и пред­ложения). Так, цвет объекта как некото­рую переменную, значения этой переменной (красный, синий, желтый, зеленый и т. д.) можно интерпретировать как символы нечетких подмножеств полного множества всех объектов. В этом смысле цвет явля­ется нечеткой переменной, т. е. перемен­ной, значениями которой являются сим­волы нечетких множеств. Если значения переменных — это предложения в неко­тором специальном языке, то в данном случае соответствующие переменные на­зываются лингвистическими (Л. Заде, Ю. Шрейдер).

Синергетика в психологии

Еще одна альтернатива традиционному математическому аппарату — синергетический подход, в котором математическая идеализация проявляется чувствительностью к начальным условиям и непредсказуе­мостью исхода для системы. Поведение можно описать с помощью апериодических и поэтому непредсказуемых временных ря­дов, не ограничиваясь при моделировании стохастическими процессами. Беспорядок в обществе может предшествовать появ­лению новой структуры, в то время как стохастические системы имеют низкую вероятность порождения интересных структур. Именно апериодические реше­ния детерминированных уравнений, опи­сывающих самоорганизующиеся структу­ры, помогут прийти к пониманию психо­логических механизмов самоорганизации (Фриман, 1992). В этих работах разум рас­сматривается как «странный аттрактор», управляемый уравнением сознания. Мате­матически «странный аттрактор» — это множество точек, к которому приближается траектория после затухания переходных процессов.

В основе большинства традиционных моделей психотерапии лежит концепция равновесия. Согласно синергетическому подходу, разум является нелинейной сис­темой, которая при далеких от равновесия условиях превращается в части сложных аттракторов, а равновесие — лишь пре­дельный случай. Этот тезис развивают тео­ретики психотерапии, выбирая тот или иной аспект теории хаоса. Так, например, выделяется феномен хаотического в психо­физиологической саморегуляции (Step­hen, Franes, 1992) и обнаруживаются ат­тракторы в паттернах семейного взаимо­действия (L. Chamber, 1991).

Вопрос 4. СЛОВНИК к курсу «МАТЕМАТИЧНІ МЕТОДИ В ПСИХОЛОГІЇ»

ВЫБОРКА — группа людей, на которой проводится исследование. В противоположность в. генеральной совокупностью называют множество людей, на которых распространяются результаты исследования. В. является частью генеральной совокупности.

ВЫБОРКА ПРЕДСТАВИТЕЛЬНАЯ - такая выборка (см.), которая произведена по правилам, т. е. отражает специфику генеральной совокупности как по составу, так и по индивидуальным характеристикам включенных в нее людей.

ВЫБОРОЧНАЯ ДИСПЕРСИЯ — дисперсия (см.) или разброс данных, характеризующих выборку (см.).

ВЫБОРОЧНОЕ ОТКЛОНЕНИЕ — корень квадратный из величины дисперсии (см.). Определяется по формуле:

ВЫБОРОЧНОЕ РАСПРЕДЕЛЕНИЕ (в математической статистике) — упорядоченное расположение измеренных в эксперименте или в результате проведенной психодиагностики величин от наименьшей к наибольшей, сопровождаемое данными о каждой величине и частоте ее встречаемости в выборке (см.). В. р. нередко представляется в виде соответствующего графика.

ВЫБОРОЧНОЕ СРЕДНЕЕ — среднее значение некоторой величины, определенное по имеющейся выборке ее частных значений. Устанавливается по формуле:

ГИПОТЕЗА — научно обоснованное, вполне вероятное предположение, требующее, однако, специального доказательств для своего окончательного утверждения в качестве теоретического положения Г провернется на истинность в экспериментальном или эмпирическом научном исследовании.

ГИСТОГРАММА — специальное графическое изображение распределения нескольких дискретных величин в выборке (см.). Представляет собой совокупность расположенных рядом друг с другом и вытянутых вверх прямоугольников или прямоугольных в сечении столбиков, высота которых пропорциональна частоте встречаемости каждого из значений переменной в выборке.

ДИСПЕРСИЯ ВЫБОРОЧНАЯ — математико-статистический показатель разброса экспериментальных или психодиагностических данных, характеризующий среднюю величину отклонения индивидуальных показателей от среднего значения переменной по выборке. Д. определяется по формуле:

ДИСПЕРСИОННЫЙ АНАЛИЗ — совокупность методов математико-статистического анализа, объектом рассмотрения которых являются дисперсии (см.) случайных величин. Д. а. позволяет оценивать и сравнивать между собой дисперсии различных выборок, отвечая на вопросы о том, каковы эти дисперсии, являются они одинаковыми или разными и др.

ИНТЕРВАЛ (в математической статистике) — упорядоченный набор величин, находящихся в заданных числовых границах и характеризуемых их средней величиной (см.).

КОРРЕЛЯЦИОННЫЙ АНАЛИЗ — метод математико-статистического анализа, связанный с вычислением и изучением коэффициентов корреляций (см.) между переменными.

КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ - математико-статистический показатель связи или зависимости, существующей между переменными величинами. Изменяется в пределах от —1 (абсолютная обратно пропорциональная зависимость) через 0 (отсутствие какой-либо зависимости) до +1 (абсолютная прямо пропорциональная зависимость).

КРИТЕРИЙ ФИШЕРА — математико-статистический критерий, пользуясь которым можно судить о сходстве и различиях в дисперсиях (см.) случайных величин.

МАТЕМАТИЧЕСКАЯ СТАТИСТИКА - область современной математики, основанная на теории вероятностей (см.) и занятая поиском законов изменения и способов измерения случайных величин, обоснованием методов расчетов, производимых с такими величинами.

МЕДИАНА — величина, разделяющая ряд упорядоченных значении на две равные по количеству входящих в них значений половины, так что справа и слева от м. оказываются одинаковые количества значений.

МЕТОДЫ СРАВНЕНИЯ ВЫБОРОЧНЫХ ДАННЫХ - методы математической статистики (см.), предполагающие анализ, обобщение и сравнение между собой данных, полученных на некоторой выборке испытуемых или на нескольких разных выборках.

МОДА (в математической статистике) — числовое значение изучаемого признака, наиболее часто встречающееся в изученной выборке (см.).

ОБЪЕКТ ИССЛЕДОВАНИЯ — тот объект, на котором проводится научное исследование. Объектом психологического исследования, например, является человек или группа людей.

ОБЪЕМ ПОНЯТИЯ — класс или классы объектов, явлений и т. п., к которым относится или которые включает в себя данное понятие.

ОПЕРАЦИОНАЛИЗАЦИЯ — требование, предъявляемое к научным понятиям. О. понятия предполагает указание на конкретные операции или действия, выполнив которые человек может убедиться в том, что данное понятие не является пустым, т. е. в том, что включенные в него явления действительно существуют.

РЕГРЕССИОННЫЙ АНАЛИЗ — метод математической статистики, позволяющий свести множество частных зависимостей между отдельными значениями переменных к их непрерывной линейной зависимости. В результате р. а. получают прямую линию, которая наилучшим образом иллюстрирует (аппроксимирует — говоря математическим языком) общий характер зависимости между изучаемыми переменными величинами.

СТАТИСТИКА — термин, имеющий два основных значения:

а) область математических или практических знаний, в которой представлены способы статистического анализа или обобщенные количественные данные о чем-либо;

б) частный показатель, с помощью которого эти данные представляются.

ТЕОРИЯ ВЕРОЯТНОСТЕЙ — раздел современной математики, рассматривающий случайные величины, а также законы, характеризующие множества и отношения случайных величин.

ТОЧНОСТЬ ПСИХОДИАГНОСТИЧЕСКОЙ МЕТОДИКИ - способность данной методики достаточно точно оценивать степень развития у человека тех психологических качеств, для диагностики которых она предназначена. Чем больше различных градаций уровня развития данных качеств позволяет получать методика, тем она точнее.

ФАКТОР — математико-статистическое понятие, означающее общую причину многих случайных изменений совокупности переменных величин, событий и т. п. Ф. выявляется при помощи специальной математической процедуры, называемой факторным анализом (см.).

ФАКТОРНЫЙ АНАЛИЗ — процедура или метод математической статистики, основанный на анализе корреляций случайных величин и направленный на то, чтобы выявлять группы случайных величин, взаимнокоррелирующих друг с другом. Математико-статистическая основа выявляемых таким образом корреляций называется фактором (см.).

Х критерий математико-статистический критерий, на основе которого судят о статистической значимости связей, существующих между двумя или несколькими переменными, часть которых рассматривается как причина, часть — как следствия наблюдаемых изменений.

ЭКСПЕРИМЕНТ — метод научного исследования, предполагающий создание некоторых искусственных (экспериментальных) условий и направленный на выявление причинно-следственных зависимостей, существующих между изучаемыми переменными.

Вопрос 5. СПИСОК РЕКОМЕНДОВАНОЇ ЛІТЕРАТУРИ З КУРСУ

А) Перелік підручників та посібників (основна література)

1. Бурлачук Л.Ф. Словарь-справочник по психодиагностике. –СПб.: Питер Ком, 1999. – 528 с. (Серия «Мастера психологии»).

2. Годфруа Ж. Что такое психология? М.: Мир, 1996. Т 2

3. Куликов Л. В. Психологическое исследование: методические рекомендаций по проведению. - СПб., 1995.

4. Немов Р.С. Психология: Экспериментальная педагогическая психология и психодиагностика. - М., 1999.- Т. 3.

5. Практикум по общей экспериментальной психологии / Под ред. А.А. Крылова. - Л. ЛГУ, 1987.

6. Сидоренко Е.В . Методы математической обработки в психологии. –СПб.: ООО «Речь», 2000. -350 с.

7. Шевандрин Н.И. Психодиагностика, коррекция и развитие личности. - М.: Владос, 1998.-С.123.

8. Суходольский Г.В. Математические методы в психологии. – Харьков: Изд-во Гуманитарный Центр, 2004. – 284 с.

Б) Додаткова література

1. Введение в научное исследование по педагогике / Под ред. В. И. Журавлева. М.: 1988.

2. Гершунский Б.С. Педагогическая прогностика. - К., 1986.

3. Гласс Дж., Стенли Дж. Статические методы в педагогике и психологии - М.: 1976.

4. Грабарь М.И., Краснянская К.А. Применение математической статистики в педагогических исследованиях. Непараметрические методы. - М.: Педагогика, 1977.

5. Закс Л. Статистическое оценивание. - М.: Статистика, 1976.

6. Интерпретация и анализ данных в социологических исследованиях / Под ред. В.Г. Андресикова - М.: Наука, 1987.

7. Клименюк А.В. и др. Методология и методика педагогического исследования. Постановка цели и задач исследования. - К., 1988.

8. Крылов В.Ю. Геометрическое представление данных в психологических исследованиях. - М.: Наука, 1990.

9. Кузьмина Н.В. Методы системного педагогического исследования. - Л., 1980.

10. Методичні рекомендації до виконання дипломних робіт студентами педагогічного інституту. - К., 1986.

11. Михеев В.И. Моделирование и методы в теории измерений в педагогике М., 1987.

12. Скалкова Я. Методология и методы педагогического исследования: Пер. с чеш.-М., 1989.

13. Скаткин М.Н. Методология и методика педагогических исследований: в помощь начинающему исследователю. - М., 1986.

14. Сорокин Н.А. Дипломные работы в педагогических вузах: Уч. пос. для студентов пед. вузов-М., 1986.

В) БІБЛІОГРАФІЯ ПО КУРСУ “МАТЕМАТИЧНІ МЕТОДИ В ПСИХОЛОГІЇ”

1 Алимов Ю.И. Альтернатива методу математической статистики. М.: Знание, 1986. 64 с.

2 Ананьев Б.Г. Человек как предмет познания. Л.:ЛГУ. 1969. 339 с.

3 Ананьев Б.Г. О методах современной психологии // Психодиагностические методы (в комплексном лонгитюдном исследовании студентов). Л.: ЛГУ, 1976. С. 13-35.

4 Андреенков В.Г., Аргунова К.Д. и др. Математические методы анализа и интерпретация социологических данных. // Под ред. В.Г. Андреенкова, Ю.Н. Толстовой. М.: Наука, 1989. 171 с.

5 Артемьева Е.Ю; Мартынов Е.М. Вероятностные методы в психологии. М.: МГУ, 1985. 206 с.

6 Ашмарин И.П.. Васильев Н.Н.. Амбросов ВА. Быстрые методы статистической обработки и планирование экспериментов. Л.: ЛГУ, 1974. 76 с.

7 Бадасова А. Личностные факторы суггестора, способствующие внушающему воздействию. Дипломная работа выпускницы специального факультета социальной психологии СПбГУ. СПб. 1994. 75 с.

8 Бергер Н.А., Логинова Н.А. К проблеме соотношения некоторых содержательных и структурных характеристик интеллекта (по методике Векслера)// Современные психолого-педагогические проблемы высшей школы. Л.: ЛГУ, 1974.-С. 63-66.

9 Берн Э. Игры, в которые играют люди. Психология человеческих взаимоотношений; Люди, которые играют в игры. Психология человеческой судьбы. / Пер. с англ. // Общ. ред. М.С. Мацковского. СПб.: Лениздат, 1992. 400 с.

10 Большев Л. Н.. Смирнов Н.В. Таблицы математической статистики. М.: Наука. Главн. редакция физико-математ. литературы, 1983. 416 с.

11 Бурлачук Л.Ф., Морозов СМ Словарь-справочник по математической диагностике. Киев.: Наук. думка, 1989. 200 с.

12 Ван дер Варден В.Л. Математическая статистика. М., 1960. 434 с.

13 Гайда В.К., Захаров В.П. Психологическое тестирование. Учебное пособие. Л.: ЛГУ, 1982. 101с.

14 Ганзен ВА, Балин В.Д. Теория и методология психологического исследования. Практическое руководство. СПб.: СПбГУ, 1991. 74 с.

15 Геодакян В.А. Дифференциальная смертность и норма реакции мужского и женского пола. Онтогенетическая и филогенетическая пластичность. // Журнал общей биологии, 1974, т.35, №3. С. 376-385.

16 Геодакян В.А. Асинхронная асимметрия (половая и латеральная дифференциация — следствие асинхронной эволюции). //Журнал ВНД, 1993, т.43. Вып.З. С. 543-561.

17 Гласс Дж., Стенли Дж. Статистические методы в педагогике и психологии. / Пер. с англ. под общ. ред. Ю.П. Адлера. М.: Прогресс, 1976. 495 с.

18 Гоголь Н.В. Избранные произведения. М.: ДетГИЗ, 1959. С. 473-500.

19 Грекова И. Методологические особенности прикладной математики на современном этапе ее развития. // Вопросы философии, 1976, №6, С. 104-114.

20 Гублер Е.В. Вычислительные методы анализа и распознавания патологических последствий. Л.: Медицина, 1978. 296 с.

21 Гублер Е.В., Генкин А А. Применение непараметрических критериев статистики в медико-биологических исследованиях. Л.: Медицина, 1973. 142 с.

22 Девятко И.Ф. Диагностическая процедура в социологии. Очерки истории и теории. М.: Наука, 1993. 173 с.

23 Дворяшина М.Д., Пехлецкий И. Д. Основные математические процедуры психодиагностического исследования.// Психодиагностические методы (в комплексном лонгитюдном исследовании студентов). Л.: ЛГУ, 1976. С. 35-51.

24. Доброхотова Т.А., Брагина Н.Н . Левши. М.: Книга, 1994. – 230 с.

25 Езекиэл М., Фокс К.А. Методы анализа корреляций и регрессий (линейных и криволинейных).// Пер. с англ. Л.С. Кучаева. М.: Статистика, 1966. 559 с.

26 Захаров В.П. Применение математических методов в социально-психологических исследованиях. Учебное пособие. Л.: ЛГУ, 1985. 64 с.

27 Ивантер Э.В.. Коросов А.В. Основы биометрии: Введение в статистический анализ биологических явлений и процессов. Учебное пособие. Петрозаводск: ПТУ. 1992. 163 с.

28 Ильин Е.П. Психофизиология физического воспитания. Деятельность и состояния. Учебное пособие для студентов факультетов физического воспитания педагогических институтов. М.: Просвещение, 1980. 199 с.

29 Ильина М.Н. Способность к проявлению терпения при мышечном утомлении как отражение общего волевого фактора. / Психомоторика. Сборник ученых трудов. // Под ред. Б.А. Ашмарина и проф Е.П. Ильина (научн. ред.). Л.: ЛГПИ, 1976. С. 49-50.

30 Кендалл М.Дж., Стюарт А. Статистические алгоритмы в социологических исследованиях. Новосибирск: Наука, 1985. 207 с.

31 Кенуй М.Г. Быстрые статистические вычисления. Упрощенные методы оценивания и проверки. / Пер. с англ. и предисловие Д.А. Астринского. М.: Статистика, 1979. 69 с.

32 Королькова НА. Возможности психологической коррекции у болезненных детей. Дипломная работа выпускницы кафедры социальной психологии факультета психологии СПбГУ. СПб., 1994. 72 с.

33 Кузнецов С .А. Стили реагирования на вербальную агрессию. Дипломная работа выпускника кафедры социальной психологии факультета психологии СПбГУ. СПб., 1991. 33с.

34 Кулева Е.Б. Влияние традиционных и православных текстов внушения на процесс аутогенной тренировки. Дипломная работа выпускницы кафедры социальной психологии факультета психологии СПбГУ. СПб., 1990. 45 с-

35 Курочкин МА„ Сидоренко Е.В., Чураков ЮА. ( Kurochkin М.. Chumkou U., Sidorenko E.). Opportunities for Leadership in Healthcare. General Practiciner» Research Project for Lilly Industries. Manchester: Manchester Business School, 1992. 22 p.

36 Дашков К.В., Поляков Л.Е. Непараметрические методы медико-статистических исследований. / Методологические вопросы санитарной статистики. Ученые записки по статистике, т. IX. М.: Наука, 1965. С. 136-184.

37 Логвиненко А.Д. Измерения в психологии М.: МГУ. 1993. 480 с.

38 Математические методы анализа и интерпретация социологических данных. // Отв. ред. В.Г. Андреенков, Ю.Н. Толстова. М.: Наука, 1989. - 171 с.

39 Математические методы психолого-педагогнческих исследований. Методические рекомендации. СПб.: Образование. 1994. 28 с.

40 Мельников В.М„ Ямпольский Л.Т. Введение в экспериментальную психологию личности. Учебное пособие для слушателей ИПК преподавателей педагогических дисциплин университетов и педагогических институтов. М.: Просвещение, 1985. 319с.

41 Методы современной биометрии. М.: МГУ, 1978. С. 108-179.

42 Митрополъский А.К. Техника статистических вычислений. М.: Наука, Главная редакция физико-математической литературы., 1971. 576 с.

43 Михеев В.Н. Методика получения и обработки экспериментальных данных в психолого-педагогических исследованиях. М.: УДН, 1986. 84 с.

44 Налимов В. В. Теория эксперимента. М.: Наука, 1975.207 с.

45 Налимов В. В., Голикова Т. И. Логические основания планирования эксперимента. Изд. 2-е. М.: Металлургия, 1981.152 с.

46 Нискина Н.П. Непараметрические методы математической статистики и решение задач проверки гипотез./ Проблемы компьютеризации и статистики в прикладных науках. Сборник трудов. М.: ВНИИСИ, 1990. С. 73-89.

47 Носенко И.А. Начала статистики для лингвистов. М.: Высшая школа, 1981. 157с.

48 Оуэн Д.Б. Сборник статистических таблиц. / Пер. с англ. Л.Н. Большева и В.Ф. Котельниковой. Изд. 2-е, исправл. М.: Вычислительный центр АН СССР. 1973. 586 с.

49 Паповян С.С. Математические методы в социальной психологии. М.: Наука, 1983. 343 с.

50 Плохинский НА. Дисперсионный анализ. / Под ред. чл.-корр. АН СССР Н.П. Дубинина. Новосибирск: Сиб. Отд. АН СССР, 1960. 124 с.

51 Плохинскии НА. Биометрия. 2-е изд. М.: МГУ, 1970. 368 с.

52 Пуни А.Ц. Психологические основы волевой подготовки в спорте. Учебное пособие. Л.: ГИФК,1977.48с.

53 Пустыльник Е.И. Статистические методы анализа и обработки наблюдений. М : Наука, 1968. 185с.

54 Рахова М.Э. Личностная предрасположенность к определенным видам страха. Дипломная работа выпускницы кафедры социальной психологии факультета психологии СПбГУ. СПб., 1994. 54 с.

55 Роджерс К. Взгляд на психотерапию. Становление человека. / Пер. с англ. / /Общ. ред. и предисл. Е.И.Исениной. М.: Прогресс, Универс. 1994. 480 с.

56 Рунион Р. Справочник по непараметрической статистике. М.: Финансы и статистика, 1982. 198с.

57 Сидоренко (Маркова) Е.В. Связь мотивации достижения с индивидными и личностными свойствами / Вопросы экспериментальной и прикладной психологии. Сборник аспирантских работ. Л.: ЛГУ, 1980. Деп. в ВНТИ №435-80 от 7 февр. 1980. С. 64-72

58 Сидоренко (Маркова) Е.В. Исследование психодиагностических возможностей проективной методики Хекхаузена. / Личность в системе коллективных отношений. Тезисы докладов Всесоюзной конференции в г.Курске. Курск: 1980. С. 43-45

59 Сидоренко (Маркова) Е.В. Мотивационно-волевые особенности личности как фактор успешной деятельности. Дисс. на соискание учен. степ. канд. психол. наук. Л.: ЛГУ. 1984. 262с.

60 Сидоренко (Маркова) Е.В. Психодраматический и недирективный подходы в групповой работе с людьми. Методические описания и комментарии. СПб.: Центр психологической поддержки учителя, 1992. 72 с.

61 Сидоренко Е.В . Экспериментальная групповая психология. Комплекс "неполноценности" и анализ ранних воспоминаний в концепции Альфреда Адлера. Учебное пособие. СПб.: СПбГУ, 1993. 152 с.

62 Сидоренко Е.В. Опыты реоритационного тренинга. СПб.: Институт тренинга, 1995. 248 с.

63 Сидоренко Е.В.. Дерманова И.Б.. Анисимова О.М„ Витснберг Е.В., Шулыга А.П. Разработка методики отбора и подготовки кадров в представительные органы муниципальной власти. СПб.: Гуманистический и политологический Центр "Стратегия", 1994. 26 с.

64 Сочивко Л.Б.. Якунин В.А. Математические модели в психолого- педагогических исследованиях. Учебное пособие. Л.: ЛГУ, 1988. 68 с.

65 Справочник по прикладной статистике. В 2-х т. Т.2 / Пер. с англ. под ред. Э.Ллойда, У. Ледермана, С.А. Айвазяна, Ю.Н. Тюрина. М.: Финансы и статистика, 1990. 526 с.

66 Стан Н.В. Социально-психологическое исследование стереотипов мужественности. Дипломная работа выпускницы кафедры социальной психологии факультета психологии СПбГУ. СПб., 1992. 58 с.

67 Стивенс С. Математика, измерение и психофизика // Экспериментальная психология (Под ред. С.С. Стивенса). // Пер. с англ под ред. действ, чл. АМН СССР П.К. Анохина, докт. пед. наук В.А. Артемова. М.: Иностранная литература, 1960. т.1. С. 19-92.

68 Суходольский Г.В. Основы математической статистики для психологов. Л.: ЛГУ, 1972. 428 с.

69 Суходольский Г.В. Математико-психологические модели деятельности. СПб.: Петрополис,1994.64 с.

70 Тлегенова Г.А. Влияние агрессивности на проксемические характеристики невербального поведения. Дипломная работа выпускницы кафедры социальной психологии факультета психологии СПбГУ. СПб., 1990. 28 с.

71 Телешова Ю.Н. Логика математического анализа социологических данных. М.: Наука, 1991.112с.

72 Тюрин Ю.Н. Непараметрические методы статистики. М.: Знание, 1978. 64 с.

73 Тюрин Ю.Н., Макаров А.А, Анализ данных на компьютере. // Под ред. В.В. Фигурнова. М.: Финансы и статистика, 1995. 384 с.

74 Урбах В.Ю. Математическая статистика для биологов и медиков. М.: Академия наук СССР. 1963. 323 с.

75 Урбах В.Ю. Биометрические методы. Статистическая обработка опытных данных в биологии, сельском хозяйстве и медицине. М.: Наука, 1964. 415 с.

76 Урбах В.Ю. Статистический анализ в биологических и медицинских исследованиях. М.: Медицина, 1975. 295 с.

77 Фелингер А.Ф. Статистические алгоритмы в социологических исследованиях. Новосибирск: Наука, 1985. 385 с.

78 Холлендер М. Вулф Д.А. Непараметрические методы статистики. / Пер. с англ. под ред. Ю.П. Адлера и Ю.Н. Тюрина М.: Финансы и статистика, 1983. 518с.

79 Чиркина Р.Т. Психодннамические факторы памяти. Дипломная работа выпускницы кафедры социальной психологии факультета психологии СПбГУ. СПб., 1995. 80 с.

80 Шеффс Г. Дисперсионный анализ. М.: Наука, 1980. 512с.

Курс «Математические методы в психологии»

(Материалы для самостоятельного изучения студентам психологам и социальным работникам)

Лекция № 2

СТАТИСТИЧЕСКИЙ АНАЛИЗ

ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

Вопросы:

1. Методы первичной статистической обработки результатов эксперимента

2. Методы вторичной статистической обработки результатов эксперимента

Краткое содержание

Методы первичной статистической обработки результатов эксперимен­та.

Общее представление о методах статистического анализа эксперименталь­ных данных, назначение этих методов. Деление статистических методов на первичные и вторичные. Основные показатели, получаемые в результате пер­вичной обработки экспериментальных данных. Вычисление средней арифме­тической. Определение дисперсии. Установление примерного распределения данных. Определение моды. Характеристика нормального распределения. Вы­числение интервалов.

Методы вторичной статистической обработки результатов эксперимента.

Способы вторичной статистической обработки результатов исследования. Ре­грессионное исчисление. Сравнение средних величин разных выборок. Срав­нение частотных распределений данных. Сравнение дисперсий двух выборок. Установление корреляционных зависимостей и их интерпретация. Понятие о факторном анализе как методе статистической обработки.

Способы табличного и графического представления результатов экспе­римента.

Виды таблиц и их построение. Графическое представление экспери­ментальных данных. Гистограммы и их применение на практике.

Вопрос 1

МЕТОДЫ ПЕРВИЧНОЙ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА

Методами статистической обработки результатов экспери­ мента называются математические приемы, формулы, способы количественных расчетов, с помощью которых показатели, по­ лучаемые в ходе эксперимента, можно обобщать, приводить в си­ стему, выявляя скрытые в них закономерности.

Речь идет о та­ких закономерностях статистического характера, которые су­ществуют между изучаемыми в эксперименте переменными ве­ личинами .

1. Некоторые из методов математико-статистического анализа позволяют вычислять так называемые элементарные матема т ические статистики , характеризующие выборочное распреде­ ление данных , например

*выборочное среднее,

* выборочная диспер­ сия,

* мода,

* медиана и ряд других.

2. Иные методы математической статистики, например

дисперсионный анализ ,

регрессионный ана­лиз, позволяют судить о динамике изменения отдельных статис­ тик выборки.

3. С помощью третьей группы методов , скажем,

*кор­реляционного анализа,

факторного анализа,

методов сравнения выборочныеа данных, можно достоверно судить о статистических связях,

существующих между переменными величинами, кото­рые исследуют в данном эксперименте.

Все методы математико-статистического анализа условно де­ лятся на первичные и вторичные1 .

1 Приводимые здесь определения и высказывания не всегда являются до­статочно строгими с точки зрения теории вероятностей и математической ста­тистики как сложившихся областей современной математики. Это сделано для лучшего понимания данного текста студентами, не подготовленными в облас­ти математики:

Первичными называют мето­ды, с помощью которых можно получить показатели, непосред­ственно отражающие результаты производимых в эксперимен­те измерений.

Соответственно под первичными статистически­ми показателями имеются в виду те, которые применяются в са­мих психодиагностических методиках и являются итогом на­чальной статистической обработки результатов психодиагности­ки.

Вторичными называются методы статистической обработки, с помощью которых на базе первичных данных выявляют скры­тые в них статистические закономерности.

К первичным методам статистической обработки относят , на­пример,

* определение выборочной средней величины,

* выбороч­ной дисперсии,

* выборочной моды и

* выборочной медианы.

В чис­ ло вторичных методов обычно включают

*корреляционный ана­лиз,

*регрессионный анализ,

*методы сравнения первичных ста­тистик у двух или нескольких выборок.

Рассмотрим методы вычисления элементарных математичес­ ких статистик, начав с выборочного среднего.

ВЫБОРОЧНОЕ СРЕДНЕЕ

Выборочное среднее значение как статистический показатель представляет собой среднюю оценку изучаемого в эксперименте психологического качества.

Эта оценка характеризует степень его развития в целом у той группы испытуемых, которая была под­вергнута психодиагностическому обследованию. Сравнивая не­посредственно средние значения двух или нескольких выборок, мы можем судить об относительной степени развития у людей, составляющих эти выборки, оцениваемого качества.

Выборочное среднее определяется при помощи следующей формулы:

где

хср —выборочная средняя величина или среднее арифметичес­кое значение по выборке;

п — количество испытуемых в выбор­ке или частных психодиагностических показателей, на основе ко­торых вычисляется средняя величина;

xk частные значения по­казателей у отдельных испытуемых. Всего таких показателей п, поэтому индекс k данной переменной принимает значения от 1 до п;

— принятый в математике знак суммирования величин тех переменных, которые находятся справа от этого знака.

Выра­жение соответственно означает сумму всех х с индексом k от 1 до n.

Пример. Допустим, что в результате применения психодиаг­ностической методики для оценки некоторого психологическо­го свойства у десяти испытуемых мы получили следующие част­ные показатели степени развитости данного свойства у отдель­ных испытуемых: х1 = 5, х2 = 4, х3 = 5, х4 = 6, х5 = 7, х6 = 3, х7 = 6, х8= 2, х9 = 8, х10 = 4. Следовательно, п = 10, а индекс k меняет свои значения от 1 до 10 в приведенной выше формуле. Для данной выборки среднее значение1 , вычисленное по этой формуле, бу­дет равно:

1 В дальнейшем, как это и принято в математической статистике, с целью сокращения текста мы будем опускать слова «выборочное» и «арифметичес­кое» и просто говорить о «среднем» или «среднем значении».

В психодиагностике и в экспериментальных психолого-пе­дагогических исследованиях среднее, как правило, не вычисля­ ется с точностью, превышающей один знак после запятой, т.е . с большей, чем десятые доли единицы.

В психодиагностических обследованиях большая точность расчетов не требуется и не име­ет смысла, если принять во внимание приблизительность тех оце­нок, которые в них получаются, и достаточность таких оценок для производства сравнительно точных расчетов.

ДИСПЕРСИЯ

Дисперсия как статистическая, величина характеризует, насколько частные значения отклоняются от средней величины в данной выборке.

Чем больше дисперсия, тем больше отклонения или разброс данных. Прежде чем представлять формулу для рас­четов дисперсии, рассмотрим пример. Воспользуемся теми пер­вичными данными, которые были приведены ранее и на основе которых вычислялась в предыдущем примере средняя величи­на. Мы видим, что все они разные и отличаются не только друг от друга, но и от средней величины. Меру их общего отличия от средней величины и характеризует дисперсия. Ее определяют для того, чтобы можно было отличать друг от друга величины, име­ющие одинаковую среднюю, но разный разброс.

Представим се­бе другую, отличную от предыдущей выборку первичных значе­ний, например такую: 5, 4, 5, 6, 5, 6, 5, 4, 5, 5. Легко убедиться в том, что ее средняя величина также равна 5,0. Но в данной вы­борке ее отдельные частные значения отличаются от средней го­раздо меньше, чем в первой выборке. Выразим степень этого отличия при помощи дисперсии, которая определяется по следую­ щей формуле:

где выборочная дисперсия, или просто дисперсия;

выражение, означающее, что для всех xk от перво­го до последнего в данной выборке необходимо вычислить раз­ности между частными и средними значениями, возвести эти раз­ности в квадрат и просуммировать;

п — количество испытуемых в выборке или первичных зна­чений, по которым вычисляется дисперсия.

Определим дисперсии для двух приведенных выше выборок частных значений, обозначив эти дисперсии соответственно ин­дексами 1 и 2:

Мы видим, что дисперсия по второй выборке (0,4) значитель­но меньше дисперсии по первой выборке (3,0). Если бы не было дисперсии, то мы не в состоянии были бы различить данные вы­борки.

ВЫБОРОЧНОЕ ОТКЛОНЕНИЕ

Иногда вместо дисперсии для выявления разброса частных дан­ных относительно средней используют производную от дисперсии величину, называемую выборочное отклонение. Оно равно квадрат­ному корню, извлекаемому из дисперсии, и обозначается тем же

самым знаком, что и дисперсия, только без квадрата—

МЕДИАНА

Медианой называется значение изучаемого признака, кото­рое делит выборку, упорядоченную по величине данного призна­ ка, пополам.

Справа и слева от медианы в упорядоченном ряду остается по одинаковому количеству признаков. Например, для выборки 2, 3,4, 4, 5, 6, 8, 7, 9 медианой будет значение 5, так как слева и справа от него остается по четыре показателя. Если ряд включает в себя четное число признаков, то медианой будет сред­нее, взятое как полусумма величин двух центральных значений ряда. Для следующего ряда 0, 1, 1, 2, 3, 4, 5, 5, 6, 7 медиана будет равна 3,5.

Знание медианы полезно для того, чтобы установить, явля­ется ли распределение частных значений изученного признака симметричным и приближающимся к так называемому нормаль­ ному распределению . Средняя и медиана для нормального рас­пределения обычно совпадают или очень мало отличаются друг от друга.

Если выборочное распределение признаков нормаль­но, то к нему можно применять методы вторичных статистичес­ ких расчетов, основанные на нормальном распределении данных. В противном случае этого делать нельзя, так как в расчеты могут вкрасться серьезные ошибки.

Если в книге по математической статистике, где описывает­ся тот или иной метод статистической обработки, имеются ука­зания на то, что его можно применять только к нормальному или близкому к нему распределению признаков, то необходимо неукоснительно следовать этому правилу и полученное эмпиричес­кое распределение признаков проверять на нормальность .

Если такого указания нет, то статистика применима к любому распре­делению признаков. Приблизительно судить о том, является или не является полученное распределение близким к нормальному, можно, построив график распределения данных, похожий на те, которые представлены на рис. 72 . Если график оказывается бо­лее или менее симметричным, значит, к анализу данных можно применять статистики, предназначенные для нормального рас­пределения. Во всяком случае, допустимая ошибка в расчетах в данном случае будет относительно небольшой.

Приблизительные картины симметричного и несимметрич­ного распределений признаков показаны на рис. 72, где точками т1 и т2 на горизонтальной оси графика обозначены те величины признаков, которые соответствуют медианам, а х1 и х2 те, ко­торые соответствуют средним значениям.

Рис. 72. Графики симметричного и несимметричного распределения признаков: 1 – симметричное распределение (все относящиеся к нему элементарные статистики обозначены с помощь индекса 1); 11 – несимметричное распределение (его первичные статистики отмечены на графике индексом 2).

МОДА

Мода еще одна элементар­ная математическая статистика и характеристика распределе­ния опытных данных. Модой называют количественное зна­чение исследуемого признака, наиболее часто встречающееся в выборке. На графиках, пред­ставленных на рис. 72, моде со­ответствуют самые верхние точки кривых, вернее, те значе­ния этих точек, которые располагаются на горизонтальной оси.

Для симметричных распределений признаков, в том числе для нормального распределения, значения моды совпадают со значениям среднего и медианы. Для других типов распре­делений, несимметричных, это не характерно.

К примеру, в по­следовательности значений признаков 1, 2, 5, 2, 4, 2, 6, 7, 2 модой является значение 2, так как оно встречается чаще других значе­ний — четыре раза.

ИНТЕРВАЛ

Иногда исходных частных первичных данных, которые под­лежат статистической обработке, бывает довольно много, и они требуют проведения огромного количества элементарных ариф­метических операций. Для того чтобы сократить их число и вмес­те с тем сохранить нужную точность расчетов, иногда прибегают к замене исходной выборки частных эмпирических данных на интервалы.

Интервалом называется группа упорядоченных по ве­ личине значений признака, заменяемая в процессе расчетов сред­ ним значением.

Пример. Представим следующий ряд частных признаков: О, 1, 1, 2, 2, 3, 3, 3, 4, 4, 5, 5, 5, 5, 6, 6, 6, 7, 7, 8, 8, 8, 9, 9, 9, 10, 10, 11, 11, 11. Этот ряд включает в себя 30 значений.

Разобьем представ­ленный ряд на шесть подгрупп по пять признаков в каждом.

*Пер­ вая подгруппа включит в себя первые пять цифр,

*вторая — сле­дующие пять и т.д.

Вычислим средние значения для каждой из пяти образованных подгрупп чисел. Они соответственно будут равны 1,2; 3,4; 5,2; 6,8; 8,6; 10,6.

Таким образом, нам удалось свести исходный ряд, включающий тридцать значений, к ряду, содер­жащему всего шесть значений и представленному средними ве­личинами. Это и будет интервальный ряд, а проведенная проце­дура — разделением исходного ряда на интервалы.

Теперь все статистические расчеты мы можем производить не с исходным рядом признаков, а с полученным интервальным рядом, и ре­зультаты в равной степени будут относиться к исходному ряду. Однако число производимых в ходе расчетов элементарных арифметических операций будет гораздо меньше, чем количест­во тех операций, которые с этой же целью пришлось бы проделать в отношении исходного ряда признаков.

На практике, со­ставляя интервальный ряд, рекомендуется руководствоваться следующим правилом : если в исходном ряду признаков больше чем тридцать, то этот ряд целесообразно разделить на пять-шесть интервалов и в дальнейшем работать только с ними.

Для проверки сказанного проведем пробное вычисление сред­него значения по приведенному выше ряду, составляющему трид­цать чисел, и по ряду, включающему только интервальные средние значения. Полученные цифры с точностью до двух знаков после запятой будут соответственно равны 5,97 и 5,97, т.е. явля­ются одинаковыми.

Вопрос 2 МЕТОДЫ ВТОРИЧНОЙ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА

С помощью вторичных методов статистической обработки экспериментальных данных непосредственно проверяются, до­казываются или опровергаются гипотезы, связанные с экспери­ментом.

Эти методы, как правило, сложнее, чем методы первич­ной статистической обработки, и требуют от исследователя хо­рошей подготовки в области элементарной математики и статис­тики.

Обсуждаемую группу методов можно разделить на несколь­ ко подгрупп:

  1. Регрессионное исчисление.
  2. Методы сравнения между собой двух или нескольких элементарных статистик (средних, дисперсий и т.п.), относящихся к разным выборкам.
  3. Методы установления статистических взаимосвязей между пе­ременными, например их корреляции друг с другом.
  4. Методы выявления внутренней статистической структуры эмпирических данных (например, факторный анализ).

Рассмотрим каждую из выделенных подгрупп методов вторичной статистической обра­ботки на примерах.

1. Регрессионное исчисление — это метод математической ста­тистики, позволяющий свести частные, разрозненные данные к некоторому линейному графику, приблизительно отражающе­му их внутреннюю взаимосвязь, и получить возможность по зна­чению одной из переменных приблизительно оценивать вероят­ное значение другой переменной.

Воспользуемся для графического представления взаимосвязан­ных значений двух переменных х и у точками на графике (рис, 73). Поставим перед собой задачу: заменить точки на графике ли­нией прямой регрессии, наилучшим образом представляющей взаимосвязь, существующую между данными переменными. Иными словами, задача заключается в том, чтобы через скопле­ние точек, имеющихся на этом графике, провести прямую линию,

Рис. 73. Прямая регрессии Y no X. хср и уср — средние значения переменных. От­клонения отдельных значений от линии регрессии обозначены вертикальны­ми пунктирными линиями. Величина у,-у является отклонением измеренно­го значения переменной yj от оценки, а величина у - у является отклонением оценки от среднего значения (Цит. по: Шерла К. Факторный анализ. М., 1980. С. 23).

пользуясь которой по значению одной из переменных, х или у, можно приблизительно судить о значении другой переменной. Для того чтобы решить эту задачу, необходимо правильно найти коэффициенты а и Ь в уравнении искомой прямой:

у = ах + b .

Это уравнение представляет прямую на графике и называет­ся уравнением прямой регрессии.

Формулы для подсчета коэффициентов а и Ь являются сле­дующими:

где х i у i - частные значения переменных X и Y , которым соответствуют точки на графике;

средние значения тех же самых переменных;

п — число первичных значений или точек на графике.

Для сравнения выборочных средних величин, принадлежа­щих к двум совокупностям данных, и для решения вопроса о том, отличаются ли средние значения статистически достоверно друг от друга, нередко используют t-критерий Стъюдента. Его основ­ная формула выглядит следующим образом:

где

х1 — среднее значение переменной по одной выборке данных;

х2 среднее значение переменной по другой выборке данных;

т1 и т2 интегрированные показатели отклонений частных значений из двух сравниваемых выборок от соответствующих им средних величин.

т1 и т2 в свою очередь вычисляются по следующим формулам:

где — выборочная дисперсия первой переменной (по первой выборке);

— выборочная дисперсия второй переменной (по второй выборке);

п] число частных значений переменной в первой выборке;

п2 число частных значений переменной по второй выборке.

После того как при помощи приведенной выше формулы вы­числен показатель t , по таблице 32 для заданного числа степеней свободы, равного n 1 + п2 - 2, и избранной вероятности допусти­мой ошибки1 находят нужное табличное значение t и сравнива-

1 Степени свободы и вероятность допустимой ошибки — специальные математико-статистические термины, содержание которых мы здесь не будем рас­сматривать.

Таблица 32

Критические значения t-критерия Стъюдента

для заданного числа степеней свободы и вероятностей допустимых ошибок, равных 0,05; 0,01 и 0,001

Число

степеней

свободы

(n1 + n2 -2)

Вероятность допустимой ошибки

0,05

0,01

0,001

Критические значения показателя t

4

2,78

5,60

8,61

5

2,58

4,03

6,87

6

2,45

3,71

5,96

7

2,37

3,50

5,41

8

2,31

3,36

5,04

9

2,26

3,25

4,78

10

2,23

3,17

4,59

11

2,20

3,11

4,44

12

2,18

3,05

4,32

13

2,16

3,01

4,22

14

2,14

2,98

4,14

15

2,13

2,96

4,07

16

2,12

2,92

4,02

17

2,11

2,90

3,97

18

2,10

2,88

3,92

19

2,09

2,86

3,88

20

2,09

2,85

3,85

21

2,08

2,83

3,82

22

2,07

2,82

3,79

23

2,07

2,81

3,77

24

2,06

2,80

3,75

25

2,06

2,79

3,73

26

2,06

2,78

3,71

27

2,05

2,77

3,69

28

2,05

2,76

3,67

29

2,05

2,76

3,66

30

2,04

2,75

3,65

40

2,02

2,70

3,55

50

2,01

2,68

3,50

60

2,00

2,66

3,46

80

1,99

2,64

3,42

100

1,98

2,63

3,39

ют с ними вычисленное значение t . Если вычисленное значение t больше или равно табличному, то делают вывод о том, что срав­ниваемые средние значения из двух выборок действительно статистически достоверно различаются с вероятностью допустимой ошибки, меньшей иди равной избранной. Рассмотрим процеду­ру вычисления t -критерия Стъюдента и определения на его ос­нове разницы в средних величинах на конкретном примере.

Допустим, что имеются следующие две выборки эксперимен­тальных данных: 2, 4, 5, 3, 2, 1, 3, 2, 6, 4 и 4, 5, 6, 4, 4, 3, 5, 2, 2, 7.

Средние значения по этим двум выборкам соответственно рав­ны 3,2 и 4,2. Кажется, что они существенно друг от друга отлича­ются. Но так ли это и насколько статистически достоверны эти различия? На данный вопрос может точно ответить только ста­тистический анализ с использованием описанного статистичес­кого критерия. Воспользуемся этим критерием.

Определим сначала выборочные дисперсии для двух срав­ниваемых выборок значений:

Поставим найденные значения дисперсий в формулу для под-

счета т и t и вычислим показатель t

Сравним его значение с табличным для числа степеней сво­боды 10+10-2 = 18. Зададим вероятность допустимой ошибки, равной 0,05, и убедимся в том, что для данного числа степеней свободы и заданной вероятности допустимой ошибки значение t должно быть не меньше чем 2,10. У нас же этот показатель ока­зался равным 1,47, т.е. меньше табличного. Следовательно, ги­потеза о том, что выборочные средние, равные в нашем случае 3,2 и 4,2, статистически достоверно отличаются друг от друга, не подтвердилась, хотя на первый взгляд казалось, что такие раз­личия существуют.

Вероятность допустимой ошибки, равная и меньшая чем 0,05, считается достаточной для научно убедительных выводов. Чем меньше эта вероятность, тем точнее и убедительнее делаемые вы­воды. Например, избрав вероятность допустимой ошибки, равную 0,05, мы обеспечиваем точность расчетов 95% и допускаем ошибку, не превышающую 5%, а выбор вероятности допустимой ошибки 0,001 гарантирует точность расчетов, превышающую 99,99%, или ошибку, меньшую чем 0,01%.

Описанная методика сравнения средних величин по крите­рию Стъюдента в практике применяется тогда, когда необходи­мо, например, установить, удался или не удался эксперимент, оказал или не оказал он влияние на уровень развития того пси­хологического качества, для изменения которого предназначал­ся. Допустим, что в некотором учебном заведении вводится но­вая экспериментальная программа или методика обучения, рас­считанная на то, чтобы улучшить знания учащихся, повысить уровень их интеллектуального развития. В этом случае выясня­ется причинно-следственная связь между независимой перемен­ной — программой или методикой и зависимой переменной — знаниями или уровнем интеллектуального развития. Соответ­ствующая гипотеза гласит: «Введение новой учебной програм­мы или методики обучения должно будет существенно улучшить знания или повысить уровень интеллектуального развития уча­щихся».

Предположим, что данный эксперимент проводится по схе­ме, предполагающей оценки зависимой переменной в начале и в конце эксперимента. Получив такие оценки и вычислив средние по всей изученной выборке испытуемых, мы можем воспользо­ваться критерием Стъюдента для точного установления нали­чия или отсутствия статистически достоверных различий меж­ду средними до и после эксперимента. Если окажется, что они действительно достоверно различаются, то можно будет сделать определенный вывод о том, что эксперимент удался. В против­ном случае нет убедительных оснований для такого вывода даже в том случае, если сами средние величины в начале и в конце эксперимента по своим абсолютным значениям различны.

Иногда в процессе проведения эксперимента возникает спе­циальная задача сравнения не абсолютных средних значений не­которых величин до и после эксперимента, а частотных, напри­мер процентных, распределений данных. Допустим, что для экс­периментального исследования была взята выборка из 100 учащихся и с ними проведен формирующий эксперимент. Предпо­ложим также, что до эксперимента 30 человек успевали на «удов­летворительно», 30 — на «хорошо», а остальные 40 — на «отлич­но». После эксперимента ситуация изменилась. Теперь на «удов­летворительно» успевают только 10 учащихся, на «хорошо» — 45 учащихся и на «отлично» — остальные 45 учащихся. Можно ли, опираясь на эти данные, утверждать, что формирующий экс­перимент, направленный на улучшение успеваемости, удался?

Для ответа на данный вопрос можно воспользоваться статис­тикой, называемой χ2 -критерий («хи-квадрат критерий»). Его формула выглядит следующим образом:

где Pk —. частоты результатов наблюдений до эксперимента;

Vk — частоты результатов наблюдений, сделанных после экс­перимента;

т — общее число групп, на которые разделились результаты наблюдений.

Воспользуемся приведенным выше примером для того, что­бы показать, как работает хи-квадрат критерий. В данном при­мере переменная Рк принимает следующие значения: 30%, 30%, 40%, а переменная Vk такие значения: 10%, 45%, 45%.

Подставим все эти значения в формулу для %2 и определим его величину:

Воспользуемся теперь таблицей 33, где для заданного числа степеней свободы можно выяснить степень значимости образо­вавшихся различий до и после эксперимента в распределении оценок. Полученное нами значение χ2 — 21,5 больше соответст­вующего табличного значения т - 1 = 2 степеней свободы, со­ставляющего 13,82 при вероятности допустимой ошибки мень­ше чем 0,001. Следовательно, гипотеза о значимых изменениях, которые произошли в оценках учащихся в результате введения новой программы или новой методики обучения,

Таблица 33

Граничные (критические) значения c 2 -критерия,

соответствующие разным вероятностям допустимой ошибки

и разным степеням свободы

Число степеней свободы (m-1)

Вероятность допустимой ошибки

0,05

0,01

0,001

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

3,84

5,99

7,81

9,49 11,07

12,59 14,07 15,51 16,92 18,31 19,68 21,03 22,36 23,68 25,00

6,64

9,21 11,34 13,28 15,09 16,81 18,48 20,09 21,67 23,21 24.72 26,05 27,69 29,14 30,58

10,83 13,82 16,27 18,46 20,52 22,46 24,32 26,12 27.88 29,59 31,26 32,91 34,53 36,12 37,70

экспериментально подтвердилась: успеваемость значительно улучшилась, и это мы можем утверждать, допуская ошибку, не превышающую 0,001%.

Иногда в психолого-педагогическом эксперименте возника­ет необходимость сравнить дисперсии двух выборок для того, чтобы решить, различаются ли эти дисперсии между собой. До­пустим, что проводится эксперимент, в котором проверяется ги­потеза о том, что одна из двух предлагаемых программ или ме­тодик обучения обеспечивает одинаково успешное усвоение зна­ний учащимися с разными способностями, а другая программа или методика этим свойством не обладает. Демонстрацией спра­ведливости такой гипотезы было бы доказательство того, что ин­дивидуальный разброс оценок учащихся по одной программе или методике больше (или меньше), чем индивидуальный разброс оценок по другой программе или методике.

Критерий Фишера

Подобного рода задачи решаются, в частности, при помощи критерия Фишера. Его формула выглядит следующим образом:

где n 1 количество значения признака в первой из сравнивае­мых выборок;

п2 — количество значений признака во второй из сравниваемых выборок;

(п 1 1, п2 1) — число степеней свобо­ды;

— дисперсия по первой выборке;

— дисперсия по вто­рой выборке.

Вычисленное с помощью этой формулы значение F-критерия сравнивается с табличным (табл. 34), и если оно превосхо­дит табличное для избранной вероятности допустимой ошибки и заданного числа степеней свободы, то делается вывод о том, что гипотеза о различиях в дисперсиях подтверждается. В про­тивоположном случае такая гипотеза отвергается и дисперсии считаются одинаковыми1 .

Таблица 34

Граничные значения F-критерия для вероятности допустимой ошибки 0,05 и числа степеней свободы n1 и n2

n2 n1

3

4

5

6

8

12

16

24

50

3

9,28

9,91

9,01

8,94

8,84

8,74

8,69

8,64

8,58

4

6,59

6,39

6,26

6,16

6,04

5,91

5,84

5,77

5,70

5

5,41

5,19

5,05

4,95

4,82

4,68

4,60

4,58

4,44

6

4,76

4,53

4,39

4,28

4,15

4,00

3,92

3,84

3,75

8

4,07

3,84

3,69

3,58

3,44

3,28

3,20

3,12

3,03

12

3,49

3,26

3,11

3,00

2,85

2,69

2,60

2,50

2,40

16

3,24

3,0

2,85

2,74

2,59

2,42

2,33

2,24

2,13

24

3,01

2,78

2,62

2,51

2,36

2,18

2,09

1,98

1,86

50

2,79

2,56

2,40

2,29

2,13

1,95

1,85

1,74

1,60

1. Если отношение выборочных дисперсий в формуле F-критерия оказы­вается меньше единицы, то числитель и знаменатель в этой формуле меняют местами и вновь определяют значения критерия.

Примечание. Таблица для граничных значений F-распреде­ления приведена в сокращенном виде. Полностью ее можно найти в справочниках по математической статистике, в частности в тех, которые даны в списке дополнительной литературы представленной в Теме № 1..

Пример.

Сравним дисперсии следующих двух рядов цифр с целью определения статистически достоверных различий меж­ду ними.

Первый ряд: 4,6,5,7,3,4,5,6.

Второй ряд: 2,7,3,6,1,8,4,5.

Средние значения для двух этих рядов соответственно рав­ны: 5,0 и 4,5. Их дисперсии составляют: 1,5 и 5,25. Частное от деления большей дисперсии на меньшую равно 3,5. Это и есть искомый показатель F . Сравнивая его с табличным граничным значением 3,44, приходим к выводу о том, что дисперсии двух сопоставляемых выборок действительно отличаются друг от дру­га на уровне значимости более 95% или с вероятностью допусти­мой ошибки не более 0,05%.

МЕТОД КОРЕЛЛЯЦИЙ

Следующий метод вторичной статистической обработки, по­средством которого выясняется связь или прямая зависимость между двумя рядами экспериментальных данных, носит назва­ние метод корреляций . Он показывает, каким образом одно яв­ление влияет на другое или связано с ним в своей динамике. По­добного рода зависимости существуют, к примеру, между вели­чинами, находящимися в причинно-следственных связях друг с другом. Если выясняется, что два явления статистически досто­верно коррелируют друг с другом и если при этом есть уверен­ность в том, что одно из них может выступать в качестве причи­ны другого явления, то отсюда определенно следует вывод о на­личии между ними причинно-следственной зависимости.

Имеется несколько разновидностей данного метода:

*линей­ный,

*ранговый,

*парный и

*множественный.

Линейный корреля­ционный анализ позволяет устанавливать прямые связи между переменными величинами по их абсолютным значениям. Эти связи графически выражаются прямой линией, отсюда название «линейный».

Ранговая корреляция определяет зависимость не между абсолютными значениями переменных, а между поряд­ковыми местами, или рангами, занимаемыми ими в упорядочен­ном по величине ряду.

Парный корреляционный анализ вклю­чает изучение корреляционных зависимостей только между парами переменных, а множественный , или многомерный, — меж­ду многими переменными одновременно.

Распространенной в прикладной статистике формой многомерного корреляционно­го анализа является факторный анализ.

На рис. 74 в виде множества точек представлены различные виды зависимостей между двумя переменными X и У (различ­ные поля корреляций между ними).

На фрагменте рис. 74, отмеченном буквой А, точки случай­ным образом разбросаны по координатной плоскости. Здесь по величине X нельзя делать какие-либо определенные выводы о величине Y . Если в данном случае подсчитать коэффициент кор­реляции, то он будет равен 0, что свидетельствует о том, что до­стоверная связь между X и У отсутствует (она может отсутство­вать и тогда, когда коэффициент корреляции не равен 0, но бли­зок к нему по величине).

На фрагменте Б рисунка все точки ле­жат на одной прямой, и каждому отдельному значению перемен­ной X можно поставить в соответствие одно и только одно зна­чение переменной У, причем, чем больше X , тем больше У. Такая связь между переменными X и У называется прямой, и если это прямая, соответствующая уравнению регрессии, то связанный с ней коэффициент корреляции будет равен +1. (Заметим, что в жизни такие случаи практически не встречаются; коэффициент корреляции почти никогда не достигает величины единицы.)

На фрагменте В рисунка коэффициент корреляции также бу­дет равен единице, но с отрицательным знаком: -1. Это означает обратную зависимость между переменными X и У, т.е., чем боль­ше одна из них, тем меньше другая.

На фрагменте Г рисунка точки также разбросаны не случай­но, они имеют тенденцию группироваться в определенном на­правлении. Это направление приближенно может быть представ­лено уравнением прямой регрессии.

Такая же особенность, но с противоположным знаком, характерна для фрагмента Д . Соот­ветствующие этим двум фрагментам коэффициенты корреляции приблизительно будут равны +0,50 и -0,30. Заметим, что кру­тизна графика, или линии регрессии, не оказывает влияния на величину коэффициента корреляции.

Рис. 74. Схематическое представление различных корреляционных зависи­мостей с соответствующими значениями коэффициента линейной корреля­ции (цит. по: Иберла К. Факторный анализ. М,, 1980).

Наконец, фрагмент Е дает коэффициент корреляции, равный или близкий к 0, так как в данном случае связь между перемен­ными хотя и существует, но не является линейной.

Коэффициент линейной корреляции определяется при по­мощи следующей формулы:

где rxy коэффициент линейной корреляции;

х, у - средние выборочные значения сравниваемых величин;

х i i частные выборочные значения сравниваемых величин;

п — общее число величин в сравниваемых рядах показателей;

дисперсии, отклонения сравниваемых величин от

средних значений.

Пример. Определим коэффициент линейной корреляции между следующими двумя рядами показателей.

Ряд 1: 2, 4, 4, 5, 3, б, 8.

Ряд II: 2, 5, 4, 6, 2, 5, 7.

Средние значения этих двух рядов соответственно равны 4,6 и 4,4.

Их дисперсии составляют следую­щие величины: 3,4 и 3,1. Подставив эти данные в приведенную выше формулу коэффициента линейной корреляции, получим следующий результат: 0,92. Следовательно, между рядами дан­ных существует значимая связь, причем довольно явно выражен­ная, так как коэффициент корреляции близок к единице. Дейст­вительно, взглянув на эти ряды цифр, мы обнаруживаем, что большей цифре в одном ряду соответствует большая цифра в дру­гом ряду и, наоборот, меньшей цифре в одном ряду соответству­ет примерно такая же малая цифра в другом ряду.

К коэффициенту ранговой корреляции в психолого-педаго­гических исследованиях обращаются в том случае, когда при­знаки, между которыми устанавливается зависимость, являют­ся качественно различными и не могут быть достаточно точно оценены при помощи так называемой интервальной измеритель­ной шкалы.

Интервальной называют такую шкалу, которая по­зволяет оценивать расстояния между ее значениями и судить о том, какое из них больше и насколько больше другого.

Напри­ мер , линейка, с помощью которой оцениваются и сравниваются длины объектов, является интервальной шкалой, так как, поль­зуясь ею, мы можем утверждать, что расстояние между двумя и шестью сантиметрами в два раза больше, чем расстояние между шестью и восемью сантиметрами. Если же, пользуясь некоторым измерительным инструментом, мы можем только утверждать, что одни показатели больше других, но не в состоянии сказать на сколько, то такой измерительный инструмент называется не ин­тервальным, а порядковым .

Большинство показателей, которые получают в психолого-педагогических исследованиях, относятся к порядковым , а не к интервальным шкалам (например, оценки типа «да», «нет», «ско­рее нет, чем да» и другие, которые можно переводить в баллы), поэтому коэффициент линейной корреляции к ним неприменим . В этом случае обращаются к использованию коэффициента ран­говой корреляции, формула которого следующая:

где Rs — коэффициент ранговой корреляции по Спирмену;

di разница между рангами показателей одних и тех же ис­пытуемых в упорядоченных рядах;

п — число испытуемых или цифровых данных (рангов) в кор­релируемых рядах.

Пример. Допустим, что экспериментатора интере­сует, влияет ли интерес учащихся к учебному предмету на их успеваемость. Предположим, что с помощью некоторой психо­диагностической методики удалось измерить величину интере­са к учению и выразить его для десяти учащихся в следующих цифрах: 5, 6, 7, 8, 2, 4, 8, 7, 2, 9. Допустим также, что при помощи другой методики были определены средние оценки этих же уча­щихся по данному предмету, оказавшиеся соответственно рав­ными: 3,2; 4,0; 4,1; 4,2; 2,5; 5,0; 3,0; 4,8; 4,6; 2,4.

Упорядочим оба ряда оценок по величине цифр и припишем каждому из учащихся по два ранга; один из них указывает на то, какое место среди остальных данных ученик занимает по успе­ваемости, а другой — на то, какое место среди них же он занима­ет по интересу к учебному предмету. Ниже приведены ряды цифр, два из которых (первый и третий) представляют исходные данные, а два других (второй и четвертый) — соответствующие ранги1 :

2-1,5

2,4-1

2-1,5

2,5-2

4-3

3,0-3

5-4

3,2-4

6-5

4,0-5

7-6,5

4,1-6

7-6,5

4,2-7

8-8,5

4,6-8

9-10

5,0-10

Определив сумму квадратов различий в рангах (∑d2 i ) и под­ставив нужное значение в числитель формулы, получаем, что ко­эффициент ранговой корреляции равен 0,97, т.е. достаточно вы­сок, что и говорит о том, что между интересом к учебному пред­мету и успеваемостью учащихся действительно существует ста­тистически достоверная зависимость.

Однако по абсолютным значениям коэффициентов корреля­ции не всегда можно делать однозначные выводы о том, являют­ся ли они значимыми, т.е. достоверно свидетельствуют о суще­ствовании зависимости между сравниваемыми переменными. Может случиться так, что коэффициент корреляции, равный 0,50, не будет достоверным, а коэффициент корреляции, составивший 0,30, — достоверным. Многое в решении этого вопроса зависит от того, сколько показателей было в коррелируемых друг с дру­гом рядах признаков: чем больше таких показателей, тем мень­шим по величине может быть статистически достоверный коэф­фициент корреляции.

В табл. 35 представлены критические значения коэффици­ентов корреляции для различных степеней свободы.

1 Если исходные данные, которые ранжируются, одинаковы, то и их ранги также будут одинаковыми. Они получаются путем суммирования и деления пополам тех рангов, которые соответствуют этим данным.

Таблица 35

Критические значения коэффициентов корреляции

для различных степеней свободы ( n - 2) и разных вероятностей

допустимых ошибок

Число

степеней

свободы

Уровень значимости

0,05

0,01

0,001

2

0,9500

0,9900

0,9900

3

8783

9587

9911

4

8114

9172

9741

5

0,7545

0,8745

0,9509

6

7067

8343

9249

7

6664

7977

8983

8

6319

7646

8721

9

6021

7348

8471

10

0,5760

0,7079

0,8233

И

5529

6833

8010

12

5324

6614

7800

13

5139

6411

7604

14

4973

6226

7419

15

0,4821

0,6055

0,7247

16

4683

5897

7084

17

4555

5751

6932

18

4438

5614

6788

19

4329

5487

6625

20

0,4227

0,5368

0,6524

21

4132

5256

6402

22

4044

5151

6287

23

3961

5052

6177

24

3882

4958

6073

25

0,3809

0,4869

0,5974

26

3739

4785

5880

27

3673

4705

5790

28

3610

4629

5703

29

3550

4556

5620

30

0,3494

0,4487

0,5541

31

3440

4421

5465

32

3388

4357

5392

33

0,3338

0,4297

0,5322

34

3291

4238

5255

35

0,3246

0,4182

0,5189

36

3202

4128

5126

37

3160

4076

5066

38

3120

4026

5007

39

3081

3978

4951

40

0,3044

0,3932

0,4896

(В данном случае степенью свободы будет число, равное п — 2, где п — ко­личество данных в коррелируемых рядах.) Заметим, что значи­мость коэффициента корреляции зависит и от заданного уров­ня значимости или принятой вероятности допустимой ошибки в расчетах. Если, к примеру, коррелируется друг с другом два ря­да цифр по 10 единиц в каждом и получен коэффициент корре­ляции между ними, равный 0,65, то он будет значимым на уров­не 0,95 (он больше критического табличного значения, состав­ляющего 0,6319 для вероятности допустимой ошибки 0,05, и меньше критического значения 0,7646 для вероятности допусти­мой ошибки 0,01).

Метод множественных корреляций в отличие от метода пар­ных корреляций позволяет выявить общую структуру корреля­ционных зависимостей, существующих внутри многомерного экспериментального материала, включающего более двух пере­менных, и представить эти корреляционные зависимости в виде некоторой системы.

ФАКТОРНЫЙ АНАЛИЗ

Один из наиболее распространенных вариантов этого мето­да — факторный анализ — позволяет определить совокупность внутренних взаимосвязей, возможных причинно-следственных связей, существующих в экспериментальном материале. В ре­зультате факторного анализа обнаруживаются так называемые факторы причины, объясняющие множество частных (пар­ных) корреляционных зависимостей.

Фактор — математико-статистическое понятие. Будучи пере­веденным на язык психологии (эта процедура называется содер­жательной или психологической интерпретацией факторов), он становится психологическим понятием. Например, в известном 16-факторном личностном тесте Р. Кеттела, который подробно рас­сматривался в первой части книги, каждый фактор взаимно одно­значно связан с определенными чертами личности человека.

С помощью выявленных факторов объясняют взаимозави­симость психологических явлений. Поясним сказанное на при­мере. Допустим, что в некотором психолого-педагогическом экс­перименте изучалось взаимовлияние таких переменных, как ха­рактер, способности, потребности и успеваемость учащихся. Предположим далее, что, оценив каждую из этих переменных у достаточно представительной выборки испытуемых и подсчитав коэффициенты парных корреляций между всевозможными па­рами данных переменных, мы получили следующую матрицу ин­теркорреляций (в ней справа и сверху цифрами обозначены в пе­речисленном выше порядке изученные в эксперименте переменные, а внутри самого квадрата показаны их корреляции друг с другом; поскольку всевозможных пар в данном случае меньше, чем клеток в матрице, то заполнена только верхняя часть матри­цы, расположенная выше ее главной диагонали).

Анализ корреляционной матрицы показывает, что пе­ременная 1 (характер) значи­мо коррелирует с переменны­ми 2 и 3 (способности и по­требности). Переменная 2 (способности) достоверно коррелирует с переменной 3 (потребности), а переменная 3 (потребности) — с перемен­ной 4 (успеваемость). Факти­чески из шести имеющихся в матрице коэффициентов корреля­ции четыре являются достаточно высокими и, если предполо­жить, что они определялись на совокупности испытуемых, пре­вышающей 10 человек, — значимыми.

1

2

3

4

1

0,82

0,50

0,04

2

0,40

0,24

3

0,75

4

Зададим некоторое правило умножения столбцов цифр на стро­ки матрицы: каждая цифра столбца последовательно умножается на каждую цифру строки и результаты парных произведений за­писываются в строку аналогичной матрицы. Пример: если по это­му правилу умножить друг на друга три цифры столбца и строки, представленные в левой части матричного равенства, то получим матрицу, находящуюся в правой части этого же равенства:

2

X

2

3

4

=

4

6

8

3

6

9

12

4

8

12

16

Задача факторного анализа по отношению к только что рас­смотренной является как бы противоположной. Она сводится к тому, чтобы по уже имеющейся матрице парных корреляций, ана­логичной представленной в правой части показанного выше мат­ричного равенства, отыскать одинаковые по включенным в них цифрам столбец и строку, умножение которых друг на друга по заданному правилу порождает корреляционную матрицу.

Иллю­страция:

Х1

х

Х1

Х2

Х3

Х4

=

0,16

0,50

0,30

Х2

0,16

0,40

0,24

Х3

0,50

0,40

0,75

Х4

0,30

0,24

0,75

Здесь х1 х2 , x3 и х4 — искомые числа.

Для их точного и быст­рого определения существуют специальные математические про­цедуры и программы для ЭВМ.

Допустим, что мы уже нашли эти цифры: x1 = 0,45, х2 =,36 х3 = 1,12, х4 = 0,67. Совокупность найденных цифр и называется фактором, а сами эти цифры — факторными весами или нагруз­ками.

Эти цифры соответствуют тем психологическим переменным, между которыми вычислялись парные корреляции,

х1 — харак­тер,

х2 способности,

х3 — потребности,

х4 — успеваемость.

По­скольку наблюдаемые в эксперименте корреляции между пере­менными можно рассматривать как следствие влияния на них общих причин — факторов, а факторы интерпретируются в пси­хологических терминах, мы можем теперь от факторов перейти к содержательной психологической интерпретации обнаружен­ных статистических закономерностей. Фактор содержит в себе ту же самую информацию, что и вся корреляционная матрица, а факторные нагрузки соответствуют коэффициентам корреляции. В нашем примере х3 (потребности) имеет наибольшую фактор­ную нагрузку (1,12), а х2 (способности) — наименьшую (0,36).

Следовательно, наиболее значимой причиной, влияющей на все остальные психологические переменные, в нашем случае явля­ются потребности, а наименее значимой — способности. Из кор­реляционной матрицы видно, что связи переменной х 3 со всеми остальными являются наиболее сильными (от 0,40 до 0,75), а кор­реляции переменной х2 самыми слабыми (от 0,16 до 0,40).

Чаще всего в итоге факторного анализа определяется не один, а несколько факторов, по-разному объясняющих матрицу интер­корреляций переменных. В таком случае факторы делят на ге­неральные, общие и единичные.

Генеральными называются фак­торы, все факторные нагрузки которых значительно отличают­ся от нуля (нуль нагрузки свидетельствует о том, что данная пе­ременная никак не связана с остальными и не оказывает на них никакого влияния в жизни).

Общие — это факторы, у которых часть факторных нагрузок отлична от нуля.

Единичные — это факторы, в которых существенно отличается от нуля только одна из нагрузок. На рис. 75 схематически представлена структура факторного отображения переменных в факторах различной сте­пени общности.

Переменные, между которыми определены в результате эксперимента парные корреляционные зависимости

Рис. 75 . Структура факторного отображения взаимосвязей переменных.

Отрезки, соединяющие факторы с переменными, указывают на высокие

факторные нагрузки

ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА

1. Готтсданкер Р. Основы психологического эксперимента. М:
МГУ, 1982. - 464 с. (Корреляционные исследования: 378-424.)

2. Закс Л. Статистическое оценивание. М., 1976.

(Что такое статистика: 37-39. Нормальная кривая и нормаль­ное распределение: 63-71. Арифметическое среднее и стандарт­ное отклонение: 72-79. Медиана и мода: 91-94. Распределение Стъюдента: 129-136. Хи-квадрат распределение: 136-150. Рас­пределение Фишера: 150-153. Сравнение двух выборочных дис­персий из нормальных совокупностей: 241-245. Сравнение двух выборочных средних из нормальных совокупностей: 245-270. Проверка распределений по хи-квадрат критерию согласия: 295-296. Коэффициент ранговой корреляции Спирмена: 368-372. Оце­нивание прямой регрессии: 371-381. Проверка равенства не­скольких дисперсий: 448-453).

3. Кулагин Б.В. Основы профессиональной психодиагностики. Л.,
1984.-216 с. (Измерение в психодиагностике: 13-20. Корреляция и фактор­ный анализ: 20-33.)

4. Фресс П., Пиаже Ж. Экспериментальная психология. Вып. I и П. М., 1966. (Измерение в психологии: 197-229. Проблема надежности из­мерения: 229-231).

5. Практикум по общей психологии / Под ред. А.И. Щербакова. М., 1990. -287 с. [Методы психологии (с элементами математической статисти­ки): 20-39].

6. Психодиагностические методы (в комплексном лонгитюдном
исследовании студентов) / Под ред. А.А. Бодалева, М.Д. Дворяшиной, И.М. Палея. Л., 1976. - 248 с. (Основные математические процедуры психодиагностического исследования: 35-51.)

Курс: «Математические методы в психологии»

(Для студентов психологов и социальных работников)

Лекция № 3

ОСНОВНЫЕ ПОНЯТИЯ, ИСПОЛЬЗУЕМЫЕ В МАТЕМАТИЧЕСКОЙ ОБРАБОТКЕ ПСИХОЛОГИЧЕСКИХ ДАННЫХ

Учебные вопросы:

1.Признаки и переменные.

2.Шкалы измерения.

3.Распределение признака. Параметры распределения.

4.Статистические гипотезы.

5.Статистические критерии.

6.Уровни статистической значимости.

7.Мощность критериев.

8.Классификация задач и методов их решения.

9.Принятие решения о выборе метода математической обработки.

Вопрос 1. Признаки и переменные

Признаки и переменные - это измеряемые психологические явления. Такими явлениями могут быть время решения задачи, количеств допущенных ошибок, уровень тревожности, показатель интеллектуальной лабильности, интенсивность агрессивных реакций, угол поворот корпуса в беседе, показатель социометрического статуса и множеств других переменных.

Понятия признака и переменной могут использоваться как взаимозаменяемые. Они являются наиболее общими. Иногда вместо ни используются понятия показателя или уровня, например, уровень настойчивости, показатель вербального интеллекта и др. Понятия показа теля и уровня указывают на то, что признак может быть измерен количественно, так как к ним применимы определения "высокий" ил "низкий", например, высокий уровень интеллекта, низкие показатели тревожности и др.

Психологические переменные являются случайными величинами поскольку заранее неизвестно, какое именно значение они примут.

Математическая обработка - это оперирование со значениям признака, полученными у испытуемых в психологическом исследовании. Такие индивидуальные результаты называют также "наблюдениями" "наблюдаемыми значениями", "вариантами", "датами", "индивидуальны ми показателями" и др. В психологии чаще всего используются термины "наблюдение" или "наблюдаемое значение".

Значения признака определяются при помощи специальных шкал измерения.

Вопрос 2.Шкалы измерения

Измерение - это приписывание числовых форм объектам или собы­тиям в соответствии с определенными правилами (Стивенс С, 1960, с.60). С.Стивенсом предложена классификация из 4 типов шкал измерения:

1) номинативная, или номинальная, или шкала наименований;

2) порядковая, или ординальная, шкала;

3) интервальная, или шкала равных интервалов;

4) шкала равных отношений.

Номинативная шкала - это шкала, классифицирующая по назва­нию: потеп (лат.) - имя, название. Название же не измеряется количе­ственно, оно лишь позволяет отличить один объект от другого или од­ного субъекта от другого. Номинативная шкала - это способ классифи­кации объектов или субъектов, распределения их по ячейкам классифи­кации.

Простейший случай номинативной шкалы - дихотомическая шка­ла, состоящая всего лишь из двух ячеек, например: "имеет братьев и сестер - единственный ребенок в семье"; "иностранец - соотечествен­ник"; "проголосовал "за" - проголосовал "против"" и т.п.

Признак, который измеряется по дихотомической шкале наимено­ваний, называется альтернативным. Он может принимать всего два значения. При этом исследователь зачастую заинтересован в одном из них, и тогда он говорит, что признак "проявился", если тот принял ин­тересующее его значение, и что признак "не проявился", если он при­нял противоположное значение. Например: "Признак леворукости про­явился у 8 испытуемых из 20". В принципе номинативная шкала может состоять из ячеек "признак проявился - признак не проявился".

Более сложный вариант номинативной шкалы - классификация из трех и более ячеек, например: "экстрапунитивные - интрапунитивные - импунитивные реакции" или "выбор кандидатуры А - кандидатуры Б - кандидатуры В - кандидатуры Г" или "старший - средний - младший -единственный ребенок в семье" и др.

Расклассифицировав все объекты, реакции или всех испытуемых по ячейкам классификации, мы получаем возможность от наименований перейти к числам, подсчитав количество наблюдений в каждой из ячеек.

Как уже указывалось, наблюдение - это одна зарегистрированная реакция, один совершенный выбор, одно осуществленное действие или результат одного испытуемого.

Допустим, мы определим, что кандидатуру А выбрали 7 испы­туемых, кандидатуру Б - 11, кандидатуру В - 28, а кандидатуру Г - всего 1. Теперь мы можем оперировать этими числами, представляю­щими собой частоты встречаемости разных наименований, то есть час­тоты принятия признаком "выбор" каждого из 4 возможных значении. Далее мы можем сопоставить полученное распределение частот с рав­номерным или каким-то иным распределением.

Таким образом , номинативная шкала позволяет нам подсчитывать частоты встречаемости разных "наименований", или значений признака, и затем работать с этими частотами с помощью математических методов.

Единица измерения, которой мы при этом оперируем - количест­во наблюдений (испытуемых, реакций, выборов и т. п.), или частота. Точнее, единица измерения - это одно наблюдение. Такие данные мо­гут быть обработаны с помощью метода χ2 , биномиального критерия m и углового преобразования Фишера φ*.

Порядковая шкала - это шкала, классифицирующая по принци­пу "больше - меньше". Если в шкале наименований было безразлично, в каком порядке мы расположим классификационные ячейки, то в по­рядковой шкале они образуют последовательность от ячейки "самое ма­лое значение" к ячейке "самое большое значение" (или наоборот). Ячейки теперь уместнее называть классами, поскольку по отношению к классам употребимы определения "низкий", "средний" и "высокий" класс, или 1-й, 2-й, 3-й класс, и т.д.

В порядковой шкале должно быть не менее трех классов, напри­мер "положительная реакция - нейтральная реакция - отрицательная реакция" или "подходит для занятия вакантной должности - подходит с оговорками - не подходит" и т. п.

В порядковой шкале мы не знаем истинного расстояния между классами, а знаем лишь, что они образуют последовательность. Напри­мер, классы "подходит для занятия вакантной должности" и "подходит с оговорками" могут быть реально ближе друг к другу, чем класс подходит с оговорками" к классу "не подходит".

От классов легко перейти к числам, если мы условимся считать, что низший класс получает ранг 1, средний класс - ранг 2, а высший класс - ранг 3, или наоборот. Чем больше классов в шкале, тем больше. У нас возможностей для математической обработки полученных данных и проверки статистических гипотез.

Например, мы можем оценить различия между двумя выборками испытуемых по преобладанию у них более высоких или более низких рангов или подсчитать коэффициент ранговой корреляции между двумя переменными, измеренными в порядковой шкале, допустим, между оценками профессиональной компетентности руководителя, данными ему разными экспертами.

Все психологические методы, использующие ранжирование, по­строены на применении шкалы порядка. Если испытуемому предлагает­ся упорядочить 18 ценностей по степени их значимости для него, проранжировать список личностных качеств социального работника или 10 претендентов на эту должность по степени их профессиональной при­годности, то во всех этих случаях испытуемый совершает так называе­мое принудительное ранжирование, при котором количество рангов со­ответствует количеству ранжируемых субъектов или объектов (ценностей, качеств и т.п.).

Независимо от того, приписываем ли мы каждому качеству или испытуемому один из 3-4 рангов или совершаем процедуру принуди­тельного ранжирования, мы получаем в обоих случаях ряды значении, измеренные по порядковой шкале. Правда, если у нас всего 3 возмож­ных класса и, следовательно, 3 ранга, и при этом, скажем, 20 ранжи­руемых испытуемых, то некоторые из них неизбежно получат одинако­вые ранги. Все многообразие жизни не может уместиться в 3 градации, поэтому в один и тот же класс могут попасть люди, достаточно серьез­но различающиеся между собой. С другой стороны, принудительное ранжирование, то есть образование последовательности из многих ис­пытуемых, может искусственно преувеличивать различия между людь­ми. Кроме того, данные, полученные в разных группах, могут оказаться несопоставимыми, так как группы могут изначально различаться по уровню развития исследуемого качества, и испытуемый, получивший в одной группе высший ранг, в другой получил бы всего лишь средний, и т.п.

Выход из положения может быть найден, если задавать доста­точно дробную классификационную систему, скажем, из 10 классов, или градаций, признака. В сущности, подавляющее большинство психологи­ческих методик, использующих экспертную оценку, построено на изме­рении одним и тем же "аршином" из 10, 20 или даже 100 градаций разных испытуемых в разных выборках.

Итак , единица измерения в шкале порядка - расстояние в 1 класс или в 1 ранг, при этом расстояние между классами и рангами может быть разным (оно нам неизвестно). К данным, полученным по поряд­ковой шкале, применимы все описанные в данной книге критерии и ме­тоды.

Интервальная шкала - это шкала, классифицирующая по прин­ципу "больше на определенное количество единиц - меньше на опреде­ленное количество единиц". Каждое из возможных значений признака отстоит от другого на равном расстоянии.

Можно предположить, что если мы измеряем время решения за­дачи в секундах, то это уже явно шкала интервалов. Однако на самом деле это не так, поскольку психологически различие в 20 секунд между испытуемым А и Б может быть отнюдь не равно различию в 20 се­кунд между испытуемыми Б и Г, если испытуемый А решил задачу за 2 секунды, Б - за 22, В - за 222, а Г - за 242.

Аналогичным образом, каждая секунда после истечения полутора минут в опыте с измерением мышечного волевого усилия на динамомет­ре с подвижной стрелкой, по "цене", может быть, равна 10 или даже более секундам в первые полминуты опыта. "Одна секунда за год идет" - так сформулировал это однажды один испытуемый.

Попытки измерять психологические явления в физических едини­цах - волю в секундах, способности в сантиметрах, а ощущение собст­венной недостаточности - в миллиметрах и т. п., конечно, понятны, ведь все-таки это измерения в единицах "объективно" существующего времени и пространства. Однако ни один опытный исследователь при этом не обольщает себя мыслью, что он совершает измерения по психо­логической интервальной шкале. Эти измерения принадлежат по-прежнему к шкале порядка, нравится нам это или нет (Стивенс С, 1960, с.56; Паповян С.С., 1983, с.63; Михеев В.И., 1986, с.28).

Мы можем с определенной долей уверенности утверждать лишь, что испытуемый А решил задачу быстрее Б, Б быстрее В, а В быстрее Г.

Аналогичным образом, значения, полученные испытуемыми в баллах по любой нестандартизованной методике, оказываются измерен­ными лишь по шкале порядка. На самом деле равно интервальными можно считать лишь шкалы в единицах стандартного отклонения и процентильные шкалы, и то лишь при условии, что распределение значений в стандартизующей выборке было нормальным (Бурлачук Л. Ф., Мо­розов С. М., 1989, с. 163. с. 101).

Принцип построения большинства интервальных шкал построен на известном правиле "трех сигм": примерно 97,7-97,8% всех значений признака при нормальном его распределении укладываются в диапазоне М±3δ1 . Можно построить шкалу в единицах долей стандартного откло­нения, которая будет охватывать весь возможный диапазон изменения признака, если крайний слева и крайний справа интервалы оставить открытыми.

1 Определения и формулы расчета М и О" даны в параграфе "Распределение при­знака. Параметры распределения".

Р.Б. Кеттелл предложил, например, шкалу стенов - "стандартной десятки". Среднее арифметическое значение в "сырых" баллах прини­мается за точку отсчета. Вправо и влево отмеряются интервалы, равные 1/2 стандартного отклонения. На Рис. 1.2 представлена схема вычисле­ния стандартных оценок и перевода "сырых" баллов в стены по шкале N 16-факторного личностного опросника Р. Б. Кеттелла.

Рис. 1.1. Схема вычисления стандартных оценок (стенов) по фактору N 16-

факторного личностного опросника Р. Б. Кеттелла; снизу указаны интервалы в единицах 1/2 стан­дартного отклонения

Справа от среднего значения будут располагаться интервалы, равные 6, 7, 8, 9 и 10 стенам, причем последний из этих интервалов открыт. Слева от среднего значе­ния будут располагаться интервалы, равные 5, 4, 3, 2 и 1 стенам, и крайний интервал также открыт. Теперь мы поднимаемся вверх, к оси "сырых баллов", и размечаем границы интервалов в единицах "сырых" баллов. Поскольку М=10,2; δ=2,4, вправо мы откладываем 1/2δ т.е. 1,2 "сырых" балла. Таким образом, гра­ница интервала составит: (10,2 + 1,2) = 11,4 "сырых" балла. Итак, границы ин­тервала, соответствующего 6 стенам, будут простираться от 10,2 до 11,4 баллов. В сущности, в него попадает только одно "сырое" значение - 11 баллов. Влево от средней мы откладываем 1/2δ и получаем границу интервала: 10,2-1,2=9. Таким образом, границы интервала, соответствующие 9 стенам, простираются от 9 до 10,2. В этот интервал попадают уже два "сырых" значения - 9 и 10. Если испы­туемый получил 9 "сырых" баллов, ему начисляется теперь 5 стенов; если он по­лучил 11 "сырых" баллов - 6 стенов, и т. д.

Мы видим, что в шкале стенов иногда за разное количество "сырых" баллов будет начисляться одинаковое количество стенов. Например, за 16, 17, 18, 19 и 20 баллов будет начисляться 10 стенов, а за 14 и 15 - 9 стенов и т. д.

В принципе, шкалу стенов можно построить по любым данным, измеренным по крайней мере в порядковой шкале, при объеме выборки п>200 и нормальном рас­пределении признака2 .

Другой способ построения равноинтервальной шкалы - группировка интервалов по принципу равенства накопленных частот. При нормальном распределении при­знака в окрестности среднего значения группируется большая часть всех наблюде­ний, поэтому в этой области среднего значения интервалы оказываются меньше, уже, а по мере удаления от центра распределения они увеличиваются, (см. Рис. 1.2). Следовательно, такая процентнльная шкала является равноинтервальной толь­ко относительно накопленной частоты (Мельников В.М., Ямпольский Л.Т., 1985, с. 194).

Рис. 1.2. Процентильная шкала; сверху для сравнения указаны интервалы в единицах стандартного отклонения

О нормальном распределении см. Пояснения в вопросе 3.

Построение шкал равных интервалов по данным, полученным по шкале порядка, напоминает трюк с веревочной лестницей, на который ссылался С. Стивене. Мы сначала поднимаемся по лестнице, которая ни на чем не закреплена, и добираемся до лестницы, которая закрепле­на. Однако каким путем мы оказались на ней? Измерили некую психо­логическую переменную по шкале порядка, подсчитали средние и стан­дартные отклонения, а затем получили, наконец, интервальную шкалу. "Такому нелегальному использованию статистики может быть дано из­вестное прагматическое оправдание; во многих случаях оно приводит к плодотворным результатам" (Стивенс С, 1960, с. 56).

Многие исследователи не проверяют степень совпадения получен­ного ими эмпирического распределения с нормальным распределением, и тем более не переводят получаемые значения в единицы долей стан­дартного отклонения или процентили, предпочитая пользоваться "сырыми" данными. "Сырые" же данные часто дают скошенное, срезан­ное по краям или двухвершинное распределение. На Рис. 1.3 представле­но распределение показателя мышечного волевого усилия на выборке из 102 испытуемых. Распределение с удовлетворительной точностью мож­но считать нормальным (х2 =12,7 при v=9, М=89,75, δ= 25,1).

Рис. 1.3. Гистограмма и плавная кривая распределения показателя мышечного волевого усилия (п=102)

На Рис. 1.4 представлено распределение показателя самооценки по шкале методики Дж. Менестера - Р.Корзини "Уровень успеха, ко­торого я должен был достичь уже сейчас" (n=356). Распределение зна­чимо отличается от нормального

(χ2 = 58,8, при v=7; p<0,01; М=80,64; δ=16,86).

Рис. 1.4. Гистограмма и плавная кривая распределения показателя должного успеха ( n =356)

С такими "ненормальными" распределениями приходится встре­чаться очень часто, чаще, может быть, чем с классическими нормаль­ными. И дело здесь не в каком-то изъяне, а в самой специфике психо­логических признаков. По некоторым методикам от 10 до 20% испы­туемых получают оценку "ноль" - например, в их рассказах не встреча­ется ни одной словесной формулировки, которая отражала бы мотив "надежда на успех" или "боязнь неудачи" (методика Хекхаузена). То, что испытуемый получил оценку "ноль", нормально, но распределение таких оценок не может быть нормальным, как бы мы ни увеличивали объем выборки (см. в. 5.3).

Методы статистической обработки, предлагаемые в настоящем руководстве, в большинстве своем не требуют проверки совпадения по­лученного эмпирического распределения с нормальным. Они построены на подсчете частот и ранжирования. Проверка необходима только в случае применения дисперсионного анализа. Именно поэтому соответст­вующая глава сопровождается описанием процедуры подсчета необхо­димых критериев.

Во всех остальных случаях нет необходимости проверять степень совпадения полученного эмпирического распределения с нормальным, и тем более стремиться преобразовать порядковую шкалу в равноинтервальную. В каких бы единицах ни были измерены переменные - в се­кундах, миллиметрах, градусах, количестве выборов и т. п. - все эти данные могут быть обработаны с помощь непараметрических критери­ев3 , составляющих основу данного руководства.

Определение и описание («параметрических критериев дано ниже в данной главе.

Шкала равных отношений - это шкала, классифицирующая объекты или субъектов пропорционально степени выраженности изме­ряемого свойства. В шкалах отношений классы обозначаются числами, которые пропорциональны друг другу: 2 так относится к 4, как 4 к 8. Это предполагает наличие абсолютной нулевой точки отсчета. В физике абсолютная нулевая точка отсчета встречается при измерении длин от­резков или физических объектов и при измерении температуры по шка­ле Кельвина с абсолютным нулем температур. Считается, что в психо­логии примерами шкал равных отношений являются шкалы порогов аб­солютной чувствительности (Стивене С, 1960; Гайда В. К., Захаров В. П., 1982). Возможности человеческой психики столь велики, что трудно представить себе абсолютный нуль в какой-либо измеряемой психологической переменной. Абсолютная глупость и абсолютная чест­ность - понятия скорее житейской психологии.

То же относится и к установлению равных отношений: только метафора обыденной речи допускает, чтобы Иванов был в 2 раза (3, 100, 1000) умнее Петрова или наоборот.

Абсолютный нуль, правда, может иметь место при подсчете ко­личества объектов или субъектов. Например, при выборе одной из 3 альтернатив испытуемые не выбрали альтернативу А ни одного раза, альтернативу Б - 14 раз и альтернативу В - 28 раз. В этом случае мы можем утверждать, что альтернативу В выбирают в два раза чаще, чем альтернативу Б. Однако при этом измерено не психологическое свойст­во человека, а соотношение выборов у 42 человек.

По отношению к показателям частот возможно применять все арифметические операции: сложение, вычитание, деление и умножение. Единица измерения в этой шкале отношений - 1 наблюдение, 1 выбор, 1 реакция и т. п. Мы вернулись к тому, с чего начали: к универсальной шкале измерения в частотах встречаемости того или иного значения признака и к единице измерения, которая представляет собой 1 наблю­дение. Расклассифицировав испытуемых по ячейкам номинативной шка­лы, мы можем применить потом высшую шкалу измерения - шкалу от­ношений между частотами.

Вопрос 3 Распределение признака. Параметры распределения

Распределением признака называется закономерность встречаемо­сти разных его значений (Плохинский Н.А., 1970, с. 12).

В психологических исследованиях чаще всего ссылаются на нор­мальное распределение.

Нормальное распределение характеризуется тем, что крайние зна­чения признака в нем встречаются достаточно редко, а значения, близ­кие к средней величине - достаточно часто. Нормальным такое распре­деление называется потому, что оно очень часто встречалось в естест­венно-научных исследованиях и казалось "нормой" всякого массового случайного проявления признаков. Это распределение следует закону, открытому тремя учеными в разное время: Муавром в 1733 г. в Англии, Гауссом в 1809 г. в Германии и Лапласом в 1812 г. во Франции (Плохинский Н.А., 1970, с.17). График нормального распределения представляет собой привычную глазу психолога-исследователя так на­зываемую колоколообразную кривую (см, напр., Рис. 1.1, 1.2).

Параметры распределения - это его числовые характеристики, указывающие, где "в среднем" располагаются значения признака, на­сколько эти значения изменчивы и наблюдается ли преимущественное появление определенных значений признака. Наиболее практически важными параметрами являются математическое ожидание, дисперсия, показатели асимметрии и эксцесса.

В реальных психологических исследованиях мы оперируем не па­раметрами, а их приближенными значениями, так называемыми оценка­ми параметров. Это объясняется ограниченностью обследованных выбо­рок. Чем больше выборка, тем ближе может быть оценка параметра к его истинному значению. В дальнейшем, говоря о параметрах, мы будем иметь в виду юс оценки.

Среднее арифметическое (оценка математического ожидания) вы­числяется по формуле:

где x i - каждое наблюдаемое значение признака;

i - индекс, указывающий на порядковый номер данного зна­чения признака;

n - количество наблюдений;

- знак суммирования.

Оценка дисперсии определяется по формуле:

где Xi - каждое наблюдаемое значение признака;

x - среднее арифметическое значение признака;

п - количество наблюдений.

Величина, представляющая собой квадратный корень из несме­щенной оценки дисперсии (S), называется стандартным отклонением или средним квадратнческим отклонением. Для большинства исследова­телей привычно обозначать эту величину греческой буквой δ (сигма), а не S. На самом деле, δ - это стандартное отклонение в генеральной совокупности, a S - несмещенная оценка этого параметра в исследован­ной выборке. Но, поскольку S - лучшая оценка δ (Fisher R.A., 1938), эту оценку стали часто обозначать уже не как S, а как δ:

В тех случаях, когда какие-нибудь причины благоприятствуют более частому появлению значений, которые выше или, наоборот, ниже среднего, образуются асимметричные распределения. При левосторон­ней, или положительной, асимметрии в распределении чаще встречаются более низкие значения признака, а при правосторонней, или отрица­тельной - более высокие (см. Рис. 1.5).

Показатель асимметрии (А) вычисляется по формуле:

Для симметричных распределений А=0.


Рис. 1.5. Асимметрия распределений.

А) Левая, положительная

Б) правая, отрицательная

В тех случаях, когда какие-либо причины способствуют преиму­щественному появлению средних или близких к средним значений, об­разуется распределение с положительным эксцессом. Если же в рас­пределении преобладают крайние значения, причем одновременно и бо­лее низкие, и более высокие, то такое распределение характеризуется отрицательным эксцессом и в центре распределения может образоваться впадина, превращающая его в двувершинное (см. Рис. 1.6).

Показатель эксцесса (Е) определяется по формуле:

Рис. 1.6. Эксцесс: а) положительный; б) отрицательный

В распределениях с нормальной выпуклостью Е=0.

Параметры распределения оказывается возможным определить только по отношению к данным, представленным по крайней мере в интервальной шкале. Как мы убедились ранее, физические шкалы длин, времени, углов являются интервальными шкалами, и поэтому к ним применимы способы расчета оценок параметров, по крайней мере, с формальной точки зрения. Параметры распределения не учитывают

истинной психологической неравномерности секунд, миллиметров и других физических единиц измерения.

На практике психолог-исследователь может рассчитывать пара­метры любого распределения, если единицы, которые он использовал при измерении, признаются разумными в научном сообществе.

Вопрос 4. Статистические гипотезы

Формулирование гипотез систематизирует предположения иссле­дователя и представляет их в четком и лаконичном виде. Благодаря гипотезам исследователь не теряет путеводной нити в процессе расчетов и ему легко понять после их окончания, что, собственно, он обнаружил.

Статистические гипотезы подразделяются на нулевые и альтерна­тивные, направленные и ненаправленные.

Нулевая гипотеза - это гипотеза об отсутствии различий.

Она обозначается как Hо называется нулевой потому, что содержит число 0: X1 —Х2 =0, где X1 , X2 - сопоставляемые значения признаков.

Нулевая гипотеза - это то, что мы хо­тим опровергнуть, если перед нами стоит задача доказать значимость различий.

Альтернативная гипотеза - это гипотеза о значимости различий.

Она обозначается как Н1 . Альтернатив­ ная гипотеза - это то, что мы хотим до­казать, поэтому иногда ее называют экспериментальной гипотезой.

Бывают задачи, когда мы хотим доказать как раз незначимость различий, то есть подтвердить нулевую гипотезу. Например, если нам нужно убедиться, что разные испытуемые получают хотя и различные, но уравновешенные по трудности задания, или что экспериментальная и контрольная выборки не различаются между собой по каким-то значи­мым характеристикам. Однако чаще нам все-таки требуется доказать значимость различий , ибо они более информативны для нас в поиске нового. Нулевая и альтернативная гипотезы могут быть направленными и ненаправленными.

Направленные гипотезы

H0 : X1 не превышает Х2

H1 : X1 превышает Х2

Ненаправленные гипотезы
H0 ; X1 не отличается от Х2
H1 : X1 отличается от Х2

Если вы заметили, что в одной из групп индивидуальные значе­ния испытуемых по какому-либо признаку, например по социальной смелости, выше, а в другой ниже, то для проверки значимости этих различий нам необходимо сформулировать направленные гипотезы.

Если мы хотим доказать, что в группе А под влиянием каких-то экспериментальных воздействии произошли более выраженные измене­ния, чем в группе Б, то нам тоже необходимо сформулировать направ­ленные гипотезы.

Если же мы хотим доказать, что различаются формы распределения признака в группе А и Б, то формулируются ненаправленные гипотезы.

При описании каждого критерия в руководстве даны формули­ровки гипотез, которые он помогает нам проверить.

Построим схему - классификацию статистических гипотез.

Проверка гипотез осуществляется с помощью критериев стати­стической оценки различий.

Вопрос 5. Статистические критерии

Статистический критерий - это решающее правило, обеспечиваю­щее надежное поведение, то есть принятие истинной и отклонение ложной гипотезы с высокой вероятностью (Суходольский Г.В., 1972, с. 291).

Статистические критерии обозначают также метод расчета опре­деленного числа и само это число.

Когда мы говорим, что достоверность различий определялась по критерию X 2 , то имеем в виду, что использовали метод X 2 для расчета определенного числа.

Когда мы говорим, далее, что X 2 = 12,676, то имеем в виду опре­деленное число, рассчитанное по методу X 2 . Это число обозначается как эмпирическое значение критерия.

По соотношению эмпирического и критического значений крите­рия мы можем судить о том, подтверждается ли или опровергается ну­левая гипотеза. Например, если X 2 эмп > X 2 кр ., то Н0 отвергается.

В большинстве случаев для того, чтобы мы признали различия значимыми, необходимо, чтобы эмпирическое значение критерия пре­вышало критическое, хотя есть критерии (например, критерий Манна-Уитни или критерий знаков), в которых мы должны придерживаться противоположного правила.

Эти правила оговариваются в описании каждого из представлен­ных в руководстве критериев.

В некоторых случаях расчетная формула критерия включает в се­бя количество наблюдений в исследуемой выборке, обозначаемое как п. В этом случае эмпирическое значение критерия одновременно является тестом для проверки статистических гипотез. По специальной таблице мы определяем, какому уровню статистической значимости различий соответствует данная эмпирическая величина. Примером такого крите­рия является критерий φ*, вычисляемый на основе углового преобразо­вания Фишера.

В большинстве случаев, однако, одно и то же эмпирическое зна­чение критерия может оказаться значимым или незначимым в зависи­мости от количества наблюдений в исследуемой выборке (n) или от так называемого количества степеней свободы, которое обозначается как ν или как df .

Число степеней свободы V равно числу классов вариационного ряда минус число условий, при которых он был сформирован (Ивантер Э.В., Коросов А.В., 1992, с. 56). К числу таких условий относятся объем выборки (n), средние и дисперсии.

Если мы расклассифицировали наблюдения по классам какой-либо номинативной шкалы и подсчитали количество наблюдений в каж­дой ячейке классификации, то мы получаем так называемый частотный вариационный ряд. Единственное условие, которое соблюдается при его формировании - объем выборки п. Допустим, у нас 3 класса: "Умеет работать на компьютере - умеет выполнять лишь определенные опера­ции - не умеет работать на компьютере". Выборка состоит из 50 чело­век. Если в первый класс отнесены 20 испытуемых, во второй - тоже 20, то в третьем классе должны оказаться все остальные 10 испытуе­мых. Мы ограничены одним условием - объемом выборки. Поэтому даже если мы потеряли данные о том, сколько человек не умеют рабо­тать на компьютере, мы можем определить это, зная, что в первом и втором классах - по 20 испытуемых. Мы не свободны в определении количества испытуемых в третьем- разряде, "свобода" простирается только на первые две ячейки классификации:

V = c - l = 3- 1 = 2

Аналогичным образом, если бы у нас была классификация из 10 разрядов, то мы были бы свободны только в 9 из них, если бы у нас было 100 классов - то в 99 из них и т. д.

Способы более сложного подсчета числа степеней свободы при двухмерных классификациях приведены в разделах, посвященных кри­терию χ2 и дисперсионному анализу.

Зная п и/или число степеней свободы, мы по специальным таб­лицам можем определить критические значения критерия и сопоставить с ними полученное эмпирическое значение. Обычно это записывается так: "при n=22 критические значения критерия составляют ..." или "при v=2 критические значения критерия составляют ..." и т.п.

Критерии делятся на параметрические и непараметрические.

Параметрические критерии

Критерии, включающие в формулу расчета параметры распределения, то есть средние и дисперсии (/-критерий Стьюдента, критерий F и др.)

Непараметрические критерия

Критерии, не включающие в формулу расчета параметров распределе­ния и основанные на оперировании частотами или рангами (критерий Q Розенбаума, критерий Т Вилкоксона и др.)

И те, и другие критерии имеют свои преимущества и недостатки. На основании нескольких руководств можно составить таблицу, позво­ляющую оценить возможности и ограничения тех и других (Рунион Р., 1982; McCall R., 1970; J.Greene, M.D'Olivera, 1989).

Таблица 1.1

Возможности и ограничения параметрических и непараметрических критериев

ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ

1. Позволяют прямо оценить различия в средних, полученных в двух вы­борках (t - критерий Стьюдента).

2.Позволяют прямо оценить различия в дисперсиях (критерий Фишера).

3.Позволяют выявить тенденции изме­нения признака при переходе от ус­ловия к условию (дисперсионный
однофакторный анализ), но лишь при условии нормального распреде­ления признака.

4.Позволяют оценить взаимодействие двух и более факторов в их влиянии на изменения признака (двухфакторный дисперсионный анализ).

5.Экспериментальные данные должны отвечать двум, а иногда трем, усло­виям:

а) значения признака измерены по интервальной шкале;

б) распределение признака является нормальным;

в) в дисперсионном анализе должно соблюдаться требование равенства дисперсий в ячейках комплекса.

6.Математические расчеты довольно сложны.

7.Если условия, перечисленные в п.5, выполняются, параметрические кри­терии оказываются несколько более
мощными, чем непараметрические.

НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ

1. Позволяют оценить лишь средние тенден­ции, например, ответить на вопрос, чаще ли в выборке А встречаются более высо­кие, а в выборке Б - более низкие значе­ния признака (критерии Q, U, φ* и др.).

2.Позволяют оценить лишь различия в диа­пазонах вариативности признака (критерий φ*).

3.Позволяют выявить тенденции изменения признака при переходе от условия к усло­вию при любом распределении признака (критерии тенденций L и S).

4.Эта возможность отсутствует.

5.Экспериментальные данные могут не от­вечать ни одному из этих условий:

а) значения признака могут быть пред­ставлены в любой шкале, начиная от шка­лы наименований;

б) распределение признака может быть любым и совпадение его с каким-либо теоретическим законом распределения
необязательно и не нуждается в проверке;

в) требование равенства дисперсий отсут­ствует.

6.Математические расчеты по большей час­ти просты и занимают мало времени (за исключением критериев χ2 и λ).
7.Если условия, перечисленные в п.5, не выполняются, непараметрические критерии оказываются более мощными, чем пара­метрические, так как они менее чувствительны к "засорениям".

Из Табл. 1.1 мы видим, что параметрические критерии могут оказаться несколько более мощными4 , чем непараметрические, но толь­ко в том случае, если признак измерен по интервальной шкале и нор­мально распределен. С интервальной шкалой есть определенные про­блемы (см. раздел "Шкалы измерения"). Лишь с некоторой натяжкой мы можем считать данные, представленные не в стандартизованных оценках, как интервальные. Кроме того, проверка распределения "на нормальность" требует достаточно сложных расчетов, результат кото­рых заранее неизвестен (см. параграф 7.2). Может оказаться, что рас­пределение признака отличается от нормального, и нам так или иначе все равно придется обратиться к непараметрическим критериям.

4 О понятии мощности критерия см. ниже.

Непараметрические критерии лишены всех этих ограничений и не требуют таких длительных и сложных расчетов. По сравнению с пара­метрическими критериями они ограничены лишь в одном - с их помо­щью невозможно оценить взаимодействие двух или более условий или факторов, влияющих на изменение признака. Эту задачу может решить только дисперсионный двухфакторный анализ.

Учитывая это, в настоящее руководство включены в основном непараметрические статистические критерии. В сумме они охватывают большую часть возможных задач сопоставления данных.

Единственный параметрический метод, включенный в руково­дство - метод дисперсионного анализа, двухфакторный вариант которого ничем невозможно заменить.

Вопрос 6. Уровни статистической значимости

Уровень значимости - это вероятность того, что мы сочли разли­чия существенными, а они на самом деле случайны.

Когда мы указываем, что различия достоверны на 5%-ом уровне значимости, или при р< 0,05 , то мы имеем виду, что вероятность того, что они все-таки недостоверны, составляет 0,05.

Когда мы указываем, что различия достоверны на 1%-ом уровне значимости, или при р< 0,01 , то мы имеем в виду, что вероятность того, что они все-таки недостоверны, составляет 0,01.

Если перевести все это на более формализованный язык, то уро­вень значимости - это вероятность отклонения нулевой гипотезы, в то время как она верна.

Ошибка, состоящая в той, что мы отклонили нулевую гипотезу, в то время как она верна, называется ошибкой

1 рода.

Вероятность такой ошибки обычно обозначается как α. В сущно­сти, мы должны были бы указывать в скобках не р< 0,05 или р< 0,01, а α< 0,05 или α< 0,01. В некоторых руководствах так и делается (Рунион Р., 1982; Захаров В.П., 1985 и др.).

Если вероятность ошибки - это α , то вероятность правильного решения: 1—α. Чем меньше α, тем больше вероятность правильного решения.

Исторически сложилось так, что в психологии принято считать низшим уровнем статистической значимости 5%-ый уровень (р≤0,05): достаточным – 1%-ый уровень (р≤0,01) и высшим 0,1%-ый уровень (р≤0,001), поэтому в таблицах критических значений обычно приводятся значения критериев, соответствующих уровням статистической зна­чимости р≤0,05 и р≤0,01, иногда - р≤0,001. Для некоторых критериев в таблицах указан точный уровень значимости их разных эмпирических значений. Например, для φ*=1,56 р=О,06.

До тех пор, однако, пока уровень статистической значимости не достигнет р=0,05, мы еще не имеем права отклонить нулевую гипотезу. В настоящем руководстве мы, вслед за Р. Рунионом (1982), будем придерживаться следующего правила отклонения гипотезы об отсутст­вии различий (Но) и принятия гипотезы о статистической достоверно­сти различий (Н1 ).

Правило отклонения H о и принятия H 1

Если эмпирическое значение критерия равняется критическому значе­нию, соответствующему р≤0,05 или превышает его, то H0 отклоняет­ся, но мы еще не можем определенно принять H1 .

Если эмпирическое значение критерия равняется критическому значе­нию, соответствующему р≤0,01 или превышает его, то H0 отклоняется и принимается Н1 .

Исключения : критерий знаков G, критерий Т Вилкоксона и критерий U Манна-Уитни. Для них устанавливаются обратные соотношения.

Рис. 1.7. Пример «оси значимости» для критерия Q Розенбаума

Критические значения критерия обозначены как Qо,о5 и Q0,01, эмпирическое значение критерия как Qэмп. Оно заключено в эллипс.

Вправо от критического значения Q0,01 простирается "зона зна­чимости" - сюда попадают эмпирические значения, превышающие Q 0 ,01 и, следовательно, безусловно значимые.

Влево от критического значения Q o,05 простирается "зона незначимости", - сюда попадают эмпирические значения Q, которые ниже Q 0,05, и, следовательно, безусловно незначимы.

Мы видим, что Q 0,05 =6; Q 0,01 =9; Q эмп. =8;

Эмпирическое значение критерия попадает в область между Q0,05 и Q0,01. Это зона "неопределенности": мы уже можем отклонить гипо­тезу о недостоверности различий (Но), но еще не можем принять гипо­тезы об их достоверности (H1 ).

Практически, однако, исследователь может считать достоверными уже те различия, которые не попадают в зону незначимости, заявив, что они достоверны при р< 0,05, или указав точный уровень значимости полу­ченного эмпирического значения критерия, например: р=0,02. С помощью таблиц Приложения 1 это можно сделать по отношению к критериям Н Крускала-Уоллиса, χ2 r Фридмана, L Пейджа, φ* Фишера, λ Колмогорова.

Уровень статистической значимости или критические значения критериев определяются по-разному при проверке направленных и не­направленных статистических гипотез.

При направленной статистической гипотезе используется одно­сторонний критерий, при ненаправленной гипотезе - двусторонний кри­терий. Двусторонний критерий более строг, поскольку он проверяет различия в обе стороны, и поэтому то эмпирическое значение критерия, которое ранее соответствовало уровню значимости р< 0,05, теперь соот­ветствует лишь уровню р< 0,10.

В данном руководстве исследователю не придется всякий раз са­мостоятельно решать, использует ли он односторонний или двухсторон­ний критерий. Таблицы критических значений критериев подобраны таким образом, что направленным гипотезам соответствует односторон­ний, а ненаправленным - двусторонний критерий, и приведенные значе­ния удовлетворяют тем требованиям, которые предъявляются к каждому из них. Исследователю необходимо лишь следить за тем, чтобы его гипотезы совпадали по смыслу и по форме с гипотезами, предлагаемы­ми в описании каждого из критериев.

Вопрос 7. Мощность критериев

Мощность критерия - это его способность выявлять различия, если они есть. Иными словами, это его способность отклонить нулевую гипотезу об отсутствии различий, если она неверна.

Ошибка, состоящая в том, что мы приняли нулевую гипотезу, в то время как она неверна, называется ошибкой II рода.

Вероятность такой ошибки обозначается как β. Мощность крите­рия - это его способность не допустить ошибку II рода, поэтому:

Мощность=1—β

Мощность критерия определяется эмпирическим путем. Одни и те же задачи могут быть решены с помощью разных критериев, при этом обнаруживается, что некоторые критерии позволяют выявить раз­личия там, где другие оказываются неспособными это сделать, или вы­являют более высокий уровень значимости различий. Возникает вопрос: а зачем же тогда использовать менее мощные критерии? Дело в том, что основанием для выбора критерия может быть не только мощность, но и другие его характеристики, а именно:

а)простота;

б)более широкий диапазон использования (например, по отношению к данным, определенным по номинативной шкале, или по отношению к большим n);

в)применимость по отношению к неравным по объему выборкам;

г)большая информативность результатов.

Вопрос 8. Классификация задач и методов их решения

Множество задач психологического исследования предполагает те или иные сопоставления. Мы сопоставляем группы испытуемых по ка­кому-либо признаку, чтобы выявить различия между ними по этому признаку. Мы сопоставляем то, что было "до" с тем, что стало "после" наших экспериментальных или любых иных воздействий, чтобы опреде­лить эффективность этих воздействий. Мм сопоставляем эмпирическое распределение значений признака с каким-либо теоретическим законом распределения или два эмпирических распределения между собой, с тем, чтобы доказать неслучайность выбора альтернатив или различия в форме распределений.

Мы, далее, можем сопоставлять два признака, измеренные на одной и той же выборке испытуемых, для того, чтобы установить сте­пень согласованности их изменений, их сопряженность, корреляцию между ними.

Наконец, мы можем сопоставлять индивидуальные значения, по­лученные при разных комбинациях каких-либо существенных условий, с тем, чтобы выявить характер взаимодействия этих условий в их влиянии на индивидуальные значения признака.

Именно эти задачи позволяет решить тот набор методов, который предлагается настоящим руководством. Все эти методы могут быть ис­пользованы при так называемой "ручной" обработке данных.

Вопрос 9. Принятие решения о выборе метода математической об­работки

Если данные уже получены, то вам предлагается следующий ал­горитм определения задачи и метода.

АЛГОРИТМ 1

Принятие решения о задаче и методе обработки на стадии, когда данные уже получены

1. По первому столбцу Табл. 1.2 определить, какая из задач стоит в вашем исследовании.

2. По второму столбцу Табл. 1.2 определить, каковы условия решения вашей задачи, например, сколько выборок обследовано или на какое количество
групп вы можете разделить обследованную выборку.

3. Обратиться к соответствующей главе и по алгоритму принятия решения о выборе критерия, приведенного в конце каждой главы, определить, какой
именно метод или критерий вам целесообразно использовать.

Если вы еще находитесь на стадии планирования исследования, то лучшее заранее подобрать математическую модель, которую вы бу­дете в дальнейшем использовать. Особенно необходимо планирование в тех случаях, когда в перспективе предполагается использование крите­риев тенденций или (в еще большей степени) дисперсионного анализа. В этом случае алгоритм принятия решения таков:

АЛГОРИТМ 2

Принятие решения о задаче и методе обработка на стадия планирования исследования

1. Определите, какая модель вам кажется наиболее подходящей для доказательства ваших научных предположений.

2.Внимательно ознакомьтесь с описанием метода, примерами и задачами для самостоятельного решения, которые к нему прилагаются.

3.Если вы убедились, что это то, что вам нужно, вернитесь к разделу "Ограничения критерия" и решите, сможете ли вы собрать данные, которые будут отвечать этим ограничениям (большие объемы выборок, наличие не­ скольких выборок, монотонно различающихся по какому-либо признаку, напри­мер, по возрасту и т.п.).

4.Проводите исследование, а затем обрабатывайте полученные данные по заранее выбранному алгоритму, если вам удалось выполнить ограничения.

5.Если ограничения выполнить не удалось, обратитесь к алгоритму 1.

В описании каждого критерия сохраняется следующая последова­тельность изложения:

• назначение критерия;

• описание критерия;

• гипотезы, которые он позволяет проверить;

• графическое представление критерия;

• ограничения критерия;

• пример или примеры.

Кроме того, для каждого критерия создан алгоритм расчетов. Ес­ли критерий сразу удобнее рассчитывать по алгоритму, то он приводит­ся в разделе "Пример"; если алгоритм легче можно воспринять уже после рассмотрения примера, то он приводится в конце параграфа, со­ответствующего данному критерию.

Курс: «Математические методы в психологии»

(Для студентов психологов и социальных работников)

Лекция № 4

ВЫЯВЛЕНИЕ РАЗЛИЧИЙ В УРОВНЕ ИССЛЕДУЕМОГО ПРИЗНАКА

Вопросы:

1. Обоснование задачи сопоставления и сравнения

2. Q-критерий Розенбаума

3. U – критерий Манна-Уитни

4. Н – критерий Крускала-Уоллиса

5. S – критерий тенденций Джонкира

6. Алгоритм принятия решения о выборе критерия для сопоставлений

Вопрос 1 Обоснование задачи сопоставления и сравнения

Очень часто перед исследователем в психологии стоит задача вы­явления различий между двумя, тремя и более выборками испытуемых. Это может быть, например, задача определения психологических осо­бенностей хронически больных детей по сравнению со здоровыми, юных правонарушителей по сравнению с законопослушными сверстни­ками или различий между работниками государственных предприятий и частных фирм, между людьми разной национальности или разной куль­туры и, наконец, между людьми разного возраста в методе "поперечных срезов".

Иногда по выявленным в исследовании статистически достовер­ным различиям формируется "групповой профиль" или "усредненный портрет" человека той или иной профессии, статуса, соматического за­болевания и др. (см., например, Cattell R.B., Eber H.W., Tatsuoka MM., 1970).

В последние годы все чаще встает задача выявления психологиче­ского портрета специалиста новых профессий: "успешного менеджера", "успешного политика", "успешного торгового представителя", "успеш­ного коммерческого директора" и др. Такого рода исследования не всегда подразумевают участие двух или более выборок. Иногда обсле­дуется одна, но достаточно представительная выборка численностью не менее 60 человек, а затем внутри, этой выборки выделяются группы более и менее успешных специалистов, и их данные по исследованным переменным сопоставляются между собой. В самом простом случае кри­терием для разделения выборки на "успешных" и "неуспешных-" будет средняя величина по показателю успешности. Однако такое деление является довольно грубым: лица, получившие близкие оценки по успеш­ности, могут оказаться в противоположных группах, а лица, заметно различающиеся по оценкам успешности, - в одной и той же группе. Это может исказить результаты сопоставления групп или, по крайней мере, сделать различия между группами менее заметными.

Чтобы избежать этого, можно попробовать выделить группы "успешных" и "неуспешных" специалистов более строго, включая в пер­вую из них только тех, чьи значения превышают среднюю величину не менее чем на 1/4 стандартного отклонения, а во вторую группу - толь­ко тех, чьи значения не менее чем на 1/4 стандартного отклонения ни­же средней величины. При этом все, кто оказывается в зоне средних величин, М±1/4σ, выпадают из дальнейших сопоставлений. Если рас­пределение близко к нормальному, то выпадет примерно 19,8% испы­туемых. Если распределение отличается от нормального, то таких испы­туемых может быть и больше. Чтобы избежать потерь, можно сопос­тавлять не две, а три группы испытуемых: с высокой, средней и низкой профессиональной успешностью.

Рис 2.1. Схематическое изображение процесса разделения выборки на группы с низкой, сред­ней и высокой профессиональной успешностью.

На Рис. 2.1 представлена схема разделения выборки на группы с низкой, средней и высокой профессиональной успешностью по крите­рию отклонения значений от средней величины на 1/2 стандартного отклонения. При таком строгом критерии в "среднюю" группу попада­ют (при нормальном распределении) около 38,2% всех испытуемых, а в крайних группах оказывается по 30,9% испытуемых.

Чем меньше испытуемых оказывается в группах, тем меньше у нас возможностей для выявления достоверных различий, так как критические значения большинства критериев при малых n строже, чем при больших n.

Таким образом, при нестрогом разделении испытуемых на группы мы теряем в точности, а при строгом - в количестве испытуемых.

При решении задач выявления различий в уровневых показателях следует помнить, что "усредненный профиль успешного специалиста" должен рассматриваться скорее как исследовательский результат, по­зволяющий сформулировать гипотезы для дальнейших исследований, а не как основание для профессионального отбора. Тому есть две причи­ны.

Во-первых , ни у одного из успешных специалистов может не на­блюдаться "усредненный профиль" - он, в сущности, является отвле­ченным обобщением;

во-вторых , в профессиональной деятельности на­личие собственного индивидуального стиля важнее соответствия "среднегрупповому" профилю. Недостаток в тех качествах, которые могут казаться важными, компенсируется другими качествами. У каж­дого успешного специалиста его психологические свойства создают не­повторимый ансамбль, который при усреднении данных теряется.

Р.Б. Кеттелл, учитывая это, предлагал при исследовании профес­сиональной успешности включать в рассмотрение индивидуальные про­фили выдающихся представителей той или иной профессии (Cattel! R.B., Eber H.W., Tatsuoka M., 1970).

Сопоставление уровневых показателей в разных выборках может быть необходимой частью комплексных диагностических, учебных, психокоррекционных и иных программ. Оно помогает нам обратить внима­ние на те особенности обследованных выборок, которые должны быть учтены и использованы при адаптации программ к данной группе в процессе их конкретного воплощения.

Критерии, которые рассматриваются в данной главе, предполага­ют, что мы сопоставляем так называемые независимые выборки, то есть две или более выборки, состоящие из разных испытуемых. Тот испытуемый, который входит в одну выборку, уже не может входить в другую. В противоположность этому, если мы обследуем одну и ту же выборку испытуемых, несколько раз подвергая её аналогичным измере­ниям ("замерам"), то перед нами - так называемые связанные, или за­висимые, выборки данных. Сопоставление 2-х или более замеров, полу­ченных на одной и той же выборке, рассматривается в Теме 4.

Решение о выборе того или иного критерия принимается на осно­ве того, сколько выборок сопоставляется и каков их объем (см. Алго­ритм 7 в конце темы).

Вопрос 2 Q - критерий Розенбаума

Назначение критерия

Критерий используется для оценки различий между двумя вы­борками по уровню какого-либо признака, количественно измеренного. В каждой из выборок должно быть не менее 11 испытуемых.

Описание критерия

Это очень простой непараметрический критерий, который позво­ляет быстро оценить различия между двумя выборками по какому-либо признаку. Однако если критерий Q не выявляет достоверных различий, это еще не означает, что их действительно нет.

В этом случае стоит применить критерий φ* Фишера. Если же Q-критерии выявляет достоверные различия между выборками с уров­нем значимости р< 0,01, можно ограничиться только им и избежать трудностей применения других критериев.

Критерий применяется в тех случаях, когда данные представлены по крайней мере в порядковой шкале. Признак должен варьировать в каком-то диапазоне значений, иначе сопоставления с помощью Q -критерия просто невозможны. Например, если у нас только 3 значения признака, 1, 2 и 3, - нам очень трудно будет установить различия. Ме­тод Роэенбаума требует, следовательно, достаточно тонко измеренных признаков.

Применение критерия начинаем с того, что упорядочиваем значе­ния признака в обеих выборках по нарастанию (или убыванию) призна­ка. Лучше всего, если данные каждого испытуемого представлены на отдельной карточке. Тогда ничего не стоит упорядочить два ряда зна­чении по интересующему нас признаку, раскладывая карточки на столе. Так мы сразу увидим, совпадают ли диапазоны значений, и если нет, то насколько один ряд значений "выше" (S1 ), а второй - "ниже" (S2 ).

Для того, чтобы не запутаться, в этом и во многих других критериях рекомендуется первым рядом (выборкой, группой) считать тот ряд, где значения выше, а вторым рядом - тот, где значения ниже.

Гипотезы

Н0 : Уровень признака в выборке 1 не превышает уровня признака в выборке 2.

H1 : Уровень признака в выборке 1 превышает уровень признака в вы­борке 2.

Графическое представление критерия Q

На Рис. 2.2. представлены три варианта соотношения рядов зна­чений в двух выборках. В варианте (а) все значения первого ряда выше всех значений второго ряда. Различия, безусловно, достоверны, при соблюдении условия, что n 1, n 2 > 11.

В варианте (б), напротив, оба ряда находятся на одном и том же уровне: различия недостоверны. В варианте (в) ряды частично пере­крещиваются, но все же первый ряд оказывается гораздо выше второго. Достаточно ли велики зоны S 1 и S 2 , в сумме составляющие Q, можно определить по Таблице I Приложения 1, где приведены критические значения Q для разных n. Чем величина Q больше, тем более досто­верные различия мы сможем констатировать.

Рис. 2.2. Возможные соотношения рядов значений в двух выборках:

* S 1 - зона значений 1-го ряда, которые выше максимального значения 2-го ряда;

* S 2 - зона значений второго ряда, ко­торые меньше минимального значения 1-го ряда;

*штриховкой отмечены перекрещивающиеся зоны двух рядов

Ограничения критерия Q

1. В каждой из сопоставляемых выборок должно быть не менее 11 на­блюдений. При этом объемы выборок должны примерно совпадать. Е.В. Гублером указываются следующие правила :

а) если в обеих выборках меньше 50 наблюдений, то абсолютная ве­личина разности между n 1 и n 2 не должна быть больше 10 на­блюдений;

б) если в каждой из выборок больше 51 наблюдения, но меньше 100 , то абсолютная величина разности между n 1 и n 2 не должна быть больше 20 наблюдений;

в) если в каждой из выборок больше 100 наблюдений, то допуска­ется, чтобы одна из выборок была больше другой не более чем в 1,5-2 раза (Гублер Е.В., 1978, с. 75).

2. Диапазоны разброса значений в двух выборках должны не совпадать между собой, в противном случае применение критерия бессмыслен­но. Между тем, возможны случаи, когда

диапазоны разброса значе­ний совпадают, но, вследствие разносторонней асимметрии двух рас­пределений, различия в средних величинах признаков существенны (Рис. 2.3., 2.4).


Рис. 2.3. Вариант соотношения распределений признака в двух выборках, при котором критерий Q беспомощен


Рис. 2.4. Вариант соотношения распределений признака в двух выборках, при котором критерий Q может быть могущественным

Пример

У предполагаемых участников психологического эксперимента, моделирующего деятельность воздушного диспетчера, был измерен уро­вень вербального и невербального интеллекта с помощью методики Д. Векслера. Было обследовано 26 юношей в возрасте от 18 до 24 лет (средний возраст 20,5 лет). 14 из них были студентами физического факультета, а 12 - студентами психологического факультета Ленинград­ского университета (Сидоренко Е.В., 1978). Показатели вербального интеллекта представлены в Табл. 2.1.

Можно ли утверждать, что одна из групп превосходит другую по уровню вербального интеллекта?

Таблица 2.1

Индивидуальные значения вербального интеллекта в выборках студен­тов физического (n1 =14) и психологического (п2 =12) факультетов

Студе нты-физики

Студенты - психологи

Код имени

испытуемого

Показатели вербального интеллекта

Код имени

испытуемого

Показатель вербального

интеллекта

1.

И.А

132

1.

Н.Т.

126

2.

К.А.

134

2.

О.В.

127

3.

К.Е.

124

3.

Е.В.

132

4.

П.А.

132

4.

Ф.О.

120

5.

С.А.

135

5.

И.Н.

119

6.

СтЛ.

132

6.

И.Ч.

126

7.

Т.А.

131

7.

И.8.

120

8.

Ф.А.

132

8.

КО.

123

9.

Ч.И.

121

9.

Р.Р.

120

10.

Ц.А.

127

10.

Р.И.

116

11.

См.А.

136

11.

O.K.

123

12.

КАн.

129

12.

Н.К.

115

13.

Б.Л.

136

14.

Ф.В.

136

Упорядочим значения в обеих выборках, а затем сформулируем гипотезы:

H0 : Студенты-физики не превосходят студентов-психологов по уровню вербального интеллекта.

H1 : Студенты-физики превосходят студентов-психологов по уровню вербального интеллекта.

р а при Q9 Mn <Q


мы


1( p


Таблица 2.2.

Упорядоченные по убыванию вербального интеллекта ряды индивидуальных значении в двух студенческих выборках

1 ряд – студенты-физики

2 ряд – студенты-психологи

1

См.А

136

S1

2

Б.Л.

136

3

Ф.В.

136

4

С.А.

135

5

К.А.

134

6

И.К.

132

1

Е.В.

132

7

П.А.

132

8

Ст.А.

132

9

Ф.А.

132

10

Т.А.

131

11

К.Ан.

129

12

Ц.А.

127

2

О.В.

127

3

Н.Т.

126

4

И.Ч.

126

13

К.Е.

124

5

К.О.

123

6

О.К.

123

14

Ч.И.

121

S2

7

Ф.О.

120

8

И.В.

120

9

Р.Р.

120

10

И.Н.

119

11

Р.И.

116

12

Н.К.

115

Как видно из Табл. 2.2, мы правильно обозначили ряды: пер­вый, тот, что "выше " - ряд физиков, а второй, тот, что "ниже " - ряд психологов.

По Табл. 2.2 определяем количество значений первого ряда, ко­торые больше максимального значения второго ряда: S 1 =5.

Теперь определяем количество значений второго ряда, которые меньше минимального значения первого ряда: S 2 =6.

Вычисляем Q эмп по формуле:

Q эмп = S 1 + S 2 = 5+6 =11

По Табл.1 Приложения 1 определяем критические значения Q для n1 =14, n2 =12:

Qкр =

Ясно, что чем больше расхождения между выборками, тем больше величина Q . Н0 отклоняется при Q эмп Q кр, а при Q эмп < Q кр мы будем вынуждены принять Н0.

Построим «ось значимости»

Q0,05

Q0,01

?

Q эмп

!

7

9

11

Q эмп > Q кр (p≤0.01)

Ответ: H0 отклоняется.

Принимается H 1 . Студенты-физики превосходят студентов-психологов по уровню вербального интеллекта (р<0,01). Отметим, что в тех случаях, когда эмпирическая величина критерия оказывается на границе зоны незначимости, мы имеем право утверждать лишь, что различия достоверны при р< 0,05, если же оно оказывается между двумя критическими значениями, то мы можем утверждать, что р< 0,05.

Если эмпирическое значение критерия оказывается на границе, мы можем утверждать, что р< 0,01, если оно попадает в зону значимо­сти, мы можем утверждать, что р< 0,01.

Поскольку уровень значимости выявленных различий достаточно высок (р<0,01), мы могли бы на этом остановиться. Однако если ис­следователь сам психолог, а не физик, вряд ли он на этом остановится. Он может попробовать сопоставить выборки по уровню невербального интеллекта, поскольку именно невербальный интеллект определяет уро­вень интеллекта в целом и степень его организованности (см., напри­мер: Бергер М.А., Логинова Н.А., 1974).

Мы вернемся к этому примеру при рассмотрении критерия Манна-Уитни и попытаемся ответить на вопрос о соотношении уровней не­вербального интеллекта в двух выборках. Быть может, психологи еще окажутся в более высоком ряду!

АЛГОРИТМ 3

Подсчет критерия Q Розенбаума

1.Проверить, выполняются ли ограничения: n 1, n 2 11, n1 ≈ n2

2.Упорядочить значения отдельно в каждой выборке по степени воз­растания признака. Считать выборкой 1 ту выборку, значения в ко­торой предположительно выше, а выборкой 2 - ту, где значения предположительно ниже.

3.Определить самое высокое (максимальное) значение в выборке 2.

4.Подсчитать количество значений в выборке 1, которые выше макси­мального значения в выборке 2. Обозначить полученную величину как S 1 .

5.Определить самое низкое (минимальное) значение в выборке 1.

6.Подсчитать количество значений в выборке 2, которые ниже мини­мального значения выборки 1. Обозначить полученную величину как S2 .

7. Подсчитать эмпирическое значение Q по формуле: Q = S 1 + S 2 .

8.По Табл. I Приложения I определить критические значения Q для данных n1, и n2. Если Qэмп равно Q0,05 или превышает его, Н0 от­вергается.

9.При n1, n2 > 26 сопоставить полученное эмпирическое значение с Qкр =8 (р≤0,05) и QKp =10(p≤0,01). Если Qэмп превышает или по
крайней мере равняется Qкр=8, H0 отвергается.

Вопрос 2.3 U - критерий Манна-Уитнн

Назначение критерия

Критерий предназначен для оценки различий между двумя вы­борками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между мал ыми выборками, когда n1, n2 ≥3 или n1 =2, n2 ≥5. И является более мощным, чем критерий Розенбаума.

Описание критерия

Существует несколько способов использования критерия и не­сколько вариантов таблиц критических значений, соответствующих этим способам (Гублер Е. В., 1978; Рунион Р., 1982; Захаров В. П.Р 1985; McCall R., 1970; Krauth J., 1988).

Этот метод определяет, достаточно ли мала зона перекрещиваю­щихся значений между двумя рядами. Мы помним, что 1-м рядом (выборкой, группой) мы называем тот ряд значений, в котором значе­ния, по предварительной оценке, выше, а 2-м рядом - тот, где они предположительно ниже.

Чем меньше область перекрещивающихся значений, тем более ве­роятно, что различия достоверны. Иногда эти различия называют раз­личиями в расположении двух выборок (Welkowitz J. et al., 1982).

Эмпирическое значение критерия U отражает то, насколько вели­ка зона совпадения между рядами. Поэтому чем меньше U эмп, тем более вероятно, что различия достоверны.

Гипотезы

H0 : Уровень признака в группе 2 не ниже уровня признака