При студирањето корелациисе обидува да утврди дали постои некаква врска помеѓу два индикатори во истиот примерок (на пример, помеѓу висината и тежината на децата или помеѓу нивото на IQи училишните резултати) или помеѓу два различни примероци (на пример, кога се споредуваат парови близнаци), и ако оваа врска постои, тогаш дали зголемувањето на еден индикатор е придружено со зголемување (позитивна корелација) или намалување (негативна корелација) во другиот.

Со други зборови, анализата на корелација помага да се утврди дали е можно да се предвидат можните вредности на еден индикатор, знаејќи ја вредноста на друг.

Досега, кога ги анализиравме резултатите од нашето искуство во проучувањето на ефектите на марихуаната, намерно игнориравме таков индикатор како време на реакција. Во меѓувреме, би било интересно да се провери дали постои врска помеѓу ефективноста на реакциите и нивната брзина. Ова би овозможило, на пример, да се тврди дека колку е побавен човек, толку попрецизни и поефикасни ќе бидат неговите постапки и обратно.

За таа цел, може да се користат два различни методи: параметарски метод за пресметување на коефициентот Браве-Пирсон (р)и пресметување на коефициентот на корелација на ранг Спирман с ), што се однесува на редни податоци, т.е. е непараметриски. Сепак, прво да разбереме што е коефициент на корелација.

Коефициент на корелација

Коефициентот на корелација е вредност која може да варира од -1 до 1. Во случај на целосна позитивна корелација, овој коефициент е плус 1, а во случај на целосно негативна корелација, тој е минус 1. На графиконот, ова одговара на права линија што минува низ точките на пресек на вредностите на секој пар податоци:

Променлива

Ако овие точки не се редат во права линија, туку формираат „облак“, коефициентот на корелација во апсолутна вредност станува помал од еден и, како што овој облак се заокружува, се приближува до нула:

Ако коефициентот на корелација е 0, двете променливи се целосно независни една од друга.

Во хуманистичките науки, корелацијата се смета за силна ако нејзиниот коефициент е поголем од 0,60; ако надмине 0,90, тогаш корелацијата се смета за многу силна. Меѓутоа, за да може да се извлечат заклучоци за односите меѓу променливите, големината на примерокот е од големо значење: колку е поголем примерокот, толку е посигурна вредноста на добиениот коефициент на корелација. Постојат табели со критични вредности на коефициентот на корелација Браве-Пирсон и Спирман за различни броеви на степени на слобода (тоа е еднакво на бројот на парови минус 2, т.е. n-2). Само ако коефициентите на корелација се поголеми од овие критични вредности, може да се сметаат за сигурни. Значи, за да може коефициентот на корелација од 0,70 да биде сигурен, во анализата мора да се земат најмалку 8 пара податоци. ( = П - 2 = 6) при пресметување р(Табела Б.4) и 7 пара податоци (= n - 2 = 5) при пресметување р с (Табела 5 во Додаток Б. 5).

Браве-Пирсон коефициент

За да го пресметате овој коефициент, користете ја следнава формула (може да изгледа различно за различни автори):

каде што  XY - збирот на производите на податоците од секој пар;

n - број на парови;

- просек за дадената променлива X;

Просек за променливи податоци Y;

С X - x;

с Y - стандардна девијација за дистрибуција u.

Сега можеме да го искористиме овој коефициент за да утврдиме дали постои врска помеѓу времето на реакција на субјектите и ефективноста на нивните дејства. Земете го, на пример, нивото на позадината на контролната група.

n= 15  15,8  13,4 = 3175,8;

(n 1)С x С y = 14  3,07  2,29 = 98,42;

р =

Негативен коефициент на корелација може да значи дека колку е подолго времето на реакција, толку е помала изведбата. Сепак, неговата вредност е премногу мала за да ни овозможи да зборуваме за сигурна врска помеѓу овие две променливи.

nXY=………

(n- 1) С X С Y = ……

Каков заклучок може да се извлече од овие резултати? Ако мислите дека постои врска помеѓу променливите, дали е таа директна или инверзна? Дали е сигурен [види маса 4 (во прилог Б. 5) со критични вредности р]?

Спирмановиот коефициент на корелација на рангр с

Овој коефициент е полесно да се пресмета, но резултатите се помалку точни отколку кога се користи р.Ова се должи на фактот што при пресметување на коефициентот Спирман се користи редоследот на податоците, а не нивните квантитативни карактеристики и интервали помеѓу класите.

Поентата е дека кога се користи коефициентот на корелација на ранг Спирмен с ) тие само проверуваат дали рангирањето на податоците за кој било примерок ќе биде исто како и во голем број други податоци за овој примерок, парно поврзани со првиот (на пример, дали учениците ќе бидат подеднакво „рангирани“ кога ќе полагаат и психологија и математика, или дури и со двајца различни професори по психологија?). Ако коефициентот е блиску до + 1, тогаш тоа значи дека и двете серии се практично идентични, а ако овој коефициент е блиску до - 1, можеме да зборуваме за целосна инверзна врска.

Коефициент р с пресметано со формулата

Каде г-разликата помеѓу рангот на вредностите на конјугирани карактеристики (без оглед на неговиот знак) и n-број на парови

Вообичаено, овој непараметриски тест се користи во случаи кога е неопходно да се извлечат некои заклучоци не толку за интервалипомеѓу податоците, колку за нив чинови,а исто така и кога кривите на дистрибуција се премногу асиметрични и не дозволуваат употреба на параметарски критериуми како што е коефициентот р(во овие случаи може да биде потребно да се претворат квантитативните податоци во редни податоци).

Бидејќи ова е случај со распределбата на вредностите на ефикасноста и времето на реакција во експерименталната група по изложувањето, можете да ги повторите пресметките што веќе сте ги направиле за оваа група, само сега не за коефициентот р, и за индикаторот р с . Ова ќе ви овозможи да видите колку се разликуваат двете*.

*Треба да се запомни дека

1) за бројот на погодоци, рангирањето 1 одговара на највисоката, а 15 на најниската изведба, додека за времето на реакција, рангирањето 1 одговара на најкраткото време, а 15 на најдолгото;

2) ex aequo податоците добиваат среден ранг.

Така, како во случајот со коефициентот r,добиен е позитивен, иако несигурен резултат. Кој од двата резултати е поверодостоен: r =-0,48 или р с = +0,24? Ова прашање може да се појави само ако резултатите се сигурни.

Би сакал уште еднаш да нагласам дека суштината на овие два коефициенти е малку поинаква. Негативен коефициент рпокажува дека ефикасноста е често повисока, толку е пократко времето на реакција, додека при пресметување на коефициентот р с беше потребно да се провери дали побрзите субјекти секогаш реагираат попрецизно, а побавните - помалку прецизно.

Бидејќи во експерименталната група по експозицијата е добиен коефициент р с , еднакво на 0,24, сличен тренд очигледно не е видлив овде. Обидете се сами да ги разберете податоците за контролната група по интервенцијата, знаејќи дека  г 2 = 122,5:

; Дали е сигурен?

Кој е вашиот заклучок?………………………………………………………………………………………………………………………

…………………………………………………………………………………………………………………….

Значи, разгледавме различни параметарски и непараметриски статистички методи кои се користат во психологијата. Нашиот преглед беше многу површен, а неговата главна задача беше да го натера читателот да разбере дека статистиката не е толку страшна како што изгледа и бара главно здрав разум. Ве потсетуваме дека податоците за „искуството“ со кои се занимававме овде се фиктивни и не можат да послужат како основа за какви било заклучоци. Сепак, таков експеримент навистина би бил вреден да се спроведе. Бидејќи за овој експеримент беше избрана чисто класична техника, истата статистичка анализа може да се користи во многу различни експерименти. Во секој случај, ни се чини дека наведовме некои главни насоки кои можат да бидат корисни за оние кои не знаат од каде да почнат со статистичка анализа на добиените резултати.

Постојат три главни гранки на статистиката: описна статистика, индуктивна статистика и корелација.

Во научните истражувања, често има потреба да се најде врска помеѓу исходот и факторските варијабли (приносот на културата и количината на врнежи, висината и тежината на лицето во хомогени групи според пол и возраст, отчукувањата на срцето и телесната температура итн.).

Вторите се знаци кои придонесуваат за промени во оние поврзани со нив (првиот).

Концептот на корелација анализа

Има многу. Врз основа на горенаведеното, можеме да кажеме дека корелациската анализа е метод кој се користи за тестирање на хипотезата за статистичката значајност на две или повеќе променливи доколку истражувачот може да ги измери, но не и да ги промени.

Постојат и други дефиниции за концептот за кој станува збор. Анализата на корелација е метод на обработка што вклучува проучување на коефициентите на корелација помеѓу променливите. Во овој случај, коефициентите на корелација помеѓу еден пар или многу пара карактеристики се споредуваат за да се воспостават статистички односи меѓу нив. Анализата на корелација е метод за проучување на статистичката зависност помеѓу случајните променливи со опционално присуство на строга функционална природа, во која динамиката на една случајна променлива води до динамика на математичкото очекување на друга.

Концептот на лажна корелација

При спроведување на корелационата анализа, неопходно е да се земе предвид дека може да се спроведе во однос на кој било збир на карактеристики, често апсурдни едни со други. Понекогаш тие немаат причинско-последична врска едни со други.

Во овој случај, тие зборуваат за лажна корелација.

Проблеми на корелација анализа

Врз основа на горенаведените дефиниции, може да се формулираат следните задачи на опишаниот метод: да се добијат информации за една од бараните променливи користејќи друга; се утврди блискоста на односот помеѓу проучуваните променливи.

Анализата на корелација вклучува определување на односот помеѓу карактеристиките што се проучуваат, и затоа задачите на корелационата анализа може да се дополнат со следново:

  • идентификација на фактори кои имаат најголемо влијание врз добиената карактеристика;
  • идентификација на претходно неистражени причини за врски;
  • изградба на корелација модел со негова параметарска анализа;
  • проучување на значењето на комуникациските параметри и нивната интервална проценка.

Врска помеѓу корелација анализа и регресија

Методот на корелација анализа често не е ограничен само на наоѓање на блискоста на односот помеѓу проучуваните величини. Понекогаш се надополнува со компилација на равенки за регресија, кои се добиваат со помош на истоимената анализа и кои претставуваат опис на корелациската зависност помеѓу добиената и факторска (факторска) карактеристика (карактеристики). Овој метод, заедно со анализата што се разгледува, го сочинуваат методот

Услови за користење на методот

Ефективните фактори зависат од еден до неколку фактори. Методот на анализа на корелација може да се користи доколку има голем број на набљудувања за вредноста на ефективни и факторски показатели (фактори), додека факторите што се проучуваат мора да бидат квантитативни и да се рефлектираат во конкретни извори. Првиот може да се определи со нормалниот закон - во овој случај, резултатот од анализата на корелација се Пирсоновите коефициенти на корелација или, ако карактеристиките не го почитуваат овој закон, се користи коефициентот на корелација на ранг Спирман.

Правила за избор на фактори за анализа на корелација

При примена на овој метод, потребно е да се утврдат факторите кои влијаат на индикаторите за успешност. Тие се избрани земајќи го предвид фактот дека мора да има причинско-последична врска помеѓу индикаторите. Во случај на креирање на мултифакторски модел на корелација, се избираат оние кои имаат значително влијание врз добиениот индикатор, додека пожелно е да не се вклучат меѓузависни фактори со коефициент на парна корелација поголем од 0,85 во моделот на корелација, како и оние за кои односот со резултантниот параметар не е линеарен или функционален карактер.

Се прикажуваат резултати

Резултатите од корелациската анализа може да се претстават во текст и графички форми. Во првиот случај тие се претставени како коефициент на корелација, во вториот - во форма на дијаграм на расејување.

Во отсуство на корелација помеѓу параметрите, точките на дијаграмот се лоцирани хаотично, просечниот степен на поврзување се карактеризира со поголем степен на ред и се карактеризира со повеќе или помалку рамномерно растојание на означените ознаки од медијаната. Силната врска има тенденција да биде права и при r=1 точката е рамна линија. Обратна корелација се разликува во насоката на графиконот од горниот лев кон долниот десен агол, директна корелација - од долниот лев до горниот десен агол.

3D приказ на заговор за расејување

Дополнително на традиционалниот 2D дисплеј за расејување, сега се користи 3Д графичка претстава на корелација анализа.

Се користи и матрица на расфрлање, која ги прикажува сите спарени парцели во една фигура во формат на матрица. За n променливи, матрицата содржи n редови и n колони. Графиконот кој се наоѓа на пресекот на i-тата редица и j-тата колона е график на променливите Xi наспроти Xj. Така, секој ред и колона е една димензија, една клетка прикажува распрскувач со две димензии.

Проценка на затегнатоста на врската

Блискоста на корелациската врска се одредува со коефициентот на корелација (r): силно - r = ±0,7 до ±1, средно - r = ±0,3 до ±0,699, слабо - r = 0 до ±0,299. Оваа класификација не е строга. Сликата покажува малку поинаков дијаграм.

Пример за користење на методот на анализа на корелација

Во Велика Британија беше спроведена интересна студија. Посветен е на врската помеѓу пушењето и ракот на белите дробови и беше спроведен преку корелација. Ова набљудување е претставено подолу.

Почетни податоци за корелација анализа

Професионална група

смртност

Земјоделци, шумари и рибари

Рудари и работници во каменолом

Производители на гас, кокс и хемикалии

Производители на стакло и керамика

Работници на печки, ковачи, леарници и валавници

Работници во електроника и електроника

Инженеринг и сродни професии

Индустрии за обработка на дрво

Кожари

Текстилни работници

Производители на работна облека

Работници во индустријата за храна, пијалоци и тутун

Производителите на хартија и печатење

Производителите на други производи

Градежници

Сликари и декоратори

Возачи на неподвижни мотори, дигалки итн.

Работници кои не се вклучени на друго место

Работници за транспорт и врски

Работници во магацини, магационери, пакувачи и работници во машина за полнење

Канцелариски работници

Продавачи

Спортски и рекреативни работници

Администратори и менаџери

Професионалци, техничари и уметници

Започнуваме анализа на корелација. За јасност, подобро е да го започнеме решението со графички метод, за кој ќе конструираме дијаграм за расејување.

Тоа покажува директна врска. Сепак, тешко е да се извлече недвосмислен заклучок само врз основа на графичкиот метод. Затоа, ќе продолжиме да вршиме корелациона анализа. Пример за пресметување на коефициентот на корелација е претставен подолу.

Со помош на софтвер (MS Excel ќе биде опишан подолу како пример), го одредуваме коефициентот на корелација, кој е 0,716, што значи силна врска помеѓу параметрите што се испитуваат. Да ја одредиме статистичката веродостојност на добиената вредност користејќи ја соодветната табела, за која треба да одземеме 2 од 25 пара вредности, како резултат добиваме 23 и користејќи ја оваа линија во табелата наоѓаме r критична за p = 0,01 (бидејќи тоа се медицински податоци, построга зависност, во други случаи е доволна p=0,05), што е 0,51 за оваа корелација анализа. Примерот покажа дека пресметаниот r е поголем од критичниот r, а вредноста на коефициентот на корелација се смета за статистички сигурна.

Користење на софтвер при спроведување на корелациона анализа

Опишаниот тип на статистичка обработка на податоци може да се изврши со помош на софтвер, особено MS Excel. Корелацијата вклучува пресметување на следните параметри користејќи функции:

1. Коефициентот на корелација се одредува со помош на функцијата CORREL (низа1; низа2). Низа 1,2 - ќелија на интервалот на вредностите на резултантните и факторските променливи.

Коефициентот на линеарна корелација се нарекува и коефициент на корелација на Пирсон, и затоа, почнувајќи од Excel 2007, можете да ја користите функцијата со истите низи.

Графичкиот приказ на анализата на корелација во Excel се прави со помош на панелот „Табли“ со избор „Scatter Plot“.

По одредувањето на првичните податоци, добиваме график.

2. Проценување на значајноста на коефициентот на парна корелација со помош на Student’s t-тест. Пресметаната вредност на критериумот t се споредува со табеларната (критична) вредност на овој индикатор од соодветната табела на вредности на параметарот што се разгледува, земајќи го предвид одреденото ниво на значајност и бројот на степени на слобода. Оваа проценка се врши со помош на функцијата STUDISCOVER (веројатност; степени_на_слобода).

3. Матрица на коефициенти на корелација на парови. Анализата се врши со помош на алатката Data Analysis, во која се избира Корелација. Статистичката проценка на коефициентите на корелација на парот се врши со споредување на неговата апсолутна вредност со табеларната (критична) вредност. Кога пресметаниот коефициент на парна корелација го надминува критичниот, можеме да кажеме, земајќи го предвид дадениот степен на веројатност, дека нултата хипотеза за значајноста на линеарната врска не е отфрлена.

Конечно

Употребата на методот на анализа на корелација во научното истражување ни овозможува да ја одредиме врската помеѓу различните фактори и индикаторите за успешност. Неопходно е да се земе предвид дека висок коефициент на корелација може да се добие од апсурден пар или збир на податоци, и затоа овој тип на анализа мора да се изврши на доволно голема низа на податоци.

По добивањето на пресметаната вредност на r, препорачливо е да се спореди со критичната r за да се потврди статистичката веродостојност на одредена вредност. Анализата на корелација може да се изврши рачно користејќи формули или со користење на софтвер, особено MS Excel. Овде можете исто така да конструирате дијаграм на расејување со цел визуелно да се прикаже односот помеѓу проучуваните фактори на корелација анализа и добиената карактеристика.

Коефициентот на корелација е степенот на поврзаност помеѓу две променливи. Неговата пресметка дава идеја за тоа дали постои врска помеѓу две групи на податоци. За разлика од регресијата, корелацијата не ги предвидува вредностите на количините. Сепак, пресметувањето на коефициентот е важен чекор во прелиминарната статистичка анализа. На пример, откривме дека коефициентот на корелација помеѓу нивото на странски директни инвестиции и стапката на раст на БДП е висок. Ова ни дава идеја дека за да се обезбеди просперитет, неопходно е да се создаде поволна клима специјално за странските претприемачи. Не толку очигледен заклучок на прв поглед!

Корелација и каузалност

Можеби не постои ниту една област на статистика што стана толку цврсто воспоставена во нашите животи. Коефициентот на корелација се користи во сите области на општественото знаење. Нејзината главна опасност е што често се шпекулира за неговите високи вредности за да се убедат луѓето и да се натераат да веруваат во некои заклучоци. Меѓутоа, всушност, силната корелација воопшто не укажува на причинско-последична врска помеѓу количините.

Коефициент на корелација: Формула на Пирсон и Спирман

Постојат неколку основни индикатори кои ја карактеризираат врската помеѓу две променливи. Историски, првиот е Пирсоновиот линеарен коефициент на корелација. Се учи на училиште. Таа беше развиена од K. Pearson и J. Yule врз основа на работата на о. Галтон. Овој коефициент ви овозможува да ја видите врската помеѓу рационалните броеви кои рационално се менуваат. Секогаш е поголем од -1 и помал од 1. Негативен број укажува на обратно пропорционална врска. Ако коефициентот е нула, тогаш нема врска помеѓу променливите. Еднакво на позитивен број - постои директно пропорционална врска помеѓу количините што се испитуваат. Коефициентот на корелација на рангот на Спирман ви овозможува да ги поедноставите пресметките со градење на хиерархија на променливи вредности.

Врски меѓу променливите

Корелацијата помага да се одговори на две прашања. Прво, дали врската помеѓу променливите е позитивна или негативна. Второ, колку е силна зависноста. Анализата на корелација е моќна алатка која може да ги обезбеди овие важни информации. Лесно е да се види дека семејните приходи и трошоци пропорционално паѓаат и растат. Овој однос се смета за позитивен. Напротив, кога цената на производот расте, побарувачката за него опаѓа. Овој однос се нарекува негативен. Вредностите на коефициентот на корелација се движат помеѓу -1 и 1. Нула значи дека нема врска помеѓу вредностите што се испитуваат. Колку добиениот индикатор е поблиску до екстремните вредности, толку е посилна врската (негативна или позитивна). Отсуството на зависност е означено со коефициент од -0,1 до 0,1. Треба да разберете дека таквата вредност само укажува на отсуство на линеарна врска.

Карактеристики на апликацијата

Употребата на двата показатели вклучува одредени претпоставки. Прво, присуството на силна врска не го одредува фактот дека едната количина ја одредува другата количина. Можеби постои трета количина што ја дефинира секоја од нив. Второ, високиот Пирсонов коефициент на корелација не укажува на причинско-последична врска помеѓу проучуваните варијабли. Трето, покажува исклучиво линеарна врска. Корелацијата може да се користи за евалуација на значајни квантитативни податоци (на пр. барометриски притисок, температура на воздухот) наместо категории како што се пол или омилена боја.

Коефициент на повеќекратна корелација

Пирсон и Спирман ја испитуваа врската помеѓу две променливи. Но, што да направите ако има три, па дури и повеќе од нив. Ова е местото каде што повеќекратниот коефициент на корелација доаѓа на помош. На пример, на бруто националниот производ не влијаат само странските директни инвестиции, туку и монетарната и фискалната политика на владата, како и нивото на извозот. Стапката на раст и обемот на БДП се резултат на интеракцијата на голем број фактори. Сепак, мора да се разбере дека моделот на повеќекратна корелација се заснова на голем број поедноставувања и претпоставки. Прво, мултиколинеарноста помеѓу вредностите е исклучена. Второ, односот помеѓу зависното и променливите што влијаат врз него се смета за линеарен.

Области на употреба на корелација и регресивна анализа

Овој метод за пронаоѓање на врски помеѓу количините е широко користен во статистиката. Најчесто се прибегнува кон тоа во три главни случаи:

  1. Да се ​​тестираат причинско-последичните врски помеѓу вредностите на две променливи. Како резултат на тоа, истражувачот се надева дека ќе открие линеарна врска и ќе изведе формула која ги опишува овие односи помеѓу количините. Нивните мерни единици може да бидат различни.
  2. Да се ​​провери дали има врска помеѓу количините. Во овој случај, никој не одредува која променлива е зависната променлива. Може да испадне дека некој друг фактор ја одредува вредноста на двете количини.
  3. Да се ​​изведе равенка. Во овој случај, можете едноставно да ги замените броевите во неа и да ги дознаете вредностите на непознатата променлива.

Човек во потрага по причинско-последична врска

Свеста е дизајнирана на таков начин што дефинитивно треба да ги објасниме настаните што се случуваат околу нас. Човекот секогаш бара врска помеѓу сликата на светот во кој живее и информациите што ги добива. Мозокот често создава ред од хаос. Тој лесно може да види причинско-последична врска таму каде што ја нема. Научниците треба конкретно да научат да ја надминат оваа тенденција. Способноста за објективно оценување на односите помеѓу податоците е од суштинско значење во академската кариера.

Медиумска пристрасност

Ајде да размислиме како присуството на корелација може погрешно да се протолкува. Група британски студенти со лошо однесување биле прашани дали нивните родители пушат. Потоа тестот беше објавен во весникот. Резултатот покажа силна корелација помеѓу пушењето од страна на родителите и деликвенцијата на нивните деца. Професорот кој ја спроведе оваа студија дури предложи да се стави предупредување за ова на кутиите цигари. Сепак, има голем број проблеми со овој заклучок. Прво, корелацијата не покажува која од количините е независна. Затоа, сосема е можно да се претпостави дека штетната навика на родителите е предизвикана од непослушноста на децата. Второ, не може со сигурност да се каже дека двата проблеми не настанале поради некој трет фактор. На пример, семејства со ниски приходи. Вреди да се истакне емотивниот аспект на првичните наоди на професорот кој ја спроведе студијата. Тој беше жесток противник на пушењето. Затоа, не е чудно што тој ги толкувал резултатите од своето истражување на овој начин.

заклучоци

Погрешното толкување на корелацијата како причинско-последична врска помеѓу две променливи може да предизвика срамни грешки во истражувањето. Проблемот е што тоа лежи во самата основа на човековата свест. Многу маркетинг трикови се засноваат на оваа карактеристика. Разбирањето на разликата помеѓу причината и последицата и корелацијата ви овозможува рационално да ги анализирате информациите и во секојдневниот живот и во вашата професионална кариера.

Формула за коефициент на корелација

Во процесот на човековата економска активност, постепено се формираше цела класа на задачи за да се идентификуваат различни статистички обрасци.

Беше неопходно да се процени степенот на детерминизам на некои процеси од други, неопходно беше да се воспостави тесна меѓузависност помеѓу различните процеси и варијабли.
Корелацијата е поврзаност на променливите една со друга.

За да се процени блискоста на врската, беше воведен коефициент на корелација.

Физичко значење на коефициентот на корелација

Коефициентот на корелација има јасно физичко значење ако статистичките параметри на независните променливи се покоруваат на нормална дистрибуција; графички, таквата распределба е претставена со Гаусова крива. А зависноста е линеарна.

Коефициентот на корелација покажува колку еден процес е определен од друг. Оние. Кога еден процес се менува, колку често се менува зависниот процес. Воопшто не се менува – нема зависност, се менува веднаш секој пат – целосна зависност.

Коефициентот на корелација може да земе вредности во опсегот [-1:1]

Коефициентот нула значи дека нема врска помеѓу променливите што се разгледуваат.
Екстремните вредности на опсегот укажуваат на целосна зависност помеѓу променливите.

Ако вредноста на коефициентот е позитивна, тогаш врската е директна.

За негативен коефициент, спротивното е точно. Оние. во првиот случај, кога аргументот се менува, функцијата се менува пропорционално, во вториот случај, се менува обратно.
Кога вредноста на коефициентот на корелација е во средината на опсегот, т.е. од 0 до 1 или од -1 до 0 зборуваат за нецелосна функционална зависност.
Колку е поблиску вредноста на коефициентот до екстремите, толку е поголема врската помеѓу променливите или случајните вредности. Колку е поблиску вредноста до 0, толку е помала меѓузависноста.
Обично коефициентот на корелација зема средни вредности.

Коефициентот на корелација е немерлива големина

Коефициентот на корелација се користи во статистиката, во анализата на корелација, за тестирање на статистичките хипотези.

Со поставување на некоја статистичка хипотеза за зависноста на една случајна променлива од друга, се пресметува коефициентот на корелација. Врз основа на него, може да се процени дали постои врска помеѓу количините и колку е таа блиска.

Факт е дека не е секогаш можно да се види врската. Често количините не се директно поврзани едни со други, туку зависат од многу фактори. Како и да е, може да испадне дека преку многу индиректни врски случајните променливи излегуваат меѓусебно зависни. Се разбира, тоа не може да значи нивна директна врска, на пример, ако посредникот исчезне, зависноста исто така може да исчезне.

Во поглавје 4, ја разгледавме основната униваријатна описна статистика - мерки за централна тенденција и варијабилност кои се користат за опишување на една променлива. Во ова поглавје ќе ги разгледаме главните коефициенти на корелација.

Коефициент на корелација- биваријатна описна статистика, квантитативна мерка за односот (заедничка варијабилност) на две променливи.

Историјата на развојот и примената на коефициентите на корелација за проучување на односите всушност започна истовремено со појавата на мерниот пристап за проучување на индивидуалните разлики - во 1870-1880 година. Пионер во мерењето на човечките способности, како и автор на самиот термин „коефициент на корелација“, беше Френсис Галтон, а најпопуларните коефициенти на корелација ги разви неговиот следбеник Карл Пирсон. Оттогаш, проучувањето на односите со помош на коефициенти на корелација е една од најпопуларните активности во психологијата.

До денес, развиени се голем број различни коефициенти на корелација, а стотици книги се посветени на проблемот на мерење на односите со нивна помош. Затоа, без да се преправаме дека сме комплетни, ќе ги разгледаме само најважните, навистина незаменливите во истражувачките мерки на поврзаност - Пирсоновите, Спирмановите и Кендаловите. Нивната заедничка карактеристика е тоа што тие ја одразуваат врската помеѓу две карактеристики измерени на квантитативна скала - ранг или метрика.

Општо земено, секое емпириско истражување се фокусира на испитување на односите помеѓу две или повеќе променливи.

ПРИМЕРИ

Да дадеме два примери на истражување за ефектот на прикажување сцени на насилство на ТВ врз агресивноста на адолесцентите. 1. Се проучува врската помеѓу две променливи измерени на квантитативна (рангира или метричка) скала: 1) „време на гледање насилни телевизиски програми“; 2) „агресија“.

Чита како тау на Кендал.


ПОГЛАВЈЕ 6. КОЕФИЦИЕНТИ КОРЕЛАЦИЈА

2. Се проучува разликата во агресивноста на 2 или повеќе групи адолесценти, кои се разликуваат во времетраењето на гледање телевизиски програми со сцени на насилство.

Во вториот пример, проучувањето на разликите може да се претстави како студија за врската помеѓу 2 променливи, од кои едната е номинативна (времетраење на гледање ТВ емисии). И за оваа ситуација, развиени се и нашите сопствени коефициенти на корелација.

Секое истражување може да се сведе на проучување на корелации; за среќа, измислени се различни коефициенти на корелација за речиси секоја истражувачка ситуација. Но, во следната презентација ќе разликуваме две класи на проблеми:

П студија на корелации -кога две променливи се претставени на нумеричка скала;

проучување на разликите -кога барем една од двете променливи е претставена во номинативна скала.


Оваа поделба одговара и на логиката на конструирање на популарни компјутерски статистички програми, во кои во менито Корелациипредложени се три коефициенти (Pearson-овиот r, Spearman-овиот r и Kendall-овиот x), а се предложени и методи за групни споредби за решавање на други истражувачки проблеми.

ПОИМ НА КОРЕЛАЦИЈА

Односите на јазикот на математиката обично се опишуваат со користење на функции, кои графички се претставени како линии. На сл. Слика 6.1 прикажува неколку графикони на функции. Ако промената на една променлива за една единица секогаш менува друга променлива за иста количина, функцијата е линеарна(неговиот график претставува права линија); која било друга врска - нелинеарни.Ако зголемувањето на една променлива е поврзано со зголемување на друга, тогаш врската е позитивен (директен);ако зголемувањето на една променлива е поврзано со намалување на друга, тогаш врската е негативен (обратно).Ако насоката на промена на една променлива не се менува со зголемувањето (намалувањето) на друга променлива, тогаш таквата функција е монотоно;во спротивно се повикува функцијата немонотони.

Функционални врски,слични на оние прикажани на сл. 6.1 се идеализации. Нивната особеност е што една вредност на една променлива одговара на строго дефинирана вредност на друга променлива. На пример, ова е односот помеѓу две физички променливи - тежина и должина на телото (линеарно позитивно). Сепак, дури и во физичките експерименти, емпирискиот однос ќе се разликува од функционалниот однос поради неразјаснети или непознати причини: флуктуации во составот на материјалот, грешки во мерењето итн.

Ориз. 6.1. Примери на графикони на функции кои често се појавуваат

Во психологијата, како и во многу други науки, при проучувањето на односот на знаците, многу можни причини за варијабилноста на овие знаци неизбежно паѓаат надвор од видното поле на истражувачот. Резултатот е дека дури Функционалната врска помеѓу променливите што постои во реалноста делува емпириски како веројатност (стохастичка): истата вредност на една променлива одговара на распределбата на различни вредности на друга променлива (и обратно).Наједноставниот пример е односот на висината и тежината на луѓето. Емпириските резултати од проучувањето на овие две карактеристики, секако, ќе ја покажат нивната позитивна врска. Но, лесно е да се погоди дека ќе се разликува од строга, линеарна, позитивно - идеална математичка функција, дури и со сите трикови на истражувачот да ја земе предвид виткоста или дебелината на субјектите. (Малку е веројатно дека врз оваа основа некому би му паднало на памет да го негира фактот за постоење на строга функционална врска помеѓу должината и тежината на телото.)

Значи, во психологијата, како и во многу други науки, функционалниот однос на појавите може емпириски да се идентификува само како веројатна врска на соодветните карактеристики. Јасна идеја за природата на веројатната врска е дадена од дијаграм на расејување -график чии оски одговараат на вредностите на две променливи, а секој предмет претставува точка (сл. 6.2). Коефициентите на корелација се користат како нумеричка карактеристика на веројатноста за врска.