Saat belajar korelasi mencoba menentukan apakah terdapat hubungan antara dua indikator dalam sampel yang sama (misalnya antara tinggi badan dan berat badan anak atau antara tingkat IQ dan kinerja sekolah) atau antara dua sampel yang berbeda (misalnya ketika membandingkan pasangan anak kembar), dan jika hubungan ini ada, maka apakah peningkatan salah satu indikator dibarengi dengan peningkatan (korelasi positif) atau penurunan (korelasi negatif) dalam yang lain.

Dengan kata lain, analisis korelasi membantu menentukan apakah mungkin untuk memprediksi kemungkinan nilai suatu indikator, dengan mengetahui nilai indikator lainnya.

Hingga saat ini, ketika menganalisis hasil pengalaman kami mempelajari efek ganja, kami sengaja mengabaikan indikator seperti waktu reaksi. Sementara itu, menarik untuk memeriksa apakah ada hubungan antara efektivitas reaksi dan kecepatannya. Hal ini memungkinkan, misalnya, untuk menyatakan bahwa semakin lambat seseorang, semakin akurat dan efisien tindakannya dan sebaliknya.

Untuk tujuan ini, dua metode berbeda dapat digunakan: metode parametrik dalam menghitung koefisien Bravais-Pearson (R) dan perhitungan koefisien korelasi rank spearman (R S ), yang berlaku untuk data ordinal, yaitu nonparametrik. Namun, mari kita pahami dulu apa itu koefisien korelasi.

Koefisien korelasi

Koefisien korelasi adalah nilai yang dapat bervariasi dari -1 hingga 1. Dalam kasus korelasi positif penuh, koefisien ini ditambah 1, dan dalam kasus korelasi negatif penuh, dikurangi 1. Pada grafik, ini sesuai dengan garis lurus yang melalui titik potong nilai setiap pasangan data:

Variabel

Jika titik-titik ini tidak sejajar dalam garis lurus, tetapi membentuk “awan”, maka koefisien korelasi dalam nilai absolut menjadi kurang dari satu dan, saat awan ini dibulatkan, mendekati nol:

Jika koefisien korelasinya 0, kedua variabel tersebut benar-benar independen satu sama lain.

Dalam ilmu humaniora, suatu korelasi dianggap kuat jika koefisiennya lebih besar dari 0,60; jika melebihi 0,90 maka korelasinya tergolong sangat kuat. Namun, untuk dapat menarik kesimpulan tentang hubungan antar variabel, ukuran sampel sangatlah penting: semakin besar sampel, semakin dapat diandalkan nilai koefisien korelasi yang diperoleh. Terdapat tabel dengan nilai kritis koefisien korelasi Bravais-Pearson dan Spearman untuk jumlah derajat kebebasan yang berbeda (sama dengan jumlah pasangan dikurangi 2, yaitu. N-2). Hanya jika koefisien korelasi lebih besar dari nilai kritis ini maka koefisien tersebut dapat dianggap andal. Jadi, agar koefisien korelasi 0,70 dapat diandalkan, minimal harus ada 8 pasang data yang dimasukkan ke dalam analisis. ( = P - 2 = 6) saat menghitung R(Tabel B.4) dan 7 pasang data (= n - 2 = 5) saat menghitung R S (Tabel 5 pada Lampiran B.5).

Koefisien Bravais – Pearson

Untuk menghitung koefisien ini, gunakan rumus berikut (mungkin terlihat berbeda untuk penulis berbeda):

di mana  XY - jumlah produk data dari masing-masing pasangan;

N - jumlah pasangan;

- rata-rata untuk variabel tertentu X;

Rata-rata untuk data variabel Y;

S X - X;

S Y - simpangan baku untuk distribusi kamu.

Kita sekarang dapat menggunakan koefisien ini untuk menentukan apakah ada hubungan antara waktu reaksi subjek dan efektivitas tindakan mereka. Ambil contoh, tingkat latar belakang kelompok kontrol.

N= 15  15,8  13,4 = 3175,8;

(N 1)S X S kamu = 14  3,07  2,29 = 98,42;

R =

Koefisien korelasi negatif berarti semakin lama waktu reaksi, semakin rendah kinerjanya. Namun, nilainya terlalu kecil untuk memungkinkan kita membicarakan hubungan yang dapat diandalkan antara kedua variabel ini.

nXY=………

(N- 1)S X S Y = ……

Kesimpulan apa yang dapat diambil dari hasil ini? Kalau menurut kalian ada hubungan antar variabel, apakah langsung atau terbalik? Apakah ini dapat diandalkan [lihat meja 4 (selain B.5) dengan nilai kritis R]?

Koefisien korelasi peringkat SpearmanR S

Koefisien ini lebih mudah dihitung, namun hasilnya kurang akurat dibandingkan jika menggunakan R. Hal ini disebabkan ketika menghitung koefisien Spearman, yang digunakan adalah urutan data, dan bukan karakteristik kuantitatif dan interval antar kelas.

Intinya bila menggunakan koefisien korelasi rank pendekar tombak(R S ) mereka hanya memeriksa apakah peringkat data untuk sampel mana pun akan sama dengan sejumlah data lain untuk sampel ini, terkait berpasangan dengan sampel pertama (misalnya, apakah siswa akan “diberi peringkat” sama ketika mereka mengambil psikologi dan matematika, atau bahkan dengan dua guru psikologi yang berbeda?). Jika koefisiennya mendekati +1, berarti kedua deret tersebut praktis identik, dan jika koefisiennya mendekati -1, kita dapat berbicara tentang hubungan terbalik penuh.

Koefisien R S dihitung dengan rumus

Di mana D- selisih barisan nilai ciri konjugasi (apapun tandanya), dan N-jumlah pasangan

Biasanya, uji nonparametrik ini digunakan dalam kasus-kasus di mana perlu untuk menarik beberapa kesimpulan yang tidak terlalu penting interval antara data, berapa banyak tentang mereka peringkat, dan juga ketika kurva distribusi terlalu asimetris dan tidak memungkinkan penggunaan kriteria parametrik seperti koefisien R(dalam kasus ini mungkin perlu mengubah data kuantitatif menjadi data ordinal).

Karena demikian halnya dengan distribusi nilai efisiensi dan waktu reaksi pada kelompok eksperimen setelah pemaparan, Anda dapat mengulangi perhitungan yang telah Anda lakukan untuk kelompok ini, hanya saja sekarang bukan untuk koefisiennya. R, dan untuk indikatornya R S . Ini akan memungkinkan Anda melihat betapa berbedanya keduanya*.

*Perlu diingat bahwa

1) untuk jumlah pukulan, peringkat 1 menunjukkan kinerja tertinggi, dan 15 menunjukkan kinerja terendah, sedangkan untuk waktu reaksi, peringkat 1 menunjukkan waktu terpendek, dan 15 menunjukkan waktu terlama;

2) data ex aequo diberi peringkat sedang.

Jadi, seperti halnya koefisien R, hasil yang positif, meskipun tidak dapat diandalkan, diperoleh. Manakah dari dua hasil yang lebih masuk akal: r =-0,48 atau R S = +0,24? Pertanyaan ini hanya bisa muncul jika hasilnya dapat diandalkan.

Saya ingin tekankan sekali lagi bahwa inti dari kedua koefisien ini agak berbeda. Koefisien negatif R menunjukkan bahwa efisiensi seringkali semakin tinggi, semakin pendek waktu reaksi, sedangkan ketika menghitung koefisien R S perlu untuk memeriksa apakah subjek yang lebih cepat selalu merespons dengan lebih akurat, dan subjek yang lebih lambat selalu merespons dengan kurang akurat.

Karena pada kelompok eksperimen setelah paparan diperoleh koefisien R S , sama dengan 0,24, tren serupa jelas tidak terlihat di sini. Cobalah untuk memahami sendiri data untuk kelompok kontrol setelah intervensi, dengan mengetahui bahwa  D 2 = 122,5:

; Apakah ini dapat diandalkan?

Apa kesimpulan anda?................................................................................................................................................................................

…………………………………………………………………………………………………………………….

Jadi, kita telah melihat berbagai metode statistik parametrik dan non-parametrik yang digunakan dalam psikologi. Ulasan kami sangat dangkal, dan tugas utamanya adalah membuat pembaca memahami bahwa statistik tidak seseram kelihatannya, dan sebagian besar memerlukan akal sehat. Kami mengingatkan Anda bahwa data “pengalaman” yang kami bahas di sini adalah fiktif dan tidak dapat dijadikan dasar kesimpulan apa pun. Namun, eksperimen semacam itu layak dilakukan. Karena teknik klasik murni dipilih untuk eksperimen ini, analisis statistik yang sama dapat digunakan dalam banyak eksperimen berbeda. Bagaimanapun, tampaknya kami telah menguraikan beberapa arahan utama yang mungkin berguna bagi mereka yang tidak tahu harus mulai dari mana dengan analisis statistik dari hasil yang diperoleh.

Ada tiga cabang utama statistik: statistik deskriptif, statistik induktif, dan analisis korelasi.

Dalam penelitian ilmiah, seringkali ada kebutuhan untuk menemukan hubungan antara hasil dan variabel faktor (hasil panen dan jumlah curah hujan, tinggi dan berat badan seseorang dalam kelompok homogen berdasarkan jenis kelamin dan usia, detak jantung dan suhu tubuh. , dll.).

Yang kedua adalah tanda-tanda yang berkontribusi terhadap perubahan yang terkait dengannya (yang pertama).

Konsep analisis korelasi

Berdasarkan uraian di atas, kita dapat mengatakan bahwa analisis korelasi adalah suatu metode yang digunakan untuk menguji hipotesis tentang signifikansi statistik dua variabel atau lebih jika peneliti dapat mengukurnya, tetapi tidak dapat mengubahnya.

Ada definisi lain dari konsep yang dimaksud. Analisis korelasi adalah metode pengolahan yang melibatkan mempelajari koefisien korelasi antar variabel. Dalam hal ini, koefisien korelasi antara satu pasang atau banyak pasang karakteristik dibandingkan untuk membangun hubungan statistik di antara keduanya. Analisis korelasi adalah suatu metode untuk mempelajari ketergantungan statistik antara variabel acak dengan adanya opsional yang bersifat fungsional ketat, di mana dinamika suatu variabel acak mengarah pada dinamika ekspektasi matematis variabel lain.

Konsep korelasi palsu

Saat melakukan analisis korelasi, perlu diingat bahwa analisis tersebut dapat dilakukan dalam kaitannya dengan serangkaian karakteristik apa pun, seringkali tidak masuk akal dalam kaitannya satu sama lain. Terkadang mereka tidak memiliki hubungan sebab akibat satu sama lain.

Dalam hal ini, mereka berbicara tentang korelasi yang salah.

Masalah analisis korelasi

Berdasarkan definisi di atas, dapat dirumuskan tugas metode yang dijelaskan sebagai berikut: memperoleh informasi tentang salah satu variabel yang dicari dengan menggunakan variabel lain; mengetahui keeratan hubungan antar variabel yang diteliti.

Analisis korelasi meliputi penentuan hubungan antara ciri-ciri yang diteliti, oleh karena itu tugas analisis korelasi dapat dilengkapi dengan hal-hal berikut:

  • identifikasi faktor-faktor yang mempunyai pengaruh paling besar terhadap karakteristik yang dihasilkan;
  • identifikasi penyebab koneksi yang belum dijelajahi sebelumnya;
  • konstruksi model korelasi dengan analisis parametriknya;
  • studi tentang pentingnya parameter komunikasi dan penilaian intervalnya.

Hubungan antara analisis korelasi dan regresi

Metode analisis korelasi seringkali tidak sebatas mencari keeratan hubungan antara besaran-besaran yang diteliti. Kadang-kadang dilengkapi dengan penyusunan persamaan regresi, yang diperoleh dengan menggunakan analisis dengan nama yang sama, dan yang mewakili gambaran ketergantungan korelasi antara karakteristik (fitur) yang dihasilkan dan faktor (faktor). Metode ini, bersama dengan analisis yang sedang dipertimbangkan, merupakan metode

Ketentuan untuk menggunakan metode ini

Faktor efektif bergantung pada satu hingga beberapa faktor. Metode analisis korelasi dapat digunakan apabila terdapat banyak pengamatan mengenai nilai efektif dan indikator faktor (faktor), sedangkan faktor yang diteliti harus bersifat kuantitatif dan tercermin dalam sumber tertentu. Yang pertama dapat ditentukan dengan hukum normal - dalam hal ini, hasil analisis korelasi adalah koefisien korelasi Pearson, atau jika karakteristiknya tidak mematuhi hukum ini, digunakan koefisien korelasi peringkat Spearman.

Aturan untuk memilih faktor analisis korelasi

Dalam menerapkan metode ini perlu diketahui faktor-faktor yang mempengaruhi indikator kinerja. Mereka dipilih dengan mempertimbangkan fakta bahwa harus ada hubungan sebab-akibat antara indikator-indikator tersebut. Dalam hal pembuatan model korelasi multifaktor, dipilih faktor-faktor yang memiliki pengaruh signifikan terhadap indikator yang dihasilkan, sedangkan faktor-faktor yang saling bergantung dengan koefisien korelasi berpasangan lebih dari 0,85 sebaiknya tidak dimasukkan dalam model korelasi, serta faktor-faktor tersebut. yang hubungannya dengan parameter yang dihasilkan tidak bersifat linier atau fungsional.

Menampilkan hasil

Hasil analisis korelasi dapat disajikan dalam bentuk teks dan grafik. Dalam kasus pertama mereka disajikan sebagai koefisien korelasi, dalam kasus kedua - dalam bentuk diagram sebar.

Dengan tidak adanya korelasi antar parameter, titik-titik pada diagram terletak secara kacau, derajat keterhubungan rata-rata dicirikan oleh tingkat keteraturan yang lebih besar dan dicirikan oleh jarak yang kurang lebih seragam dari tanda-tanda yang ditandai dari median. Sambungan kuat cenderung lurus dan pada r=1 plot titiknya berupa garis datar. Korelasi terbalik berbeda arah grafik dari kiri atas ke kanan bawah, korelasi langsung - dari kiri bawah ke sudut kanan atas.

Representasi 3D dari plot sebar

Selain tampilan plot sebar 2D tradisional, representasi grafis 3D dari analisis korelasi kini digunakan.

Matriks scatterplot juga digunakan, yang menampilkan semua plot berpasangan dalam satu gambar dalam format matriks. Untuk n variabel, matriksnya memuat n baris dan n kolom. Bagan yang terletak pada perpotongan baris ke-i dan kolom ke-j merupakan plot variabel Xi versus Xj. Jadi, setiap baris dan kolom adalah satu dimensi, satu sel menampilkan plot sebar dua dimensi.

Menilai kekencangan sambungan

Kedekatan hubungan korelasi ditentukan oleh koefisien korelasi (r): kuat - r = ±0,7 hingga ±1, sedang - r = ±0,3 hingga ±0,699, lemah - r = 0 hingga ±0,299. Klasifikasi ini tidak ketat. Gambar tersebut menunjukkan diagram yang sedikit berbeda.

Contoh penggunaan metode analisis korelasi

Sebuah penelitian menarik dilakukan di Inggris. Hal ini dikhususkan untuk hubungan antara merokok dan kanker paru-paru, dan dilakukan melalui analisis korelasi. Pengamatan ini disajikan di bawah ini.

Data awal untuk analisis korelasi

Kelompok profesional

kematian

Petani, rimbawan dan nelayan

Penambang dan pekerja tambang

Produsen gas, kokas, dan bahan kimia

Produsen kaca dan keramik

Pekerja tungku, bengkel, pengecoran dan pabrik penggilingan

Pekerja listrik dan elektronik

Teknik dan profesi terkait

Industri pengerjaan kayu

Pekerja kulit

Pekerja tekstil

Produsen pakaian kerja

Pekerja di industri makanan, minuman dan tembakau

Produsen Kertas dan Cetak

Produsen produk lainnya

Pembangun

Pelukis dan dekorator

Pengemudi mesin stasioner, crane, dll.

Pekerja yang tidak termasuk di tempat lain

Pekerja transportasi dan komunikasi

Pekerja gudang, pemilik toko, pengepakan dan pekerja mesin pengisi

Pekerja kantor

Penjual

Pekerja olahraga dan rekreasi

Administrator dan manajer

Profesional, teknisi dan seniman

Kami memulai analisis korelasi. Untuk kejelasan, lebih baik memulai solusi dengan metode grafis, yang mana kita akan membuat diagram pencar.

Ini menunjukkan hubungan langsung. Namun, sulit untuk menarik kesimpulan yang jelas hanya berdasarkan metode grafis. Oleh karena itu, kami akan terus melakukan analisis korelasi. Contoh penghitungan koefisien korelasi disajikan di bawah ini.

Dengan menggunakan software (MS Excel akan dijelaskan sebagai contoh di bawah), kita menentukan koefisien korelasi yaitu 0,716 yang berarti adanya hubungan yang kuat antara parameter yang diteliti. Mari kita tentukan reliabilitas statistik dari nilai yang diperoleh menggunakan tabel yang sesuai, yang mana kita perlu mengurangi 2 dari 25 pasangan nilai, sebagai hasilnya kita mendapatkan 23 dan menggunakan baris ini dalam tabel kita menemukan r kritis untuk p = 0,01 (karena ini adalah data medis, ketergantungan yang lebih ketat, dalam kasus lain p=0,05 sudah cukup), yaitu 0,51 untuk analisis korelasi ini. Contoh tersebut menunjukkan bahwa r yang dihitung lebih besar dari r kritis, dan nilai koefisien korelasi dianggap dapat diandalkan secara statistik.

Menggunakan perangkat lunak saat melakukan analisis korelasi

Jenis pengolahan data statistik yang dijelaskan dapat dilakukan dengan menggunakan perangkat lunak khususnya MS Excel. Korelasi melibatkan penghitungan parameter berikut menggunakan fungsi:

1. Koefisien korelasi ditentukan dengan menggunakan fungsi CORREL (array1; array2). Array1,2 - sel interval nilai variabel resultan dan faktor.

Koefisien korelasi linier juga disebut koefisien korelasi Pearson, dan oleh karena itu, mulai dari Excel 2007, Anda bisa menggunakan fungsi dengan array yang sama.

Tampilan grafis analisis korelasi di Excel dilakukan menggunakan panel “Charts” dengan pilihan “Scatter Plot”.

Setelah menentukan data awal, kami mendapatkan grafik.

2. Menilai signifikansi koefisien korelasi berpasangan menggunakan uji-t Student. Nilai kriteria-t yang dihitung dibandingkan dengan nilai tabulasi (kritis) indikator ini dari tabel nilai parameter yang bersangkutan, dengan mempertimbangkan tingkat signifikansi yang ditentukan dan jumlah derajat kebebasan. Estimasi ini dilakukan dengan menggunakan fungsi STUDISCOVER(probabilitas; derajat_kebebasan_).

3. Matriks koefisien korelasi berpasangan. Analisis dilakukan dengan menggunakan alat Analisis Data yang mana dipilih Korelasi. Penilaian statistik koefisien korelasi berpasangan dilakukan dengan membandingkan nilai absolutnya dengan nilai tabulasi (kritis). Ketika koefisien korelasi berpasangan yang dihitung melebihi koefisien kritis, kita dapat mengatakan, dengan mempertimbangkan tingkat probabilitas tertentu, bahwa hipotesis nol tentang signifikansi hubungan linier tidak ditolak.

Akhirnya

Penggunaan metode analisis korelasi dalam penelitian ilmiah memungkinkan kita untuk mengetahui hubungan antara berbagai faktor dan indikator kinerja. Perlu diperhatikan bahwa koefisien korelasi yang tinggi dapat diperoleh dari pasangan atau kumpulan data yang tidak masuk akal, oleh karena itu jenis analisis ini harus dilakukan pada kumpulan data yang cukup besar.

Setelah memperoleh nilai r yang dihitung, disarankan untuk membandingkannya dengan r kritis untuk memastikan keandalan statistik dari nilai tertentu. Analisis korelasi dapat dilakukan secara manual dengan menggunakan rumus, maupun dengan menggunakan software khususnya MS Excel. Di sini Anda juga dapat membuat diagram sebar untuk mewakili secara visual hubungan antara faktor-faktor analisis korelasi yang dipelajari dan karakteristik yang dihasilkan.

Koefisien korelasi adalah derajat hubungan antara dua variabel. Perhitungannya memberikan gambaran apakah terdapat hubungan antara dua kumpulan data. Berbeda dengan regresi, korelasi tidak memprediksi nilai besaran. Namun, menghitung koefisien merupakan langkah penting dalam analisis statistik awal. Misalnya, kami menemukan bahwa koefisien korelasi antara tingkat investasi asing langsung dan tingkat pertumbuhan PDB adalah tinggi. Hal ini memberi kita gambaran bahwa untuk menjamin kemakmuran, perlu diciptakan iklim yang menguntungkan khususnya bagi pengusaha asing. Sekilas bukan kesimpulan yang jelas!

Korelasi dan Kausalitas

Mungkin tidak ada satu pun bidang statistik yang begitu kokoh dalam kehidupan kita. Koefisien korelasi digunakan di semua bidang pengetahuan sosial. Bahaya utamanya adalah bahwa nilai-nilainya yang tinggi sering dijadikan bahan spekulasi untuk meyakinkan orang dan membuat mereka percaya pada beberapa kesimpulan. Namun nyatanya korelasi yang kuat sama sekali tidak menunjukkan adanya hubungan sebab-akibat antar besaran.

Koefisien korelasi: rumus Pearson dan Spearman

Ada beberapa indikator dasar yang mencirikan hubungan antara dua variabel. Secara historis, yang pertama adalah koefisien korelasi linier Pearson. Itu diajarkan di sekolah. Ini dikembangkan oleh K. Pearson dan J. Yule berdasarkan karya Fr. Galton. Koefisien ini memungkinkan Anda melihat hubungan antara bilangan rasional yang berubah secara rasional. Selalu lebih besar dari -1 dan kurang dari 1. Angka negatif menunjukkan hubungan berbanding terbalik. Jika koefisiennya nol, maka tidak ada hubungan antar variabel. Sama dengan bilangan positif – terdapat hubungan berbanding lurus antara besaran yang diteliti. Koefisien korelasi peringkat Spearman memungkinkan Anda menyederhanakan penghitungan dengan membangun hierarki nilai variabel.

Hubungan antar variabel

Korelasi membantu menjawab dua pertanyaan. Pertama, apakah hubungan antar variabel bersifat positif atau negatif. Kedua, seberapa kuat kecanduannya. Analisis korelasi adalah alat yang ampuh yang dapat memberikan informasi penting ini. Sangat mudah untuk melihat bahwa pendapatan dan pengeluaran keluarga turun dan naik secara proporsional. Hubungan ini dianggap positif. Sebaliknya, ketika harga suatu barang naik, maka permintaan terhadap barang tersebut turun. Hubungan ini disebut negatif. Nilai koefisien korelasi berkisar antara -1 dan 1. Nol berarti tidak ada hubungan antar nilai yang diteliti. Semakin dekat indikator yang diperoleh dengan nilai ekstrim maka semakin kuat hubungannya (negatif atau positif). Tidak adanya ketergantungan ditunjukkan dengan koefisien -0,1 hingga 0,1. Perlu Anda pahami bahwa nilai seperti itu hanya menunjukkan tidak adanya hubungan linier.

Fitur aplikasi

Penggunaan kedua indikator tersebut memerlukan asumsi-asumsi tertentu. Pertama, adanya hubungan yang kuat tidak menentukan fakta bahwa satu besaran menentukan besaran lainnya. Mungkin ada kuantitas ketiga yang mendefinisikan masing-masing kuantitas tersebut. Kedua, koefisien korelasi Pearson yang tinggi tidak menunjukkan adanya hubungan sebab akibat antar variabel yang diteliti. Ketiga, ini menunjukkan hubungan yang sangat linier. Korelasi dapat digunakan untuk mengevaluasi data kuantitatif yang bermakna (misalnya tekanan barometrik, suhu udara) daripada kategori seperti jenis kelamin atau warna favorit.

Koefisien korelasi berganda

Pearson dan Spearman menguji hubungan antara dua variabel. Tapi apa yang harus dilakukan jika jumlahnya tiga atau lebih. Di sinilah koefisien korelasi berganda berguna. Misalnya, produk nasional bruto tidak hanya dipengaruhi oleh investasi asing langsung, namun juga oleh kebijakan moneter dan fiskal pemerintah, serta tingkat ekspor. Laju pertumbuhan dan volume PDB merupakan hasil interaksi sejumlah faktor. Namun perlu dipahami bahwa model korelasi ganda didasarkan pada sejumlah penyederhanaan dan asumsi. Pertama, multikolinearitas antar nilai dikecualikan. Kedua, hubungan antara variabel dependen dan variabel yang mempengaruhinya dianggap linier.

Area penggunaan analisis korelasi dan regresi

Metode menemukan hubungan antar besaran ini banyak digunakan dalam statistik. Hal ini paling sering dilakukan dalam tiga kasus utama:

  1. Untuk menguji hubungan sebab akibat antara nilai dua variabel. Oleh karena itu, peneliti berharap dapat menemukan hubungan linier dan memperoleh rumus yang menggambarkan hubungan antar besaran tersebut. Satuan pengukurannya mungkin berbeda.
  2. Untuk memeriksa hubungan antar besaran. Dalam hal ini tidak ada yang menentukan variabel mana yang merupakan variabel terikat. Mungkin ada faktor lain yang menentukan nilai kedua besaran tersebut.
  3. Untuk menurunkan Persamaan. Dalam hal ini, Anda cukup mengganti angka ke dalamnya dan mencari tahu nilai variabel yang tidak diketahui.

Seorang pria yang mencari hubungan sebab-akibat

Kesadaran dirancang sedemikian rupa sehingga kita tentu perlu menjelaskan peristiwa-peristiwa yang terjadi di sekitar kita. Seseorang selalu mencari hubungan antara gambaran dunia tempat dia tinggal dan informasi yang diterimanya. Otak sering kali menciptakan keteraturan dari kekacauan. Dia dapat dengan mudah melihat hubungan sebab-akibat yang sebenarnya tidak ada. Para ilmuwan harus belajar secara khusus untuk mengatasi kecenderungan ini. Kemampuan mengevaluasi hubungan antar data secara objektif sangat penting dalam karir akademis.

Bias media

Mari kita pertimbangkan bagaimana adanya korelasi dapat disalahartikan. Sekelompok pelajar Inggris yang berperilaku buruk ditanyai apakah orang tuanya merokok. Kemudian tes tersebut dimuat di surat kabar. Hasil penelitian menunjukkan adanya korelasi yang kuat antara orang tua yang merokok dengan kenakalan anaknya. Profesor yang melakukan penelitian ini bahkan menyarankan untuk mencantumkan peringatan mengenai hal ini pada bungkus rokok. Namun, ada sejumlah masalah dalam kesimpulan ini. Pertama, korelasi tidak menunjukkan besaran mana yang bebas. Oleh karena itu, sangat mungkin diasumsikan bahwa kebiasaan buruk orang tua disebabkan oleh ketidaktaatan anak. Kedua, tidak dapat dikatakan dengan pasti bahwa kedua permasalahan tersebut tidak muncul karena faktor ketiga. Misalnya saja keluarga berpendapatan rendah. Perlu diperhatikan aspek emosional dari temuan awal profesor yang melakukan penelitian. Dia adalah penentang keras rokok. Oleh karena itu, tidak mengherankan jika ia menafsirkan hasil penelitiannya seperti itu.

kesimpulan

Salah mengartikan korelasi sebagai hubungan sebab-akibat antara dua variabel dapat menyebabkan kesalahan penelitian yang memalukan. Masalahnya adalah hal ini terletak pada dasar kesadaran manusia. Banyak trik pemasaran yang didasarkan pada fitur ini. Memahami perbedaan antara sebab dan akibat serta korelasi memungkinkan Anda menganalisis informasi secara rasional baik dalam kehidupan sehari-hari maupun dalam karier profesional Anda.

Rumus koefisien korelasi

Dalam proses aktivitas ekonomi manusia, seluruh kelas tugas secara bertahap dibentuk untuk mengidentifikasi berbagai pola statistik.

Penting untuk menilai tingkat determinisme beberapa proses oleh proses lainnya, perlu untuk membangun saling ketergantungan yang erat antara berbagai proses dan variabel.
Korelasi adalah hubungan variabel satu sama lain.

Untuk menilai keeratan hubungan, diperkenalkan koefisien korelasi.

Arti fisik dari koefisien korelasi

Koefisien korelasi mempunyai arti fisis yang jelas jika parameter statistik dari variabel independen mengikuti distribusi normal; secara grafis, distribusi tersebut diwakili oleh kurva Gaussian. Dan ketergantungannya bersifat linier.

Koefisien korelasi menunjukkan seberapa ditentukannya suatu proses oleh proses lainnya. Itu. Ketika satu proses berubah, seberapa sering proses dependennya berubah. Ia tidak berubah sama sekali – tidak ada ketergantungan, ia selalu berubah seketika – ketergantungan penuh.

Koefisien korelasi dapat mengambil nilai pada rentang [-1:1]

Koefisien nol berarti tidak ada hubungan antar variabel yang dipertimbangkan.
Nilai ekstrim dari rentang menunjukkan ketergantungan penuh antar variabel.

Jika nilai koefisiennya positif, maka hubungannya searah.

Untuk koefisien negatif, yang terjadi adalah sebaliknya. Itu. dalam kasus pertama, ketika argumen berubah, fungsinya berubah secara proporsional, dalam kasus kedua, berubah secara terbalik.
Ketika nilai koefisien korelasi berada di tengah kisaran yaitu. dari 0 hingga 1, atau dari -1 hingga 0, mereka berbicara tentang ketergantungan fungsional yang tidak lengkap.
Semakin dekat nilai koefisiennya ke titik ekstrim, maka semakin besar pula hubungan antar variabel atau nilai acaknya. Semakin dekat nilainya dengan 0, maka semakin sedikit ketergantungan yang terjadi.
Biasanya koefisien korelasi mengambil nilai antara.

Koefisien korelasi merupakan besaran yang tidak dapat diukur

Koefisien korelasi digunakan dalam statistik, dalam analisis korelasi, untuk menguji hipotesis statistik.

Dengan mengajukan beberapa hipotesis statistik tentang ketergantungan suatu variabel acak terhadap variabel acak lainnya, maka koefisien korelasi dihitung. Berdasarkan hal tersebut, kita dapat menilai apakah ada hubungan antara besaran dan seberapa dekatnya hubungan tersebut.

Faktanya adalah tidak selalu mungkin untuk melihat hubungannya. Seringkali besaran tidak berhubungan langsung satu sama lain, tetapi bergantung pada banyak faktor. Namun, ternyata melalui banyak hubungan tidak langsung, variabel acak menjadi saling bergantung. Tentu saja, ini tidak berarti hubungan langsung mereka; misalnya, jika perantaranya hilang, ketergantungan juga bisa hilang.

Pada Bab 4, kita melihat statistik deskriptif univariat dasar—ukuran tendensi sentral dan variabilitas yang digunakan untuk menggambarkan suatu variabel tunggal. Dalam bab ini kita akan melihat koefisien korelasi utama.

Koefisien korelasi- Statistik deskriptif bivariat, ukuran kuantitatif hubungan (joint variability) dua variabel.

Sejarah perkembangan dan penerapan koefisien korelasi untuk studi hubungan sebenarnya dimulai bersamaan dengan munculnya pendekatan pengukuran untuk studi perbedaan individu - pada tahun 1870-1880. Pelopor dalam mengukur kemampuan manusia, sekaligus penulis istilah “koefisien korelasi” itu sendiri, adalah Francis Galton, dan koefisien korelasi paling populer dikembangkan oleh pengikutnya Karl Pearson. Sejak itu, studi tentang hubungan menggunakan koefisien korelasi telah menjadi salah satu kegiatan paling populer dalam psikologi.

Sampai saat ini, berbagai macam koefisien korelasi yang berbeda telah dikembangkan, dan ratusan buku dikhususkan untuk masalah pengukuran hubungan dengan bantuan mereka. Oleh karena itu, tanpa berpura-pura lengkap, kami hanya akan mempertimbangkan ukuran hubungan yang paling penting dan benar-benar tak tergantikan dalam penelitian - Pearson, Spearman, dan Kendall. Ciri umum mereka adalah bahwa mereka mencerminkan hubungan antara dua karakteristik yang diukur pada skala kuantitatif - peringkat atau metrik.

Secara umum, setiap penelitian empiris berfokus pada pemeriksaan hubungan antara dua variabel atau lebih.

CONTOH

Mari kita berikan dua contoh penelitian tentang pengaruh penayangan adegan kekerasan di TV terhadap agresivitas remaja. 1. Hubungan antara dua variabel yang diukur pada skala kuantitatif (peringkat atau metrik) dipelajari: 1) “waktu menonton program televisi kekerasan”; 2) “agresi”.

Bunyinya seperti tau Kendall.


BAB 6. KOEFISIEN KORELASI

2. Dikaji perbedaan agresivitas 2 kelompok remaja atau lebih, berbeda dalam durasi menonton acara televisi yang mengandung adegan kekerasan.

Pada contoh kedua, studi perbedaan dapat direpresentasikan sebagai studi tentang hubungan antara 2 variabel, salah satunya adalah nominatif (durasi menonton acara TV). Dan untuk situasi ini, koefisien korelasi kita sendiri juga telah dikembangkan.

Penelitian apa pun dapat direduksi menjadi studi korelasi; untungnya, berbagai koefisien korelasi telah ditemukan untuk hampir semua situasi penelitian. Namun pada pemaparan berikut ini kita akan membedakan dua kelompok masalah:

P studi korelasi - ketika dua variabel disajikan dalam skala numerik;

mempelajari perbedaan - ketika setidaknya salah satu dari dua variabel disajikan dalam skala nominatif.


Pembagian ini juga sesuai dengan logika pembuatan program statistik komputer populer, yang di dalamnya terdapat menu Korelasi tiga koefisien diusulkan (r Pearson, r Spearman, dan x Kendall), dan metode perbandingan kelompok diusulkan untuk memecahkan masalah penelitian lainnya.

KONSEP KORELASI

Hubungan dalam bahasa matematika biasanya digambarkan dengan menggunakan fungsi yang secara grafis direpresentasikan sebagai garis. Pada Gambar. Gambar 6.1 menunjukkan beberapa grafik fungsi. Jika perubahan suatu variabel sebesar satu satuan selalu mengubah variabel lain dengan besaran yang sama, maka fungsinya adalah linier(grafiknya mewakili garis lurus); koneksi lainnya - nonlinier. Jika peningkatan suatu variabel dikaitkan dengan peningkatan variabel lain, maka hubungannya adalah positif (langsung); jika peningkatan suatu variabel dikaitkan dengan penurunan variabel lain, maka hubungannya adalah negatif (terbalik). Jika arah perubahan suatu variabel tidak berubah seiring dengan kenaikan (penurunan) variabel lain, maka fungsi tersebut adalah membosankan; jika tidak, fungsinya akan dipanggil tidak monoton.

Koneksi fungsional, mirip dengan yang ditunjukkan pada Gambar. 6.1 adalah idealisasi. Keunikannya adalah bahwa satu nilai dari satu variabel sesuai dengan nilai yang ditentukan secara ketat dari variabel lain. Misalnya, hubungan antara dua variabel fisik - berat badan dan panjang badan (linier positif). Namun, bahkan dalam eksperimen fisik, hubungan empiris akan berbeda dari hubungan fungsional karena alasan yang tidak diketahui atau tidak diketahui: fluktuasi komposisi bahan, kesalahan pengukuran, dll.

Beras. 6.1. Contoh grafik fungsi yang sering muncul

Dalam psikologi, seperti dalam banyak ilmu lainnya, ketika mempelajari hubungan tanda-tanda, banyak kemungkinan penyebab variabilitas tanda-tanda ini pasti tidak terlihat oleh peneliti. Hasilnya malah Hubungan fungsional antar variabel yang ada dalam kenyataan secara empiris bersifat probabilistik (stokastik): nilai yang sama dari satu variabel sesuai dengan distribusi nilai yang berbeda dari variabel lain (dan sebaliknya). Contoh paling sederhana adalah rasio tinggi dan berat badan orang. Hasil empiris mempelajari kedua ciri tersebut tentu saja akan menunjukkan hubungan positifnya. Namun mudah ditebak bahwa ini akan berbeda dari fungsi matematika ideal yang ketat, linier, positif, bahkan dengan segala trik peneliti untuk memperhitungkan kelangsingan atau kegemukan subjek. (Tidak mungkin atas dasar ini ada orang yang menyangkal fakta adanya hubungan fungsional yang erat antara panjang dan berat benda.)

Jadi, dalam psikologi, seperti dalam banyak ilmu lainnya, hubungan fungsional fenomena hanya dapat diidentifikasi secara empiris sebagai hubungan probabilistik dari karakteristik yang sesuai. Gagasan yang jelas tentang sifat hubungan probabilistik diberikan oleh diagram sebar - grafik yang sumbunya sesuai dengan nilai dua variabel, dan setiap subjek mewakili sebuah titik (Gbr. 6.2). Koefisien korelasi digunakan sebagai karakteristik numerik dari hubungan probabilistik.