Cara Membedakan Korelasi dan Regresi

Perbedaan Utama – Korelasi vs. Regresi

Korelasi dan regresi adalah dua metode yang digunakan untuk menyelidiki hubungan antara variabel dalam statistik. Perbedaan yang menonjol antara korelasi dan regresi adalah korelasi mengukur sejauh mana kedua variabel terkait , sedangkan regresi adalah metode untuk menggambarkan hubungan antara dua variabel . Regresi juga memungkinkan seseorang untuk lebih akurat memprediksi nilai yang akan diambil variabel dependen untuk nilai tertentu dari variabel independen.

Yang perlu anda ketahui tentang Korelasi?

Dalam statistik, kita mengatakan ada korelasi antara dua variabel jika kedua variabel tersebut terkait. Jika hubungan antara variabel adalah linier, kita dapat menyatakan sejauh mana mereka terkait menggunakan angka yang disebut koefisien korelasi Pearson . mengambil nilai antara -1 dan 1. Nilai 0 berarti kedua variabel tidak berkorelasi. Nilai negatif menunjukkan bahwa korelasi antar variabel adalah negatif: yaitu ketika satu variabel meningkat, variabel lainnya menurun. Demikian pula, nilai positif untuk berarti data berkorelasi positif (ketika satu variabel meningkat, variabel lainnya juga meningkat).

Nilainya adalah -1 atau 1 memberikan kemungkinan korelasi yang paling kuat. Ketika variabel dikatakan sepenuhnya berkorelasi negatif dan ketika nilai-nilai dikatakan sepenuhnya berkorelasi positif. Gambar di bawah ini menunjukkan beberapa bentuk scatter plot antara dua variabel dan koefisien korelasi untuk setiap kasus:

Koefisien korelasi Pearson untuk berbagai jenis plot pencar

Koefisien korelasi Pearson untuk dua variabel dan didefinisikan sebagai berikut:

Berikut adalah kovarians antara dan :

Istilah dan singkatan dari standar deviasi dan masing-masing. Ini didefinisikan sebagai:

dan

Mari kita lihat bagaimana koefisien korelasi dihitung menggunakan sebuah contoh. Kita akan mencoba menghitung koefisien korelasi untuk himpunan 20 nilai berikut untuk dan :

   

-0,9557

0,5369

-1.6441

-0,1560

1.2254

1.9230

1.9062

1.9957

1.9679

2.1673

-0,3469

0,7954

-0,2328

0,5415

1.5064

1.2335

0,4278

0,7754

-0.6359

0,3534

0,0061

0,7565

0.8407

1.5326

0.2713

1.3354

0,4664

1.9980

-0,1813

1.2539

1.4384

2.0383

1.9001

2.7755

0.1022

0,7861

0,1251

0,7456

-0.6314

0,9942

Nilai dari diplot terhadap nilai pada grafik yang ditunjukkan di bawah ini:

Melihat persamaan yang diperlukan untuk menghitung koefisien korelasi, pertama-tama kita akan menghitung nilai . Ini adalah nilai rata-rata dari dan masing-masing. Kita menemukan bahwa:

Selanjutnya kita akan menghitung dan . Kita akan menempatkan nilai-nilai ini di sebelah nilai kita dan pada tabel di atas:

         

-0,9557

0,5369

-0,5131

1.7782

0,4654

-1.6441

-0,1560

0.2565

4.0881

1.8909

1.2254

1.9230

2.3564

0,7184

0,4955

1.9062

1.9957

3.8042

2.3360

0,6031

1.9679

2.1673

4.2650

2.5284

0,8991

-0,3469

0,7954

-0,2759

0,5252

0.1795

-0,2328

0,5415

-0,1261

0.3728

0,4592

1.5064

1.2335

1.8581

1.2737

0,0002

0,4278

0,7754

0.3317

0,0025

0.1969

-0.6359

0,3534

-0,2247

1.0276

0.7495

0,0061

0,7565

0,0046

0,1382

0.2140

0.8407

1.5326

1.2885

0,2143

0,0983

0.2713

1.3354

0,3623

0,0113

0,0135

0,4664

1.9980

0.9319

0,0079

0,6067

-0,1813

1.2539

-0,2273

0.3126

0,0012

1.4384

2.0383

2.9319

1.1249

0,6711

1.9001

2.7755

5.2737

2.3174

2.4223

0.1022

0,7861

0,0803

0,0760

0.1875

0,1251

0,7456

0,0933

0,0639

0.2242

-0.6314

0,9942

-0.6277

1.0185

0,00506

Dengan nilai-nilai ini, kita dapat menghitung kovarians:

Kita juga dapat menghitung simpangan baku:

Sekarang kita dapat menghitung koefisien korelasi:

Yang perlu anda ketahui tentang Regresi?

Regresi adalah metode untuk menemukan hubungan antara dua variabel. Secara khusus, kita akan melihat regresi linier , yang memberikan persamaan untuk “garis yang paling sesuai” untuk sampel data tertentu, di mana dua variabel memiliki hubungan linier. Garis lurus dapat digambarkan dengan persamaan dalam bentuk di mana adalah gradien garis dan sumbu, dan regresi linier memungkinkan kita untuk menghitung nilai dan . Setelah kita menghitung koefisien korelasi , kita dapat menghitung nilai-nilai ini sebagai:

Perhatikan bahwa dalam kasus ini, diambil sebagai variabel dependen sedangkan adalah variabel independen. Dari perhitungan kita sebelumnya, kita tahu bahwa

, dan . Karena itu, .

dan . Karena itu, .

Gamba
r di bawah ini menunjukkan scatter plot sebelumnya denga
n garis :

Data, dengan garis lurus paling pas diperoleh dari analisis regresi

Seperti yang kita sebutkan sebelumnya, analisis regresi membantu kita membuat prediksi. Sebagai contoh, jika nilai variabel independen () adalah 1.000, maka kita dapat memprediksi bahwa itu akan mendekati . Pada kenyataannya, nilai dari mungkin belum tentu tepat 1,614. Karena ketidakpastian, nilai sebenarnya cenderung berbeda. Perhatikan bahwa akurasi prediksi lebih tinggi untuk data dengan koefisien korelasi yang mendekati ±1.

Perbedaan Antara Korelasi dan Regresi

Menggambarkan Hubungan

Korelasi menggambarkan sejauh mana dua variabel terkait.

Regresi memberikan metode untuk menemukan hubungan antara dua variabel.

Membuat Prediksi

Korelasi hanya menggambarkan seberapa baik dua variabel terkait. Menganalisis korelasi antara dua variabel tidak meningkatkan akurasi dimana nilai variabel dependen dapat diprediksi untuk nilai tertentu dari variabel independen.

Regresi memungkinkan kita untuk memprediksi nilai variabel dependen untuk nilai variabel independen tertentu dengan lebih akurat.

Ketergantungan Antar Variabel

Dalam menganalisis korelasi , tidak menjadi masalah variabel mana yang bebas dan mana yang bebas.

Dalam menganalisis regresi perlu diketahui antara variabel dependen dan variabel independen.

Gambar Courtesy:

“desain ulang File: Correlation_examples.png menggunakan grafik vektor (file SVG)” oleh DenisBoigelot (Karya sendiri, pengunggah asli adalah Imagecreator ) [ CC0 1.0 ], melalui Wikimedia Commons

Related Posts