İstatistik ve veri biliminde korelasyon ve nedensellik terimleri ile sık sık karşılaşırız. Gerçi korelasyondan nedenselliğe kıyasla daha sık bahsedilir. Bununla birlikte, anlamları genellikle iki değişkenin nasıl ilişkili olduğu ile ilişkilidir.
Bununla birlikte, korelasyon ve nedensellik, tanımlarına göre duran iki farklı terimdir. İç içe geçmiş ve birlikte kullanılabilen iki farklı kavramdır, ancak yine de farklılıkları bilmemiz gerekir.
Peki, korelasyon ve nedensellik nedir? Ayrıca, aralarındaki farklar ve yararlılıkları nelerdir? Şimdi bu kavramları biraz inceleyelim.
Korelasyon ve Nedensellik
Korelasyon
Her iki terim için de doğru tanımı alalım. Korelasyon, iki değişken arasındaki istatistiksel bir tahmin ilişkisi olarak tanımlanabilir. İlişkinin kendisi, değişkenlerin birbirlerine doğru hareket yönünü gösterir.
Örneğin, pozitif bir korelasyon, bir değişkenin değeri arttığında diğerinin de artma eğiliminde olduğu anlamına gelir. Tersi olursa (bir değişkendeki artış, diğerinde azalma eğilimi gösterirse), bu negatif bir korelasyondur.
Korelasyon genellikle sayısal bir katsayı olarak ölçülür. Örneğin, Pearson Korelasyonu iki değişkenin gücünü -1 (mükemmel negatif korelasyon) ile +1 (mükemmel pozitif korelasyon) arasında ölçer. İlişkili sayı, iki değişkenin ne kadar ilişkili olduğunu temsil eder.
Yani, eğer iki değişken birbiriyle ilişkiliyse, birbirlerini etkili bir şekilde etkilemeleri gerekir, değil mi? Cevap hayır. Aşağıdaki resme bir göz atalım.
Yukarıdaki görsel, satılan dondurma sayısı artarken arı oluşumunun da arttığını göstermektedir. Bir korelasyon tekniği kullanırsak, yukarıdaki bu iki değişken şüphesiz güçlü bir korelasyon gösterecektir - ancak, birbirlerini etkiliyorlar mı? Yoksa bu sadece bir tesadüf mü? Bu korelasyonun çözemeyeceği bir şeydir. Nedensellik belki bunu çözebilir.
Nedensellik
Nedensellik, bir değişikliğin diğer değişkende doğrudan bir değişikliğe yol açacağı iki değişken arasındaki neden-sonuç ilişkisi olarak tanımlanabilir.
Korelasyon bilgisi, iki değişken arasındaki ilişki gücü ve örnek verilerden elde edilen bilgi ile sınırlıdır. Buna karşılık, nedensellik daha titiz bir araştırma ve kontrollü deney gerektirir. Çünkü nedensellik, bir değişkene yapılan müdahalenin diğer değişkeni tahmin edilebilir şekilde etkileyebileceği anlamına gelir.
Nedenselliği kanıtlamak için yapılan en yaygın faaliyet, denekleri rastgele iki gruptan birine atadığımız A/B testidir. Gruplardan biri tedavi görürken diğeri kontrol grubudur. Daha sonra sonuçlar ölçülür ve müdahalenin sonucu etkileyip etkilemediğini belirlemek için istatistiksel olarak test edilir. Temel olarak süreç, faaliyetimizin nedensel bir etkiye sahip olup olmadığına dair kanıt bulmaktır.
Bazı Teknik Örnekleri
Korelasyon ve nedenselliğin nasıl işlediğini belirledik. Korelasyon veya nedenselliği ölçmek için kullanılan çeşitli teknikler hakkında biraz bilgi edineceğiz.
Korelasyon Teknikleri
Korelasyonda iki standart korelasyon ölçüsü vardır: Parametrik ve Parametrik Olmayan. Karar, verilerinize, verilerinize yapılan teknik varsayımına ve amaca bağlıdır.
Parametrik teknik olan Pearson Korelasyonu örneğine bir göz atalım.
Pearson korelasyonu (Pearson's r)
Pearson korelasyonu, iki sayısal değişken arasındaki doğrusal ilişkiyi ölçmek için kullanılan parametrik bir yöntemdir. Pearson korelasyonunu kullanmak için birkaç varsayım vardır:
- Veriler sayısaldır,
- Her iki değişken de iki değişkenli normal dağılım izlemektedir,
- Değişkenler arasında doğrusal bir ilişki vardır.
- Parametrik Olmayan örnek için Spearman'ın korelasyonu vardır.
Spearman'ın sıra korelasyonu (Spearman's rho)
Spearman korelasyonu, iki değişken (sürekli veya sıralı) arasındaki monotonik ilişkiyi ölçmek için kullanılan parametrik olmayan bir yöntemdir.
Spearman korelasyonu verilerin sıralamasına dayanır ve değişkenler arasındaki ilişki doğrusal olmadığında (veya parametrik yöntem varsayımını karşılamadığında) faydalıdır. Varsayımlar şöyledir:
- Veriler sürekli ya da sıralı olabilir.
- Değişkenler arasındaki ilişki monotoniktir (bir değişken arttığında diğeri de sürekli olarak artar ya da azalır).
Nedensellik Teknikleri
Korelasyon ölçümlerine benzer şekilde, yukarıda bahsedilen A/B testi de dahil olmak üzere nedensellik kurmak için çeşitli teknikler mevcuttur.
Bir başka teknik örneği de, müdahalenin veya eylemin zaman serisi verilerini etkileyip etkilemediğini belirlemeye yönelik bir kavram olan Nedensel Etkidir. Kılavuz olarak aşağıdaki görseli görebilirsiniz.
Yukarıdaki görselde, kampanya gelirinin müdahale nedeniyle artıp artmadığını bilmek istiyoruz. Bayesian Yapısal Zaman Serisi modelini kullanarak müdahale etkisi olasılığını değerlendirebiliriz.
Özet:
Korelasyon ve Nedensellik arasındaki farkları bilmek için özetleyebileceğimiz birkaç nokta vardır:
1. Yönlülük
Korelasyon iki değişken arasında (olası) bir ilişkiyi ortaya koyar ancak neden-sonuç ilişkisine dair kesin bir kanıt sunmaz. Öte yandan nedensellik, iki değişken arasındaki ilişkide açık bir yönlülük ortaya koyar.
2. Çıkarımlar
Korelasyon sadece iki değişkenin yönü ve gücü hakkında bilgi verirken, nedensellik bir değişkeni değiştirmenin diğerini etkileyeceği anlamına gelir.
3. Kanıt Oluşturma
Korelasyon, değişkenleri manipüle etmeden veya kontrol etmeden yalnızca gözlemsel verilerle kurulur. Ancak nedensellik, karıştırıcı faktörleri elemek ve deneyleri kontrol etmek için istatistiksel teknikler kullanacaktır.
Kaynak Metin: https://tinyurl.com/pec2732r
Hiç yorum yok:
Yorum Gönder