Bu yazıda R Programlama dili ile, parametrik olmayan bağımsız ve iki örnekleme sahip veriler için kullanılan Bağımsız İki Örneklem Konum Testlerini göreceğiz.
Veri
Analiz boyunca kullanılan veri, Almanya 2005 seçimlerine aittir. Bu veride 4 parti için 16 eyaletteki aldıkları oy sayıları verilmiştir.
Veriye buradan ulaşabilirsiniz: Veri
veri <-read.csv("https://raw.githubusercontent.com/gungorrbaris/TR-nonparametric.statistics-R/main/data/data.csv",sep = ";")
knitr::kable(head(veri,n=10), align = "c")
Eyalet | Parti | Oy |
---|---|---|
Schleswig-Holstein | SPD | 761302 |
Mecklenburg-Vorpommern | SPD | 326130 |
Hamburg | SPD | 447335 |
Niedersachsen | SPD | 2249746 |
Bremen | SPD | 184817 |
Brandenburg | SPD | 608044 |
Sachsen-Anhalt | SPD | 508573 |
Berlin | SPD | 681591 |
Nordrhein-Westfalen | SPD | 4658692 |
Sachsen | SPD | 666709 |
Normallik testleri
Parametrik olmayan testlerin uygulanabilmesi için verilerimizin normal dağılmaması gerekir.
4 parti yani 4 farklı grup olduğu için her grup için farklı normallik testlerinin yapılması gerekmektedir.
4 partiyi oylarını ayrı ayrı tanımlayalım:
spd <- veri$Oy[c(1:16)]
cdu <- veri$Oy[c(17:32)]
gruene <- veri$Oy[c(33:48)]
fdp<- veri $Oy[c(49:64)]
SPD
Ho: SPD partisi ile normal dağılım arasında fark yoktur.
H1: SPD
partisi ile normal dağılım arasında fark vardır.
shapiro.test(spd)
##
## Shapiro-Wilk normality test
##
## data: spd
## W = 0.74416, p-value = 0.0005408
SPD partisi için,
- p değeri= 0.0005408 < α=0.05 olduğu için Ho RED. Yani SPD partisi normal dağılım göstermiyor.
CDU
Ho: CDU partisi ile normal dağılım arasında fark yoktur.
H1: CDU
partisi ile normal dağılım arasında fark vardır.
shapiro.test(cdu)
##
## Shapiro-Wilk normality test
##
## data: cdu
## W = 0.7686, p-value = 0.001074
CDU partisi için,
- p değeri= 0.001074 < α=0.05 olduğu için Ho RED. Yani SPD partisi normal dağılım göstermiyor.
Gruene
Ho: Gruene partisi ile normal dağılım arasında fark yoktur.
H1:
Gruene partisi ile normal dağılım arasında fark vardır.
shapiro.test(gruene)
##
## Shapiro-Wilk normality test
##
## data: gruene
## W = 0.78781, p-value = 0.001885
Gruene partisi için,
- p değeri= 0.001885 < α=0.05 olduğu için Ho RED. Yani SPD partisi normal dağılım göstermiyor.
FDP
Ho: FDP partisi ile normal dağılım arasında fark yoktur.
H1: FDP
partisi ile normal dağılım arasında fark vardır.
shapiro.test(fdp)
##
## Shapiro-Wilk normality test
##
## data: fdp
## W = 0.8332, p-value = 0.007786
FDP partisi için,
- p değeri= 0.007786 < α=0.05 olduğu için Ho RED. Yani SPD partisi normal dağılım göstermiyor.
Dört grubun da normal dağılım göstermediğini gördük. Normal olmayan veriler için parametrik olmayan testlerin kullanılması gerekir.
Bağımsız iki Örneklem Testi – Gruplar Arasındaki Farkın Test Edilmesi
Bu analizimizde SPD ve CDU partilerinin oy oranları arasındaki farklılığı inceleyelim.
Seçtiğimiz iki bağımsız grubun birbirleri ile konum yönünden farkını anlamak için Mann-Whitney testini kullanabiliriz.
Mann-Whitney Testi
Ho: 𝜽spd = 𝜽cdu ( SPD partisinin oyları ile CDU partisinin oyları
arasında fark yoktur.)
Hs: 𝜽spd > 𝜽cdu ( SPD partisinin oyları
CDU partisinin oylarından büyüktür.)
wilcox.test(spd,cdu,alternative="greater",conf.level=0.95,paired=FALSE)
##
## Wilcoxon rank sum exact test
##
## data: spd and cdu
## W = 139, p-value = 0.3481
## alternative hypothesis: true location shift is greater than 0
Mann-Whitney Testi sonucuna bakıldığında
- p değeri= 0.3481 > α=0.05 olduğu için Ho RED EDİLEMEZ. Yani SPD partisinin, CDU partisinden fazla oy aldığını söyleyemeyiz.