Bu yazıda R Programlama dili ile, parametrik olmayan bağımsız ve iki örnekleme sahip veriler için kullanılan Bağımsız İki Örneklem Konum Testlerini göreceğiz.

Veri

Analiz boyunca kullanılan veri, Almanya 2005 seçimlerine aittir. Bu veride 4 parti için 16 eyaletteki aldıkları oy sayıları verilmiştir.

Veriye buradan ulaşabilirsiniz: Veri

veri <-read.csv("https://raw.githubusercontent.com/gungorrbaris/TR-nonparametric.statistics-R/main/data/data.csv",sep = ";")
knitr::kable(head(veri,n=10), align = "c")
Eyalet Parti Oy
Schleswig-Holstein SPD 761302
Mecklenburg-Vorpommern SPD 326130
Hamburg SPD 447335
Niedersachsen SPD 2249746
Bremen SPD 184817
Brandenburg SPD 608044
Sachsen-Anhalt SPD 508573
Berlin SPD 681591
Nordrhein-Westfalen SPD 4658692
Sachsen SPD 666709

Normallik testleri

Parametrik olmayan testlerin uygulanabilmesi için verilerimizin normal dağılmaması gerekir.

4 parti yani 4 farklı grup olduğu için her grup için farklı normallik testlerinin yapılması gerekmektedir.

4 partiyi oylarını ayrı ayrı tanımlayalım:

spd <- veri$Oy[c(1:16)] 
cdu <- veri$Oy[c(17:32)] 
gruene <- veri$Oy[c(33:48)] 
fdp<- veri $Oy[c(49:64)]

SPD

Ho: SPD partisi ile normal dağılım arasında fark yoktur.
H1: SPD partisi ile normal dağılım arasında fark vardır.

shapiro.test(spd)
## 
##  Shapiro-Wilk normality test
## 
## data:  spd
## W = 0.74416, p-value = 0.0005408

SPD partisi için,

  • p değeri= 0.0005408 < α=0.05 olduğu için Ho RED. Yani SPD partisi normal dağılım göstermiyor.

CDU

Ho: CDU partisi ile normal dağılım arasında fark yoktur.
H1: CDU partisi ile normal dağılım arasında fark vardır.

shapiro.test(cdu)
## 
##  Shapiro-Wilk normality test
## 
## data:  cdu
## W = 0.7686, p-value = 0.001074

CDU partisi için,

  • p değeri= 0.001074 < α=0.05 olduğu için Ho RED. Yani SPD partisi normal dağılım göstermiyor.

Gruene

Ho: Gruene partisi ile normal dağılım arasında fark yoktur.
H1: Gruene partisi ile normal dağılım arasında fark vardır.

shapiro.test(gruene)
## 
##  Shapiro-Wilk normality test
## 
## data:  gruene
## W = 0.78781, p-value = 0.001885

Gruene partisi için,

  • p değeri= 0.001885 < α=0.05 olduğu için Ho RED. Yani SPD partisi normal dağılım göstermiyor.

FDP

Ho: FDP partisi ile normal dağılım arasında fark yoktur.
H1: FDP partisi ile normal dağılım arasında fark vardır.

shapiro.test(fdp)
## 
##  Shapiro-Wilk normality test
## 
## data:  fdp
## W = 0.8332, p-value = 0.007786

FDP partisi için,

  • p değeri= 0.007786 < α=0.05 olduğu için Ho RED. Yani SPD partisi normal dağılım göstermiyor.

Dört grubun da normal dağılım göstermediğini gördük. Normal olmayan veriler için parametrik olmayan testlerin kullanılması gerekir.

Bağımsız iki Örneklem Testi – Gruplar Arasındaki Farkın Test Edilmesi

Bu analizimizde SPD ve CDU partilerinin oy oranları arasındaki farklılığı inceleyelim.

Seçtiğimiz iki bağımsız grubun birbirleri ile konum yönünden farkını anlamak için Mann-Whitney testini kullanabiliriz.

Mann-Whitney Testi

Ho: 𝜽spd = 𝜽cdu ( SPD partisinin oyları ile CDU partisinin oyları arasında fark yoktur.)
Hs: 𝜽spd > 𝜽cdu ( SPD partisinin oyları CDU partisinin oylarından büyüktür.)

wilcox.test(spd,cdu,alternative="greater",conf.level=0.95,paired=FALSE)
## 
##  Wilcoxon rank sum exact test
## 
## data:  spd and cdu
## W = 139, p-value = 0.3481
## alternative hypothesis: true location shift is greater than 0

Mann-Whitney Testi sonucuna bakıldığında

  • p değeri= 0.3481 > α=0.05 olduğu için Ho RED EDİLEMEZ. Yani SPD partisinin, CDU partisinden fazla oy aldığını söyleyemeyiz.