Anova, variantieanalyse in r

Gemiddelde toevoegen aan een boxplot

p <- p + stat_summary(fun.y=mean, geom="point", shape=20, size=5, color="#7a7a7a", fill="#7a7a7a")
print(p) # print is niet noodzakelijk, maar wel beter leesbaar

One-way ANOVA, enkelvoudige vergelijking van variantie

anova.aov <- aov(SalePrice ~ MSZoning, data = data.df)
summary(anova.aov)

Post-hoc test volgens Tukey

anova.thsd <- TukeyHSD(anova.aov,which = "MSZoning", ordered = TRUE)
require(broom)
require(tidyr)
require(dplyr)
f_significant <- function(x){return (if_else(x < 0.05, 1, 0)) }
anova.thsd.df <- broom::tidy(anova.thsd) %>% separate(comparison, c("item","with"), "-" )
anova.significant.df <- union(anova.thsd.df %>% select(item, with, adj.p.value),
                             anova.thsd.df %>% select(item = with, with = item, adj.p.value))  %>%
                              spread(key="with",value="adj.p.value") %>% 
                              mutate_at(vars(-item), funs(f_significant))
View(anova.significant.df)

Shapira test, normaal verdeling van residuals?

aov_residuals <- residuals(object = anova.aov )
shapiro.test(x = aov_residuals )

Levene test, homogeniteit van variantie

leveneTest(SalePrice ~ MSZoning, center = "mean",data = data.df)

KUDOS

Mijn kudos gaan vandaag naar: methodologiewinkel wiki van de UVA. Top!