1 Hintergrund

Ein Team von Tierärztinnen der University of St. Meow möchte erforschen, welchen Einfluss das verabreichte Futter (Nassfutter vs. Trockenfutter) sowie die Haltungsweise (Freigänger vs. Stubentiger) auf das Körpergewicht von Katzen haben.

Die Forscherinnen haben 400 Katzen zufällig auf adoptionswillige Haushalte verteilt, sobald sie im abgabefähigen Alter waren (ca. 15 Wochen nach der Geburt, nach Ahola, Vapalahiti, & Lohi, 2017).

Die Haushalte erhielten die Anweisung, entweder ausschließlich Trockenfutter oder ausschließlich Nassfutter zu verabreichen. Weiterhin wurden sie angewiesen, die Katze entweder als Freigänger aufzuziehen oder sie ausschließlich im Haus zu halten. Die Einhaltung der Anweisungen wurde kontrolliert.

Nach einem Jahr wurden alle Katzen gewogen.

Fig. 1 Illustration der Versuchsanordnung

Fig. 1 Illustration der Versuchsanordnung

Die Tierärztinnen stellten folgende Hypothesen auf:

1. Die Fütterung von Nassfutter führt zu einem höheren Gewicht als die Fütterung von Trockenfutter.

2. Die Haltung als Stubentiger führt zu einem höheren Gewicht als die Haltung als Freigänger.

3. Bei Stubentigern hat das (Nass-) Futter einen stärkeren Einfluss auf das Gewicht als bei Freigängern.

(Referenzen: Ahola, M. K., Vapalahti, K., & Lohi, H. (2017). Early weaning increases aggression and stereotypic behaviour in cats. Scientific reports, 7(1), 10412.)

2 Aufgaben

  1. Stellen Sie die statistischen Hypothesen auf.

  2. Erstellen Sie drei Diagramme mit Mittelwerten und 95% Konfidenzintervallen:

    • erst nur für die Variable „Futter“,
    • dann nur für die Variable „Haltung“,
    • und zuletzt für beide Variablen zusammen
  3. Berechnen Sie a) ein lineares Modell mit beiden Haupteffekten und Interaktion b) eine zweifaktorielle Varianzanalyse als schrittweisen Modellvergleich “per Hand” und c) direkt über den entsprechenden Befehl im Commander

  4. Berechnen Sie die Effektgröße

3 Auswertung

Daten laden:

# Daten einlesen und RCmdr laden
cats_data <- read.csv("CatsData.csv", sep=";")

cats_data$Futter <- factor(cats_data$Futter, levels = c("Nassfutter", "Trockenfutter"))
cats_data$Haltung <- factor(cats_data$Haltung, levels = c("Stubentiger", "Freigaenger"))

3.1 Statistische Hypothesen aufstellen

3.2 Diagramme mit Mittelwerten und 95% CI

library(Rcmdr)

3.2.1 a) Haupteffekt für “Futter”

3.2.2 b) Haupteffekt für “Haltung”

3.2.3 c) Interaktion zwischen “Futter” und “Haltung”

3.3 Lineares Modell

3.4 Zweifaktorielle Varianzanalyse als schrittweiser Modellvergleich “per Hand”

Anlegen und Vergleichen der benötigten Modelle für Haupteffekt Futter (hier schon zur Illustration gemacht):

#Modell mit Futter und Haltung
M1 <- lm(Gewicht ~ Futter + Haltung, data = cats_data)

#Modell nur mit Haltung
M2 <- lm(Gewicht ~ Haltung, data = cats_data)

#Vergleich
anova(M1,M2)
## Analysis of Variance Table
## 
## Model 1: Gewicht ~ Futter + Haltung
## Model 2: Gewicht ~ Haltung
##   Res.Df    RSS Df Sum of Sq      F    Pr(>F)    
## 1    397 894.29                                  
## 2    398 933.50 -1   -39.212 17.407 3.708e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#Modell mit Futter ist besser als ohne, Faktor sollte drinbleiben

Anlegen und Vergleichen der benötigten Modelle für Haupteffekt Haltung (das nun bitte selber machen):

Anlegen und Vergleichen der benötigten Modelle für Test der Interaktion (auch selber machen):

Woran sieht man im anova-Output (Test für Modellvergleich, nicht verwechseln mit Anova-Befehl mit großem A, siehe weiter unten) welches das bessere Modell war, wenn der Test signifikant ist? Das Modell mit mehr Prädiktoren ist immer besser, wenn der Test signifikant ist. Wenn man mehr Prädiktoren ins Modell aufnimmt, können genau zwei Dinge passieren: entweder der neue Prädiktor erklärt noch Teile der Varianz, die vorher nicht erklärt werden konnten. Wenn dieser zusätzlich erklärte Teil groß genug ist, wird der Test signifikant. Die zweite Möglichkeit ist, dass der neue Prädiktor nichts zusätzliches erklären kann. Dann wird der Test nicht signifikant. Das Hinzunehmen eines neuen Prädiktors kann aber ja keine Varianzaufklärung der anderen Prädiktoren “rückgängig machen”, daher kann es nicht passieren, dass das Modell mit weniger Prädiktoren mehr Varianz aufklärt und der Test auf diese Weise signifikant wird. Sehen kann man es aber zusätzlich auch immer an der Höhe der Residual Sum of Squares: wenn diese höher ist, ist ja noch “mehr Fehler” im Modell, dieses Modell ist also schlechter. Im letzten Output sieht man, dass die RSS von Modell 1 (ohne Interaktion) höher ist als die von Modell 2 (mit Interaktion).

3.5 zweifaktorielle Varianzanalyse direkt

R kann das alles in einem Schritt über den “Anova()” Befehl für uns machen.

#Anova(Katzenmodell)

3.6 Über “Mehrfaktorielle Varianzanalyse” im Commander

über R-Commander –> Mittelwerte vergleichen –> Mehrfaktorielle Varianzanalyse

3.7 Effektstärken berechnen

Fig. 4 Effektgrößen

Fig. 4 Effektgrößen