Forscher*innen untersuchen die Wirksamkeit zweier unterschiedlicher Therapieformen gegen Spinnenphobie. In einer Therapieform gibt es Gesprächstherapie plus Exposition mit Bildern von Spinnen, in der anderen Therapieform gibt es Gesprächstherapie plus Exposition mit realen Spinnen.

Es soll untersucht werden, ob die Dauer der Therapie (in Wochen) mit der Symptomverbesserung zusammenhängt und ob sich dieser Zusammenhang eventuell zwischen den beiden Therapieformen unterscheidet.

Die Symptomatik wurde operationalisiert als die Zeit in Minuten, die es Patient*innen aushalten, in einem Raum mit einer Spinne zu sein. Wenn sich die Symptome verbessern, sollten also höhere Werte auf diesem Maß beobachtet werden.

Es handelt sich um unabhängige Stichproben. Das heißt, es wurden nicht dieselben Leute über einen längeren Zeitraum beobachtet, sondern es wurden Patient*innen getestet, die sich jeweils an unterschiedlichen Punkten in ihrem Therapieverlauf befanden.

Es wurden folgende Hypothesen aufgestellt:

Aufgaben:

  1. Stellen Sie die zugehörigen statistischen Hypothesen über Prädiktoren auf (siehe FS multiple Regression).

  2. Erstellen Sie mit dem Commander eine Abbildung, in der die Verläufe der beiden Gruppen zu sehen sind (ein gruppiertes Streudiagramm mit Kleinstquadratlinien). Interpretieren Sie die Abbildung, welche Effekte deuten sich an?

  3. Berechnen Sie ein lineares Modell. Nehmen Sie beide Faktoren und ihre Interaktion ins Modell auf. Interpretieren Sie die erhaltenen Regressionskoeffizienten.

Statistische Hypothesen:

Haupteffekt Dauer der Therapie:

H1: beta (Dauer) =/= 0, H0: beta (Dauer) = 0

Interaktion Dauer x Art der Therapie:

H1: beta (Art x Dauer) =/= 0, H0: beta (Art x Dauer) = 0

Daten einlesen, Commander laden, Abbildung erstellen

#Einlesen
Spinnenphobie <- read.csv("Spinnenphobie.csv", sep=";")

#Therapie zum Faktor machen
Spinnenphobie$Therapie <- factor(Spinnenphobie$Therapie)

#Commander laden
library(Rcmdr)
## Loading required package: splines
## Loading required package: RcmdrMisc
## Loading required package: car
## Loading required package: carData
## Loading required package: sandwich
## Loading required package: effects
## Registered S3 methods overwritten by 'lme4':
##   method                          from
##   cooks.distance.influence.merMod car 
##   influence.merMod                car 
##   dfbeta.influence.merMod         car 
##   dfbetas.influence.merMod        car
## lattice theme set by effectsTheme()
## See ?effectsTheme for details.
## Das Commander GUI wird nur bei interaktiven Sessions gestartet
## 
## Attaching package: 'Rcmdr'
## The following object is masked from 'package:base':
## 
##     errorCondition
#Gruppiertes Streudiagramm
scatterplot(Symptomatik~Dauer | Therapie, regLine=TRUE, smooth=FALSE, boxplots=FALSE, by.groups=TRUE, data=Spinnenphobie)

Man sieht: in beiden Gruppen scheint sich die Symptomatik mit steigender Therapiedauer zu verbessern.

Allerdings scheint es auch Unterschiede zwischen den Gruppen zu geben: Die Steigung der Gerade ist steiler für die “Bilder”-Gruppe als für die “Tiere”-Gruppe. Überraschenderweise scheinen sich die Symptome also zunächst schneller zu verbessern, wenn man noch gar nicht mit echten Spinnen geübt hat.

Nun prüfen wir, ob sich die aus dem Graphen abgelesenen Effekte statistisch bestätigen lassen.

Lineares Modell

summary(lm(Symptomatik~Dauer*Therapie,data=Spinnenphobie))
## 
## Call:
## lm(formula = Symptomatik ~ Dauer * Therapie, data = Spinnenphobie)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -6.5942 -1.4950  0.1465  1.3611  6.8171 
## 
## Coefficients:
##                     Estimate Std. Error t value Pr(>|t|)    
## (Intercept)           3.1094     1.0585   2.938  0.00414 ** 
## Dauer                 0.7095     0.1085   6.537 3.02e-09 ***
## TherapieTiere         3.6351     1.5667   2.320  0.02245 *  
## Dauer:TherapieTiere  -0.3882     0.1489  -2.606  0.01061 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.438 on 96 degrees of freedom
## Multiple R-squared:  0.3601, Adjusted R-squared:  0.3401 
## F-statistic:    18 on 3 and 96 DF,  p-value: 2.384e-09

Interpretation der Koeffizienten:

Um das Interaktionsmuster und die Bedeutung des Koeffizienten in diesem Fall besser zu verstehen, können wir uns auch zwei neue Teildatensätze für die beiden Therapiegruppen erstellen und für jede Gruppe ein lineares Modell anpassen (das ist jetzt Zusatz fürs Verständnis, nicht mehr Teil der regulären Aufgabe). Wenn unsere Interpretation von eben stimmt, dann sollte beta für Dauer in der Bilder-Gruppe 0.7095 bleiben (wie im obigen Modell), aber in der Tiere-Gruppe sollte es 0.3213 sein (wie eben berechnet):

#Subsets erstellen
Bilder <- subset(Spinnenphobie,Therapie=="Bilder")
Tiere <- subset(Spinnenphobie,Therapie=="Tiere")

#lineare Modelle anpassen
summary(lm(Symptomatik~Dauer, data=Bilder))
## 
## Call:
## lm(formula = Symptomatik ~ Dauer, data = Bilder)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.4956 -0.9766  0.1883  1.0573  4.2632 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  3.10936    0.78050   3.984 0.000229 ***
## Dauer        0.70950    0.08003   8.866 1.12e-11 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.798 on 48 degrees of freedom
## Multiple R-squared:  0.6209, Adjusted R-squared:  0.613 
## F-statistic:  78.6 on 1 and 48 DF,  p-value: 1.118e-11
summary(lm(Symptomatik~Dauer, data=Tiere))
## 
## Call:
## lm(formula = Symptomatik ~ Dauer, data = Tiere)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -6.5942 -2.1462  0.1124  1.6613  6.8171 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   6.7445     1.3939   4.838 1.39e-05 ***
## Dauer         0.3213     0.1231   2.611    0.012 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.942 on 48 degrees of freedom
## Multiple R-squared:  0.1243, Adjusted R-squared:  0.1061 
## F-statistic: 6.816 on 1 and 48 DF,  p-value: 0.01202

Wir sehen, dass unsere Interpretation stimmt. Der Test über den Interaktionsterm im ursprünglichen Modell kann uns, anders als diese separaten Modelle, zusätzlich sagen, dass der Unterschied in den Steigungen signifikant ist.