1 Datensätze in R

In R gibt es einige Standarddatensätze (die bei dem Programm “mit dabei” sind), wie z.B. den Datensatz “ToothGrwoth”: Ein Datensatz der zu einem Experiment gehört, in dem der Einfluss von Vitamin C auf das Zahnwachstum bei Meerschweinchen untersucht wurde).

Eine Übersicht über die Standarddatensätze gibt es unter folgendem Link http://www.sthda.com/english/wiki/r-built-in-data-sets.

2 Zahnwachstumsrate bei Meerschweinchen

Wenn man genauer wissen will, was genau das Szenario hinter den Daten ist, kann man einfach “?NAMEDATENSATZ” als Code eingeben, hier also z.B. “?ToothGrowth”

#?ToothGrowth

Im Hilfefenster würde man dann folgende Information sehen:

The response is the length of odontoblasts (cells responsible for tooth growth) in 60 guinea pigs. Each animal received one of three dose levels of vitamin C (0.5, 1, and 2 mg/day) by one of two delivery methods, orange juice or ascorbic acid (a form of vitamin C and coded as VC).

Heißt: Es gab drei Dosis-Bedingungen. Außerdem wurde noch variiert, in welcher Weise das Vitamin C verabreicht wurde (Orangensaft vs. Askorbinsäure [wahrscheinlich aufgelöst in Wasser]). Gemessen (Kriterium bzw. AV) wurde die Länge der Odontoblasten (die Zellen, die für Zahnlänge verantwortlich sind).

3 Einfaktorielle ANOVA: Der Einfluss der Vitmain-C-Dosis

3.1 Aufgaben

Der Zweite Faktor (die Art der Verabreichung) soll nachfolgend zunächst ignoriert werden.

Testen Sie die folgenden Hypothesen:

  • Hypothese 1: Die Odontoblastenlänge hängt von der Dosierung ab (einfaktorielle ANOVA).

  • Hypothese 2: Die Odontoblastenlänge nimmt mit der Dosierung zu (Post-hoc Tests).

Beginnen Sie die statistische Auswertung mit einer grafischen Veranschaulichung der Daten. Erstellen Sie:

  • Eine Abbildung, die die Gruppenmittelwerte und Fehlerbalken zeigt,

  • Verteilungsabbildungen: (1) Boxplot, (2) Strip-Chart und (3) Density-Plot.

Für den Strip-Chart: Diese Art Abbildung hatten wir bisher nicht erstellt. Benutzen Sie deshalb zur Erstllung die Hilfe in R. Tippen Sie dazu ?stripchart in die Console, um das Übersichtsmenü aufzurufen. Nutzen Sie zur Erstellung der Grafik den Funktionsparameter “jitter” (method = “jitter”). Finden Sie einen Jitter-Wert, der eine angemessene Darstellung der Datenpunkte ermöglicht. Färben Sie die Datenpunkte blau. Bennen Sie auch die Achsen der Grafik.

  • Welchen Eindruck vermittelt Ihnen der Strip-Chart bzgl. des Kriteriums “Varianzhomogenität”?

  • Prüfen Sie dieses Kriterium optisch auch anhand des Density-Plots.

  • Testen Sie das Kriterium danach mit einem Test (s. Formelsammlung).

  • Prüfen Sie dann die aufgestellten Hypothesen (ANOVA und post-hoc-Tets)

Zusatz:

Erstellen Sie abschließend ein lineares Modell mit Kriterium Odontoblastenlänge und Prädiktr Dosierung. Vergleichen Sie den Output mit dem der Varianzanalyse und dem der Post-hoc Tests für Mittelwertsunterschiede.

3.2 Datensatz laden

data("ToothGrowth") # "Einlesen" der Daten (hier besser gesagt "aktivieren" der Daten)
  
head(ToothGrowth) # Anzeige der ersten 10 Einträge
##    len supp dose
## 1  4.2   VC  0.5
## 2 11.5   VC  0.5
## 3  7.3   VC  0.5
## 4  5.8   VC  0.5
## 5  6.4   VC  0.5
## 6 10.0   VC  0.5

3.3 Faktor erzeugen

die experimentelle Variable “dose” (also Dosierung von Vitamin C) ist hier numerisch. Aber eigentlich ist es ja ein experimenteller Faktor. Also zunächst diese Variable in einen Faktor konvertieren.

ToothGrowth <- within(ToothGrowth, {
  dose <- factor(dose, labels=c('low','medium','large'))
})

3.4 Grafiken

3.4.1 Plot für Mittelwerte

3.4.2 Boxplot

3.4.3 Strip-Chart

3.4.4 Density-Plot

3.5 Test auf Varianzhomogenität

3.6 Statistische Hypothesentests

3.6.1 Einfaktorielle ANOVA

3.6.2 Post-hoc Tests

3.7 Zusatz

Anpassung eines linearen Modells (Regressionsanalyse)