Es gibt einige Datensätze, die in R hinterlegt sind und die man sich zum Üben einfach ins Environment laden kann, wenn man ihren Namen kennt. Hier findet sich eine Übersicht von einigen Datensätzen (wenn man auf den Namen eines Datensatzes klickt, erscheint eine Beschreibung der Variablen).
Die Datensätze lassen sich über folgenden Befehl ins Environment laden und dann ganz normal bearbeiten:
#name <- as.data.frame(name)
Datensatz
InsectSprays <- as.data.frame(InsectSprays)
Spray = verschiedene Sprays (A-F)
Count = Anzahl von Insekten auf der Haut
Aufgaben:
Folgende Hypothese wurde aufgestellt: Die Sprays unterscheiden sich in ihrer Wirksamkeit.
Ein anderes Forschungsteam, das sich mit denselben Daten beschäftigt, hat eine andere Hypothese über die Wirksamkeit. Dieses Team vermutet, dass Spray A weniger wirksam (= höhere Mengen Insekten auf der Haut) sei als alle anderen Sprays.
Datensatz
ToothGrowth <- as.data.frame(ToothGrowth)
dose = Dosierung von Vitamic C Supplements, die dem Meerscheinchen gegeben wurden (in milligramm)
supp = Art der Verabreichung (OJ = Orange Juice, VC = Ascorbinsäure)
len = Zahnlänge
Aufgaben:
Es wird vermutet, dass eine höhere Dosierung Vitamin C zu mehr Zahnwachstum (längeren Zähnen) führt. Dabei soll für die Art der Verabreichung kontrolliert werden.
Auf Basis der Ergebnisse der ersten Analyse soll nun zielgerichteter getesten werden, a) ob es einen positiven linearen Trend zwischen Dosis und Zahnlänge gibt, und b) ob die Zahnlänge bei der Gruppe mit der höchsten Dosis höher war als bei den Gruppen darunter, und ob sich diese Gruppen ebenfalls noch unterscheiden. Berücksichtigen Sie dabei weiterhin auch die Verabreichungsform und mögliche Interaktionen.
Der IQ von 480 Drachen wurde bestimmt. Weiterhin wurde ihre Körperlänge gemessen sowie ihr Wohnort (Gebirge und konkreter Ort innerhalb des Gebirges) notiert (Beispiel von https://gkhajduk.github.io/2017-03-09-mixed-models/).
Daten:
dragons <- read.csv("dragons.csv", stringsAsFactors=TRUE)
Erstellen Sie ein lineares Modell, in dem der IQ aus Gebirge (mountainRange) und Körperlänge (plus Interaktion) vorhergesagt wird. Interpretieren Sie die Ergebnisse (die Kernaussagen herausstellen, es muss nicht jedes einzelne Estimate erklärt werden). Wenn nötig, definieren Sie mountainRange zunächst als Faktor.
Prüfen Sie (grafisch und statistisch) auf Normalverteilung der Residuen (grafisch und statistisch), Linearität der Zusammenhänge (statistisch), Homoskedastizität (grafisch und statistisch) und verzerrende Ausreißer (grafisch).
Führen Sie die Analyse erneut durch, aber diesmal als Multilevel-Modell. Prüfen Sie, ob ein random intercept für Gebirge notwendig ist und/oder ein ramdom slope. Bestimmen Sie das Modell, das die Daten am besten beschreibt. Bestimmen Sie die R2-Annäherung für dieses Modell. Erstellen Sie vorher auch eine geeignete Grafik und erläutern Sie, welche Effekte Sie erwarten.