Übung - Der Effekt von kollinearen Variablen bei MLR-Modellen
Author: Hans Lohninger
Stark korrelierte Variablen bewirken, dass MLR-Modelle instabil werden. Um
das zu zeigen, sollten Sie versuchen, einige kollineare Variablen in den
Datensatz BOILPTS einzuführen und ein
multiples Regressionsmodell mit und ohne die kollinearen Variablen zu berechnen:
- Erstellen Sie zwei Kopien der Variablen "RandicToz" und fügen Sie eine
geringe Menge an Rauschen zu beiden Kopien hinzu (2 %).
- Berechnen Sie ein MLR-Modell für den Siedepunkt, indem Sie die originale
"RandicToz"-Variable und eine der verrauschten Variablen verwenden. Speichern
Sie das Protokoll in einer Datei.
- Berechnen Sie ein weiteres MLR-Modell. Verwenden Sie dazu die
andere verrauschte Variable. Speichern Sie erneut die Protokolldatei.
- Erzeugen Sie zwei Kopien der Variablen "JHET" und fügen Sie eine
geringe Menge an Rauschen zu beiden Kopien hinzu (2 %).
- Berechnen Sie ein drittes MLR-Modell für den Siedepunkt, indem Sie die
originale "RandicToz"-Variable und eine der verrauschten "JHET"-Variablen
verwenden. Speichern Sie das Protokoll in einer Datei.
- Zum Schluss berechnen Sie ein viertes MLR-Modell für den Siedepunkt;
verwenden Sie dazu die originale "RandicToz"-Variable und die andere
verrauschte "JHET"-Variable. Speichern Sie das Protokoll in einer Datei.
- Vergleichen Sie die vier Protokolle. Sehen Sie sich das Bestimmtheitsmaß,
den F-Wert und die Regressionskoeffizienten an. Erkennen Sie den
Unterschied zwischen den Modellen 1 und 2 sowie den Modellen 3 und
4?
Gehen Sie jetzt zum DataLab und
führen Sie die oben genannten Schritte durch. Zusätzlich zu dem Vergleich der
Regressionsparameter sollten Sie sich die abgeschätzten Werte genauer ansehen.
Sie werden erkennen, dass sich die geschätzten Werte für die ersten beiden
Datensätze stark unterscheiden, aber nur gering für den dritten und den vierten
Satz.
|