Dummy-Variablen-Falle erklärt | Online Marketing Basics

Die Dummy-Variablen-Falle ist das ideale Beispiel für perfekte Multikollinearität. In so einem Fall ist die Berechnung des Schätzers nicht möglich. Dabei ist die Lösung des Problems trivial.

Die Matrix im Falle einer “Dummy Variable Trap”

Es gilt stets der Zusammenhang, dass sich der erste Wert der ersten Spalte als Summe der beiden anderen Spaltenwerte ergibt (allgemeine Linearkombination). Im folgenden Beispiel wird bspw. der Lohn auf die beiden Geschlechter-Dummies regressiert. Dann ergibt sich diese exemplarische Matrix X:

 

X = \begin{pmatrix} 1 & 1 & 0 \\ 1 & 0 & 1 \\ 1 & 0 & 1 \\ \end{pmatrix}

 

Die Determinante beträgt null. Es liegt perfekte Multikollinearität vor. Wie können wir das Problem beheben?

Problem der Dummy-Variablen-Falle beheben

Zur Lösung des Problems gibt es zwei einfache Ansätze:

  • Entfernen der Konstante aus dem Modell: Es ergibt sich die Form des indirekten Mittelwertvergleichs: yi = ß0di + ß1(1-di). ß0 entspricht dem Mittelwert für alle di = 1. ß1 entspricht logischerweise dem Mittelwert aller Beobachtungen von y für die di = 0.
  • Ausschluss einer Dummy-Variable: Ausschluss der Dummy-Variable eines Geschlechts reduziert das Modell auf folgende Form yi = ß0 + ß1di (direkter Mittelwertvergleich). ß1 entspricht dann dem Mittelwertunterschied zwischen Mann und Frau.

Marvin Jörs

Gründer von onlinemarketingscience.com, Student der Wirtschaftsinformatik und Gründer der Skyscraper Marketing UG in Frankfurt. Ich interessiere mich vor allem für Themen wie Big Data, Data Science, neuronale Netze, Business Process Optimization im Online-Geschäft und natürlich SEO (Suchmaschinenoptimierung).

Hallo Nutzer

destructed

Marvin / geb. 1994 / Studium der Wirtschaftsinformatik (TU Darmstadt) / Gründer