Sesgo por Variable Omitida

Sesgo por Variable Omitida#

El sesgo por variable omitida es uno de los problemas más comunes y potencialmente graves en el análisis de regresión. Ocurre cuando excluimos una variable relevante que está correlacionada tanto con la variable dependiente como con las variables independientes incluidas en el modelo.

1. ¿Qué es el Sesgo por Variable Omitida?

  • Ocurre cuando una variable relevante se excluye del modelo

  • La variable omitida debe estar correlacionada con la variable dependiente

  • La variable omitida debe estar correlacionada con las variables incluidas

  • Resulta en estimaciones sesgadas e inconsistentes

2. Efectos del Sesgo:

  • Los coeficientes estimados son sesgados

  • El sesgo puede ser positivo o negativo

  • La magnitud del sesgo depende de:

    • La correlación entre la variable omitida y la dependiente

    • La correlación entre la variable omitida y las variables incluidas

  • Las inferencias estadísticas pueden ser engañosas

3. Soluciones y Prevención:

  • Incluir todas las variables relevantes en el modelo

  • Usar datos experimentales cuando sea posible

  • Considerar variables instrumentales

  • Realizar análisis de sensibilidad

  • Documentar y justificar las exclusiones

La siguiente simulación te permite explorar cómo la omisión de variables relevantes afecta las estimaciones de los coeficientes: