Sesgo por Variable Omitida#
El sesgo por variable omitida es uno de los problemas más comunes y potencialmente graves en el análisis de regresión. Ocurre cuando excluimos una variable relevante que está correlacionada tanto con la variable dependiente como con las variables independientes incluidas en el modelo.
1. ¿Qué es el Sesgo por Variable Omitida?
Ocurre cuando una variable relevante se excluye del modelo
La variable omitida debe estar correlacionada con la variable dependiente
La variable omitida debe estar correlacionada con las variables incluidas
Resulta en estimaciones sesgadas e inconsistentes
2. Efectos del Sesgo:
Los coeficientes estimados son sesgados
El sesgo puede ser positivo o negativo
La magnitud del sesgo depende de:
La correlación entre la variable omitida y la dependiente
La correlación entre la variable omitida y las variables incluidas
Las inferencias estadísticas pueden ser engañosas
3. Soluciones y Prevención:
Incluir todas las variables relevantes en el modelo
Usar datos experimentales cuando sea posible
Considerar variables instrumentales
Realizar análisis de sensibilidad
Documentar y justificar las exclusiones
La siguiente simulación te permite explorar cómo la omisión de variables relevantes afecta las estimaciones de los coeficientes: