Comenzamos una serie de entradas sobre una introducción práctica a los modelos de ecuaciones estructurales, en la que emplearemos los programas LISREL y Stata para estimar modelos sencillos, que pretenden ser una guía para estudiantes que comienzan a adentrarse en esta temática.
Para ello, necesitamos primeramente abordar varios aspectos de la idiosincrasia de esta metodología, con el fin de entender paso a paso qué estamos haciendo.
En este post inicial, vamos a explicar por qué se emplean covarianzas como input, y que debemos interpretar los datos en desviaciones sobre la media, y no en su naturaleza bruta.
La ecuación básica
Partimos de la siguiente ecuación básica, en la que relacionamos linealmente la variable aleatoria X con la variable aleatoria Y, mediante los parámetros (constantes) a y b.
Y=a + bX
Tomando esperanzas y varianzas, tenemos:
E(Y)=a+bE(X)
Var(Y)=b2Var(X)
El parámetro b, por tanto, es un coeficiente estructural que representa el cambio en Y cuando X cambia. En el caso de tomar esperanzas:
E(Y)-a=bE(X)
es decir, a simplemente es un parámetro de escala que modifica el valor esperado de Y.
Al tomar varianzas desaparece el parámetro a (la varianza de una constante es cero), por lo que obtenemos también una relación entre Y y X, pero esta vez sin la necesidad de conocer ese parámetro de escala.
Es fácil comprobar que si, por ejemplo, a=0 y b=2, para n=5, tenemos que x=[0,1,2,3,4] e y=[0,2,4,6,8], entonces la varianza de Y es 4 veces (b2) la varianza de X.
Asimismo, podemos expresar la relación entre Y e X a nivel de covarianzas con un poco de álgebra:
Por tanto:
De este modo, sabiendo las varianzas y covarianzas de X e Y podemos cuantificar el parámetro b, que es el que mide el peso de la asociación entre X e Y, o el tamaño del efecto si estamos usando terminología causal.
Ya tenemos una pista de por qué los modelos de ecuaciones estructurales se llaman también modelos de estructuras de covarianza (recordemos que una varianza no es más que la covarianza de una variable consigo misma).
Tomar desviaciones sobre la media
Lo que un investigador quiere al final no es solamente saber cuál es la relación entre las varianzas de dos variables, sino principalmente qué sucede en Y cuando X cambia en una unidad. Esto es básico para hacer predicciones sobre datos individuales.
Como hemos visto, para eso necesitamos conocer el parámetro a, y ese parámetro no aparece en las relaciones de covarianza. Pero esto no es un problema si interpretamos los datos en desviaciones sobre la media.
E(Y-E(Y))=a + bE(X-E(X))
0=a+0
Es decir, necesariamente a=0.
Por tanto, al tomar los datos en desviaciones sobre la media nos hemos quitado «el problema» del parámetro de escala. Y eso no es todo, podemos comprobar que las relaciones de covarianza no cambian.
De este modo, podemos seguir conociendo el parámetro estructural b a partir de únicamente las covarianzas cuando los datos están en desviaciones sobre la media. Ese parámetro b es exactamente el mismo que se habría obtenido con los datos brutos y la estimación de a, pero la interpretación cuando no se conoce a es en términos de desviaciones sobre la media, que al fin y al cabo no deja de ser una pequeña reparametrización de las variables originales, unos simples cambios de escala.
Simulación con Stata
El siguiente código en Stata nos proporciona una prueba empírica de lo que hemos explicado. Abrimos un fichero «Do-file», copiamos el código y lo ejecutamos en un archivo .dta del programa que previamente hemos abierto en blanco.
/*Generamos una variable X Normal de media=10 y con varianza=1, con 100 observaciones*/ |
Conclusión
Los modelos de ecuaciones estructurales emplean las covarianzas entre las variables como datos de entrada. La relación entre las covarianzas permite la estimación de los coeficientes estructurales, que son idénticos a si se hubieran computado empleando los datos brutos (de cada observación) tomados en desviaciones sobre la media.
Es decir, no necesitamos conocer los datos de cada observación, sólo las covarianzas entre las variables. Sin embargo, si queremos emplear esos coeficientes estimados para realizar predicciones individuales, hemos de tener en cuenta que habrá que hacerlo considerando que los datos de las variables están en desviaciones sobre sus medias.
Obviamente, realizar predicciones individuales tomando a=0 es un error, porque no conocemos a (aunque más adelante veremos que se puede estimar, pero eso es un tema más avanzado).