La medición de variables latentes con indicadores formativos es un tema muy discutido, tal y como los autores exponen en el comienzo del artículo.
Un indicador formativo se diferencia de uno reflectivo en el que el primero afecta a la variable latente, mientras que en el segundo es la variable latente la que produce un efecto en el indicador. Están, por tanto, causalmente relacionados con la variable latente de manera opuesta.
La correcta especificación de un modelo usando indicadores reflectivos o formativos es esencial. La estimación del modelo y su interpretación cambian ostensiblemente según se haya hecho la modelización de una forma o de otra. Por eso este tema es tan importante en cualquier tipo de planteamiento donde se empleen variables latentes.
El objetivo de este artículo es revisar las principales críticas hacia este tipo de indicadores y tratar de rebatirlas.
Distinción entre indicadores formativos y reflectivos
Una forma de hacerlo es a través de experimentos mentales. Por ejemplo, hacerse la sencilla pregunta de: ¿es el indicador el que causa variaciones en la variable latente o al revés? En el primer caso estaríamos hablando de indicadores formativos y en el segundo de reflectivos.
También abogan por una comparación empírica de varias conceptualizaciones competitivas, para escoger aquella con mejor ajuste, pero en este caso se podría dar un ajuste con una mala especificación, por lo que resulta mucho más adecuado establecer a priori el tipo de medición antes de cualquier análisis.
Recordemos que una variable latente, en definición de uno de los autores (Bollen), es una variable en la que no hay una realización muestral en al menos alguna observación en la muestra. Esto quiere decir que, de forma habitual, las variables latentes no tienen valores observables en la muestra.
Según los autores, los indicadores formativos pueden ser o no la única combinación posible de indicadores para formar el concepto, o lo que es lo mismo, el concepto se define a través de los indicadores que lo forman, ya sea de forma perfecta (sin término de error), o de manera aproximada (con término de error). Este segundo caso es el más habitual para Bollen y Diamantopoulos, y se resume matemáticamente así:
Variable latente = Lambda_1*x1 + Lambda_2*x2 + … + Lambda_n*xn + Error formativo
En el caso de 3 indicadores la ecuación formativa quedaría así:
Variable latente = Lambda_1*x1 + Lambda_2*x2 + Lambda_3*x3 + Error formativo
Sin embargo la ecuación reflectiva sería así:
x1 = Lambda_1*Variable latente + Error_1
x2 = Lambda_2*Variable latente + Error_2
x3 = Lambda_3*Variable latente + Error_3
Como puede comprobarse, la especificación es distinta, y las implicaciones causales también. Es muy importante recalcar que las variaciones en la variable latente son determinadas de manera diferente; para los indicadores formativos, ellos mismos pueden contribuir a la variación de la variable latente, mientras que para los reflectivos esa variación tiene que ser externa a los indicadores.
En un planteamiento formativo los pesos de los indicadores pueden fijarse a priori según la teoría o estimarse, y permite la flexibilidad de no tener que admitir que los indicadores puedan ser intercambiables o que tengan que estar todos fuertemente correlacionados. Si dudamos en que ello sea así, es que probablemente estemos ante un caso de indicadores formativos.
Los autores también distinguen entre variables latentes donde los indicadores tienen unidad conceptual, y variables compuestas donde los indicadores suman sus efectos para obtener un índice. Esta divergencia de planteamiento es fundamental para ellos.
Crítica 1. Un constructo medido con indicadores formativos no existe separadamente de sus indicadores
Es decir, si se cambian los indicadores se cambia el constructo. Pero los autores argumentan que esto es así cuando se forman índices o variables compuestas, pero no cuando la variable latente está formada por indicadores y existe un término de error. Al hacer una definición a priori del constructo, al igual que sucede si fuera una variable latente reflectiva, es ese constructo el que justifica la selección de indicadores.
Crítica 2. Los indicadores formativos son causas, más que medidas
Para mí esta es la parte más controvertida, ya que los autores no justifican el trasfondo de la crítica. Un indicador formativo puede en realidad convertirse en una variable latente y un indicador reflectivo.
Por ejemplo, si definimos la variable latente «Calidad de un servicio» con dos indicadores formativos (elementos tangibles, elementos intangibles), claramente podemos re-especificar esos indicadores como dos variables latentes diferentes con un indicador reflectivo cada una. Así, tanto los elementos tangibles como los intangibles afectarían a la calidad del servicio, es decir, serían causas, mientras que los indicadores reflectivos de esas causas serían las medidas.
Bollen y Diamantopoulus no hacen referencia a este simple razonamiento, que es en mi opinión la base de la crítica a los indicadores formativos.
Crítica 3. Los indicadores formativos implican múltiples dimensiones de un constructo
En realidad no implican múltiples dimensiones como indican los autores, pero la crítica se refiere más al hecho comentado en el apartado anterior, en que los indicadores de un constructo pueden re-especificarse como múltiples dimensiones con indicadores reflectivos cada una de ellas.
Esto trae también la discusión del concepto de dimensionalidad, ya que esas nuevas variables latentes pueden ser consideradas causas de la variable latente primaria (como en el caso del ejemplo comentado de la calidad del servicio), con un error de determinación asociado, lo que bajo mi punto de vista conllevaría la desaparición de la dimensionalidad, y la aceptación de que son constructos diferentes que causan variación en la variable latente principal.
Crítica 4. Los indicadores formativos se asumen que están libres de error de medida
Los autores se escudan en que existe un error asociado a esa determinación de la variable latente, como en un modelo de regresión habitual:
Variable latente = Lambda_1*x1 + Lambda_2*x2 + … + Lambda_n*xn + Error formativo
Ese «Error formativo» es diferente del error de medida en los indicadores observables x1…xn, y es ahí de nuevo donde una re-especificación con un modelo de variables latentes reflectivas solucionaría el problema.
Crítica 5. Los indicadores formativos están sujetos a confundido interpretativo
El confundido interpretativo no es más que la consecuencia de establecer un modelo causal amplio entre varias variables latentes, de tal manera que la especificación de la medición en otras variables o relaciones entre ellas puede condicionar la propia relación entre un constructo y sus indicadores observables.
Los autores advierten que este es un problema tanto para indicadores reflectivos como formativos. Ante esta situación, en mi opinión, hay que construir modelos causales con amplitud de miras, fijando parte las mediciones de cada variable (tipo indicador gold standar en la terminología de Leslie A. Hayduk).
Crítica 6. Los indicadores formativos no pasan las restricciones de proporcionalidad
Realmente los test de restricciones de proporcionalidad son una forma de ver si esos indicadores son adecuados o no, más que una limitación de los mismos.
Crítica 7. Los coeficientes de los indicadores formativos deben fijarse a priori
No es necesario según su conceptualización de indicadores formativos. Además, el hecho de fijar indicadores puede ser parte también de una forma de testar mediciones reflectivas,como el caso del gold standard de Hayduk.
Conclusión/Comentarios
Creo que los autores hacen un buen trabajo profundizando en las críticas sobre los indicadores formativos, distinguiendo claramente entre variables que son latentes e índices creados artificialmente. En el segundo caso no se estaría hablando de una variable latente en el sentido estricto de la palabra, y por tanto tampoco de indicadores formativos en la conceptualización entendida como opuesta a los reflectivos.
Si admitimos esa buena distinción de los autores, la cuestión que habría que abordar con mayor claridad es la posible re-especificación de los indicadores formativos en variables latentes reflectivas. Bajo mi punto de vista, esto concordaría mucho más con las visiones sobre medición de otros grandes nombres en la metodología actual (ej. Hayduk, Borsboom), y ayudaría a modelar los errores de medida que cualquier indicador puede tener.
Ante esta situación, mi visión a día de hoy es que es preferible la re-especifiación, y luego seguir una estrategia de modelado similar a la recomendada por Hayduk en su libro de 1996, fijando los indicadores gold standar, y reduciendo al mínimo posible los indicadores de cada variable latente.
Lo que sí es importante es, desde luego, saber distinguir los indicadores reflectivos de los formativos, y no emplear indicadores reflectivos «a discreción», que es uno de los errores comunes que algunos investigadores cometen. Una buena reflexión acerca de la natualeza de las mediciones en el modelo planteado es el primer paso, para después pensar acerca de posibles re-especificaciones y estrategias de análisis.
Bollen, K. A. & Diamantopoulos, A. (2015). In defense of causal-formative indicators: A minority report. Psychological Methods, doi: 10.1037/met0000056