La idea central de un contrafáctico en regresión es responder a la pregunta: ¿qué tendría que cambiar en las variables de entrada para que la predicción numérica del modelo se acerque a un valor deseado? Como trabajamos con una salida continua, la evaluación no puede reducirse a un simple “lo consiguió o no”. Un contrafáctico x′x’x′ puede producir una mejora mínima y, aun así, ser poco útil; o puede requerir cambios enormes para alcanzar una mejora razonable. Por eso, evaluar contrafácticos en regresión implica medir, al mismo tiempo, objetivo alcanzado, coste del cambio, realismo y estabilidad.
Por este motivo, antes de evaluar es imprescindible fijar qué se considera “éxito” en una salida continua. Lo más habitual es definir un umbral, un rango objetivo o una mejora mínima respecto al punto original. Este primer paso es crucial, ya que determina cómo se interpretará la calidad de los contrafácticos y qué métricas tendrán sentido.
Una vez definida la noción de éxito, se pueden plantear las métricas para evaluar cada contrafáctico. Entre las más utilizadas se encuentran las siguientes:
- Validez. En regresión se refiere a cumplir la condición numérica definida. Esto puede evaluarse mediante: (1) la tasa de éxito, es decir, el porcentaje de instancias para las que existe al menos un x′ que cumpla el objetivo; y (2) el grado de éxito, que mide cuánto se supera o cuánto se queda corto respecto a la meta.
- Proximidad. Indica cuán “cerca” está x′ de la observación original x, es decir, el coste del cambio. En la práctica se mide como la magnitud total de las modificaciones realizadas en las variables (por ejemplo, mediante distancias L1 o L2), buscando cambios lo más pequeños posible sin perder el objetivo.
- Accionabilidad. En regresión es frecuente trabajar con variables que no son intervenibles. La accionabilidad evalúa si el contrafáctico modifica únicamente características tocables (y respeta aquellas consideradas inmutables o no accionables).
- Plausibilidad. Se refiere a cuán realista es el contrafáctico x′ respecto a la población o datos observados: si sus valores caen en rangos razonables y si respetan las correlaciones entre variables, evitando puntos fuera de distribución.
- Robustez. Mide la estabilidad del contrafáctico: que siga cumpliendo el objetivo aunque haya pequeñas variaciones (por ejemplo, perturbaciones en las entradas o ligeros cambios en el modelo).
Aunque estas propiedades están ampliamente asentadas en la literatura, no siempre es posible optimizarlas simultáneamente. En la práctica, mejorar una suele implicar empeorar otra, lo que obliga a priorizar según el caso de uso. Por este motivo, al evaluar contrafácticos en regresión aparecen de forma recurrente tensiones (trade-offs) como las siguientes:
- Proximidad vs plausibilidad: el cambio mínimo puede llevar a combinaciones raras; el cambio realista puede requerir modificar más variables.
- Logro del objetivo vs coste: alcanzar un umbral muy exigente suele disparar distancias/costes.
- Robustez vs cercanía al umbral: cuanto más “al borde” esté f(x’) respecto a T, más frágil tiende a ser.
En resumen, en modelos de regresión evaluar contrafácticos consiste en medir el equilibrio entre cuánto mejora la predicción y cuánto cuesta lograrlo en el mundo real. Un buen contrafáctico no es el que simplemente cruza un umbral, sino el que lo hace con cambios accionables, plausibles y robustos, evitando soluciones frágiles o inalcanzables. Por eso, una evaluación completa debe combinar métricas de logro del objetivo (tasa y grado de éxito), proximidad (coste), accionabilidad (intervenibilidad), plausibilidad (realismo) y robustez (estabilidad): solo así los contrafácticos dejan de ser una curiosidad matemática y se convierten en una herramienta útil para apoyar decisiones en contextos reales.
