Semana 3. Evaluación del supuesto de proporcionalidad

Introducción

En la sesión anterior se revisó el modelo de riesgos proporcionales de Cox, incluyendo su formulación matemática y sus principales características. En esta sección se abordará la evaluación de sus supuestos, con énfasis en el supuesto de proporcionalidad de los riesgos. En este contexto, es importante destacar que la validez de las inferencias derivadas del modelo depende críticamente del cumplimiento de dichos supuestos, ya que estos garantizan que las estimaciones sean consistentes y correctamente interpretables.

En particular, el supuesto de riesgos proporcionales (PH, por su acrónimo en inglés) establece que el efecto de las covariables sobre el riesgo —expresado mediante el hazard ratio (HR)— permanece constante a lo largo del tiempo; es decir, que las razones de riesgo entre grupos no varían durante el seguimiento. Cuando este supuesto no se cumple, las estimaciones pueden volverse sesgadas o perder su interpretación directa, pudiendo además ocultar variaciones temporales relevantes en la asociación entre las covariables y el evento de interés. En general, la evaluación del supuesto de PH en el modelo de Cox puede abordarse mediante tres enfoques: métodos gráficos, pruebas de bondad de ajuste y la incorporación de covariables dependientes del tiempo.

Los métodos gráficos permiten evaluar de manera exploratoria si la razón de riesgos se mantiene constante en el tiempo. Por su parte, las pruebas de bondad de ajuste proporcionan una evaluación estadística formal del supuesto de PH, permitiendo detectar si existe una relación sistemática entre los residuos y el tiempo. Finalmente, la inclusión de covariables dependientes del tiempo permite modelar explícitamente situaciones en las que el efecto de una covariable cambia a lo largo del seguimiento, ya sea para evaluar el incumplimiento del supuesto o para corregirlo dentro del modelo mediante la incorporación de términos de interacción entre las covariables y funciones del tiempo.

Fundamentos teóricos del supuesto de proporcionalidad

Recordemos la forma general del modelo:

\[ h(t|X) = h_0(t)\exp(\beta_1X_1+\beta_2X_2+\dots+\beta_pX_p) \]

donde:

\(h(t|X)\): función de riesgo para un individuo con covariables \(X\)
\(h_0(t)\): función de riesgo basal
\(X_1,\dots,X_p\): covariables
\(\beta_1,\dots,\beta_p\): coeficientes de regresión

El modelo de Cox se define a partir de dos componentes: uno paramétrico y otro no paramétrico. El componente paramétrico está dado por los coeficientes \(\beta_1, \beta_2, \dots, \beta_p\), que cuantifican el efecto de las covariables sobre el riesgo del evento, mientras que el componente no paramétrico corresponde a la función de riesgo basal \(h_0(t)\), cuya forma no se especifica. Esta combinación es la que confiere al modelo su carácter semiparamétrico.

Podemos ver que las covariables actúan de manera multiplicativa sobre el riesgo basal, lo que implica que modifican la magnitud del riesgo instantáneo, pero no su forma a lo largo del tiempo. Esta propiedad constituye la base del supuesto de riesgos proporcionales, según el cual la razón de riesgos entre individuos (HR) permanece constante en el tiempo.

En términos interpretativos, esto significa que las diferencias relativas en el riesgo entre individuos no varían a lo largo del seguimiento.

Ejemplo:

Como podemos apreciar en la gráfica 1, aunque el riesgo varía a lo largo del tiempo para ambos grupos, la relación entre ellos se mantiene constante (HR=2), lo que ilustra el supuesto de riesgos proporcionales.

La violación del supuesto de riesgos proporcionales no implica que el modelo de Cox deba descartarse automáticamente, sino que requiere ajustar la estrategia de modelación. La elección de la alternativa depende de la magnitud de la violación, la covariable involucrada y el objetivo del estudio. Más adelante se discutirán estrategias para abordar esta situación.

Métodos gráficos para evaluar el supuesto de proporcionalidad

Los métodos gráficos constituyen una herramienta fundamental para evaluar el supuesto de riesgos proporcionales (PH) en el modelo de Cox, ya que permiten examinar de manera visual si la razón de riesgos entre grupos se mantiene constante a lo largo del tiempo. Aunque no proporcionan una prueba formal, son especialmente útiles como diagnóstico inicial, al facilitar la identificación de patrones que sugieren posibles violaciones del supuesto.

Curvas log-log de supervivencia

Una de las técnicas más utilizadas consiste en comparar las curvas de supervivencia estimadas para cada grupo mediante la transformación \(−ln[−ln(\hat{S}(t))]\). Esta transformación es adecuada porque está definida para probabilidades y, bajo el modelo de Cox, convierte la relación multiplicativa de riesgos en una diferencia aditiva constante entre grupos.

Ejemplo (tomado de kleinbaum, pag 168):

Para ilustrar el proceso, supongamos que para dos puntos de supervivencia \(\hat{S}=0.54\) y \(\hat{S}=0.25\), queremos encontrar sus valores transformados:

Para \(\hat{S}=0.54\): Primero calculamos su logaritmo natural y lo multiplicamos por \(-1\):

\(log(0.54) = -0.616\), por lo tanto \(-log(0.54) = 0.616\).

Luego volvemos a calcular el logaritmo de este resultado y lo multiplicamos por \(-1\):

\(log(0.616) = -0.4845\), por lo tanto \(-log(0.616) = 0.4845\).

Es decir, que el valor \(−ln[−ln({0.54})]\) es aproximadamente \(0.4845\).

Repetimos el proceso para \(\hat{S}=0.25\):

\(-log(0.25) = 1.386\)

\(-log(1.386) = -0.3264\)

Es decir, que el valor transformado para \(−ln[−ln({0.25})]\) es aproximadamente \(-0.3264\).

Vamos a ubicar esos puntos en el grafico:

En la gráfica 2 se muestra la función de supervivencia \(\hat{S}(t)\) en el panel izquierdo y su transformación \(-ln[-ln(\hat{S}(t))]\) en el panel derecho. Podemos observar que para valores de \(S(t)\) cercanos a 1, la transformación produce valores grandes y positivos; para valores intermedios, los valores transformados son cercanos a 0; y para valores pequeños, los valores transformados son negativos.

Nota: Este documento sigue la notación del libro de Kleinbaum et al. Sin embargo, en algunas librerías de R y otros programas estadísticos se utiliza la transformación \(\log[-\log(\hat{S}(t))]\). Ambas expresiones son equivalentes, es decir log es el logaritmo natural, y se basan en la misma función de supervivencia y transmiten la misma información sobre la relación entre las curvas. La elección entre una u otra depende principalmente de la convención adoptada en la literatura o del software utilizado.

Bajo el modelo de Cox:

\(\ln(-\ln S(t|X_1)) - \ln(-\ln S(t|X_2)) = \sum_{i=1}^p \beta_i (X_{1i} - X_{2i})\)

Por lo tanto,

\(-\ln(-\ln S(t|X_1)) = \ln(-\ln S(t|X_2)) + \sum_{i=1}^p \beta_i (X_{1i} - X_{2i})\)

Como consecuencia, si el supuesto de riesgos proporcionales se cumple, las curvas transformadas deberían ser aproximadamente paralelas en el tiempo. La interpretación de estas curvas es la siguiente:

Curvas aproximadamente paralelas → evidencia a favor del supuesto de riesgos proporcionales
Curvas que se cruzan → evidencia clara de no proporcionalidad
Curvas que divergen o convergen → posible efecto dependiente del tiempo

Desde el punto de vista teórico, este paralelismo se justifica porque, bajo el modelo de Cox, la diferencia entre las curvas transformadas depende únicamente de las covariables y no del tiempo, lo que implica una separación constante entre ellas. En la práctica, estas curvas se construyen a partir de estimaciones de Kaplan–Meier o de curvas ajustadas.

Este gráfico muestra cómo evaluar el supuesto de riesgos proporcionales en análisis de supervivencia mediante curvas de \(\ln(-\ln(S(t)))\). Se observa que en la Gráfica 4a las curvas del grupo placebo y del grupo de tratamiento son aproximadamente paralelas, lo que indica que el hazard ratio es constante en el tiempo y el supuesto se cumple; en la Gráfica 4b las curvas se cruzan, evidenciando que el efecto del tratamiento cambia de dirección y viola claramente la proporcionalidad; y en la Gráfica 4c se aprecia una divergencia a partir de cierto punto, lo que sugiere un efecto dependiente del tiempo, también contradice el supuesto de riesgos proporcionales.

Para variables continuas, la evaluación gráfica del supuesto de riesgos proporcionales no puede realizarse directamente en su escala original, ya que las curvas de supervivencia log–log se construyen a partir de grupos. Por esta razón, es necesario transformar la variable continua en una variable categórica, definiendo intervalos o niveles (por ejemplo, bajo, medio y alto), lo cual permite comparar visualmente las curvas entre subgrupos homogéneos de individuos. Esta categorización puede basarse en cuantiles (terciles, cuartiles) o en puntos de corte clínicamente relevantes, dependiendo del contexto del estudio.

Una vez definidos los grupos, se estiman las curvas de Kaplan–Meier para cada categoría y se transforman a la escala log–log. El análisis se centra en evaluar si estas curvas mantienen una separación aproximadamente constante a lo largo del tiempo, es decir, si presentan un patrón de paralelismo. Cuando las curvas son paralelas, se interpreta que el efecto de la variable continua sobre el riesgo es proporcional en el tiempo, lo cual respalda el supuesto de riesgos proporcionales. En contraste, si las curvas divergen, convergen o se cruzan, esto indica que el efecto de la variable cambia a lo largo del tiempo, sugiriendo una posible violación del supuesto PH. En tales casos, puede ser necesario considerar estrategias alternativas, como la inclusión de efectos dependientes del tiempo, transformaciones funcionales de la covariable o el uso de modelos que no requieran el supuesto de proporcionalidad.

Retomando el ejercició del capítulo 2, para evaluar el supuesto de riesgos proporcionales utilizando la variable logWBC, que es continua, es necesario categorizar la variable. En este caso creamos tres niveles (bajo, medio y alto) y a partir de estos grupos, construimos las curvas de Kaplan–Meier para cada categoría, transformándolas a la escala log–log para su evaluación gráfica.

Gráfico de curvas observadas versus esperadas

Otra herramienta gráfica para evaluar el supuesto de PH en el modelo de Cox, es a través de las curvas de supervivencia observadas versus esperadas. Este enfoque puede aplicarse de forma individual para cada variable o ajustando por otras covariables. En la estrategia univariada, las curvas observadas se obtienen mediante el estimador de Kaplan-Meier, mientras que las esperadas se derivan del modelo de Cox ajustado.

Específicamente, el procedimiento consiste en estratificar la muestra según las categorías del predictor de interés y estimar, para cada grupo, las curvas de Kaplan-Meier. Posteriormente, se ajusta un modelo de Cox con dicho predictor y se generan las curvas esperadas al sustituir los valores de cada categoría en la función de supervivencia estimada. Una vez obtenidas, ambas curvas se representan en un mismo gráfico para facilitar su comparación.

En el caso de variables continuas, esta evaluación puede realizarse mediante dos estrategias: la primera consiste en categorizar la variable (por ejemplo, en niveles bajo, medio y alto) e incluir variables indicadoras (dummy) en el modelo de Cox, lo que permite obtener curvas esperadas ajustadas para cada grupo, mientras la segunda estrategia utiliza directamente la variable continua en el modelo y construye las curvas esperadas evaluando la función de supervivencia en valores representativos del predictor (por ejemplo, medias o percentiles), manteniendo así su naturaleza continua.

La comparación entre estas curvas observadas y esperadas permite evaluar el supuesto de riesgos proporcionales: curvas similares o con alta concordancia sugieren su cumplimiento, mientras que diferencias o discrepancias importantes indican una posible violación. La principal limitación de esta estrategia, es la subjetividad en la interpretación gráfica, ya que no existe un criterio formal para establecer que tan cercanas deberían ser las curvas. En la práctica, se recomienda considerar una violación del supuesto únicamente cuando las diferencias sean claramente marcadas.

Al comparar las curvas observadas y esperadas (gráfica 6), se aprecia una buena concordancia en el grupo de bajo riesgo, mientras que en los grupos medio y alto se observan ligeras discrepancias. No obstante, no se identifican cruces relevantes ni patrones sistemáticos de divergencia entre las curvas, lo que sugiere ausencia de evidencia clara de violación del supuesto de riesgos proporcionales. Dado que esta evaluación corresponde a una inspección visual, es necesario complementarla con pruebas estadísticas formales basadas en residuos de Schoenfeld. En particular, el test de proporcionalidad de riesgos en su formulación moderna (Grambsch y Therneau), derivado del enfoque propuesto por Schoenfeld (1982) y extendido por Harrell y Lee (1986), permite evaluar de manera más objetiva el cumplimiento de este supuesto.

Prueba de Grambsch y Therneau

Para evaluar el supuesto de riesgos proporcionales (PH), esta prueba se basa en los residuos de Schoenfeld, definidos para cada covariable en cada individuo que presenta el evento. En un modelo de Cox con múltiples predictores, cada individuo con evento contribuye con un residuo por cada covariable. Estos residuos representan la diferencia entre el valor observado de la covariable en el individuo que experimenta el evento y el valor esperado, calculado como un promedio ponderado de los sujetos en riesgo en ese mismo instante, donde los pesos están determinados por los riesgos relativos del modelo.

Bajo el supuesto de riesgos proporcionales, los residuos de Schoenfeld no deberían presentar una tendencia sistemática en función del tiempo. La prueba de Grambsch y Therneau formaliza esta idea evaluando la asociación entre los residuos y una función del tiempo (usualmente una transformación del tiempo de evento), mediante un enfoque basado en regresión.

La implementación del test puede resumirse en los siguientes pasos:

Ajustar el modelo de Cox y obtener los residuos de Schoenfeld.
Considerar una función del tiempo (por ejemplo, el tiempo o su transformación logarítmica).
Evaluar la asociación entre los residuos y dicha función temporal mediante un test de correlación o regresión.

La hipótesis nula establece que no existe asociación entre los residuos de Schoenfeld y el tiempo; por lo tanto, al rechazar esta hipótesis, se obtiene evidencia de una posible violación del supuesto de riesgos proporcionales.

Es importante tener en cuenta que el valor p está influenciado por el tamaño de muestra: en muestras pequeñas, violaciones sustanciales pueden no ser detectadas, mientras que en muestras grandes, desviaciones leves pueden resultar estadísticamente significativas. Por ello, aunque esta prueba proporciona un criterio objetivo, se recomienda complementarla con métodos gráficos, los cuales permiten caracterizar la naturaleza y magnitud de posibles desviaciones del supuesto de riesgos proporcionales.

Ejemplo de la prueba de Grambsch y Therneau

En este ejemplo queremos evaluar el supuesto de riesgos proporcionales para las covariables logWBC y grupo en el modelo de Cox ajustado previamente. Para cada covariable se espera que los residuales de Schoenfeld no tengan correlación con el tiempo, es decir, se espera que sea constante a lo largo del tiempo. La prueba global por su parte, evalúa si en conjunto, el modelo cumple con el supuesto de PH.

La hipótesis de interés en general para las covariables es la siguiente:

\(H_0\): No existe correlación entre los residuos de Schoenfeld de la covariable de interés y el tiempo.
\(H_1\): Existe correlación entre los residuos de Schoenfeld de la covariable de interés y el tiempo.

La hipótesis para la prueba global es la siguiente:

\(H_0\): No existe correlación entre los residuos de Schoenfeld de todas las covariables y el tiempo.
\(H_1\): Existe correlación entre los residuos de Schoenfeld de al menos una covariable y el tiempo.

Para cumplir con el supuesto de riesgos proporcionales, se espera no rechazar la hipótesis nula para cada covariable y para la prueba global.

Resultados de la prueba
Variable	Chis2	gl	p
log(WBC)	0.04000	1	0.84
Grupo	0.00008	1	0.99
GLOBAL	0.04020	2	0.98

En esta salida podemos ver como los valores p para las covariables logWBC (p = 0.84) y grupo (p = 0.99) son claramente no significativos, por lo tanto, no tenemos evidencia estadística para rechazar la hipótesis nula, es decir que los residuos de Schoenfeld no dependen del tiempo, lo cual sugiere que ambas variables cumplen el supuesto de riesgos proporcionales.

En el resultado de la prueba global (p = 0.98), tampoco se encontraron diferencias estadísticamente significativas, por lo que, en conjunto, el modelo no presenta evidencia de violación del supuesto PH. Estos hallazgos son coherentes con una adecuada especificación del modelo en términos de proporcionalidad de riesgos.

De manera complementaria podemos revisar los gráficos de residuos de Schoenfeld para cada covariable, los cuales muestran la evolución de estos residuos a lo largo del tiempo.

Para la variable logWBC (gráfica 7), se observa que los residuos se distribuyen de manera casi aleatoria alrededor de la curva suavizada, la cual presenta una leve curvatura sin evidenciar una tendencia sistemática clara creciente o decreciente a lo largo del tiempo. Asimismo, las bandas de confianza muestran una trayectoria relativamente estable. En conjunto, estos hallazgos sugieren la ausencia de cambios sustanciales en el efecto de la covariable a lo largo del tiempo, lo que apoya el cumplimiento del supuesto de riesgos proporcionales para esta variable.

En relación con la variable grupo, la gráfica 8 muestra que, aunque existe variabilidad en los residuos y que algunos puntos se ubican fuera de las bandas de confianza, este comportamiento es esperado y no indica una violación del supuesto PH. En conjunto, la curva suavizada se mantiene aproximadamente constante a lo largo del tiempo, sin evidenciar una tendencia clara, sugiriendo que el supuesto de riesgos proporcionales se cumple de manera razonable.

En conjunto, los efectos de logWBC y grupo se mantienen aproximadamente constantes en el tiempo. Este resultado es consistente con los hallazgos obtenidos con las pruebas de hipótesis (p > 0.8), lo que sugiere, tanto desde la perspectiva gráfica como desde la inferencial, que no hay evidenia de violación del supuesto de riesgos proporcionales en el modelo.

Covariables dependientes del tiempo

El supuesto de riesgos proporcionales (PH) también puede evaluarse mediante el uso de covariables dependientes del tiempo en una extensión del modelo de Cox. Este enfoque consiste en incorporar términos de interacción entre una covariable fija y una función del tiempo, usualmente expresados como \(X \cdot g(t)\).

La función \(g(t)\) puede tomar diferentes formas, como el tiempo \(t\), el logaritmo del tiempo \(\log(t)\), o la función de Heaviside (también conocida como función escalón), la cual permite modelar cambios en el efecto de la covariable a partir de un punto específico en el tiempo.

\[h(t) = h_0(t) \exp(\beta X + \gamma X \cdot g(t))\]

donde \(\beta\) representa el efecto principal de la covariable y \(\gamma\) captura la dependencia temporal.

Específicamente, en nuestro ejemplo podemos tener el siguiente modelo extendido de Cox con covariables dependientes del tiempo:

\[h(t) = h_0(t) \exp(\beta_1(RX) + \beta_2(\log{WBC}) + \beta_3(Sexo) + \delta_1(RX \cdot g(t)) + \delta_2(\log{WBC} \cdot g(t)) + \delta_3(Sexo \cdot g(t))\]

Aquí la hipótesis nula establece que:

\[H_0: \delta_1 = \delta_2 = \delta_3= 0\]

Es decir, bajo la hipótesis nula no existe interacción con el tiempo y, por tanto, se cumple el supuesto de riesgos proporcionales. En contraste, si alguno de los coeficientes de interacción resulta estadísticamente diferente de cero, se concluye que el efecto de la covariable correspondiente varía a lo largo del tiempo, evidenciando una posible violación del supuesto.

Este procedimiento puede aplicarse tanto de forma individual como conjunta para múltiples covariables. En el análisis global, se contrasta la hipótesis nula de que todos los coeficientes de interacción son iguales a cero mediante una prueba de razón de verosimilitud con distribución chi-cuadrado. Un resultado significativo indica que al menos una covariable no cumple el supuesto de proporcionalidad.

Una ventaja de este enfoque es que permite evaluar el supuesto de riesgos proporcionales ajustando simultáneamente por otras covariables que sí lo satisfacen. No obstante, una limitación importante radica en la elección de la función \(g(t)\), ya que distintas especificaciones pueden conducir a interpretaciones diferentes sobre la dependencia temporal.

En consecuencia, aunque se trata de un enfoque flexible y potente, se recomienda complementarlo con métodos gráficos y pruebas de bondad de ajuste para lograr una evaluación más robusta del supuesto de riesgos proporcionales.

Ejemplo de covariables dependientes del tiempo

Vamos a suponer que tenemos este modelo:

\[h(t)=(h_0)exp(\beta_1Rx + \beta_2 \log{WBC} + \beta_3Sexo + \delta_1Sexo*log(t))\]

Estamos asumiendo que el efecto del sexo varía a lo largo del tiempo. Para evaluar si esta covariable cumple con el supuesto de riesgos proporcionales, se debe contrastar la hipótesis nula de que \(\delta_1 = 0\).

Supongamos que obtenemos los siguientes resultados:

Modelo de Cox con efecto dependiente del tiempo
Variable	HR	IC 95%	p
Rx	0.85	0.65–1.10	0.18
log(WBC)	1.20	1.05–1.37	0.01
Sexo	1.50	1.10–2.05	0.02
Sexo × log(t)	0.95	0.91–0.99	0.04

En este modelo de Cox con covariable dependiente del tiempo, se observa que el logaritmo del conteo de leucocitos se asocia significativamente con un mayor riesgo del evento, mientras que el tratamiento no presenta una asociación estadísticamente significativa.

En cuanto al sexo, se identifica un efecto inicial significativo sobre el riesgo; sin embargo, este efecto varía a lo largo del tiempo, disminuyendo progresivamente. El término de interacción entre sexo y el logaritmo del tiempo evidencia una violación del supuesto de riesgos proporcionales para esta variable, lo que sugiere que su impacto es mayor en etapas tempranas del seguimiento y se atenúa posteriormente.

Este enfoque no solo permite evaluar el supuesto de riesgos proporcionales, sino que también constituye una de las principales estrategias para modelar su violación. En consecuencia, una vez identificada la posible no proporcionalidad, es necesario considerar estrategias que permitan ajustar la especificación del modelo y representar adecuadamente la dinámica del riesgo en el tiempo, como se discute en la siguiente sección.

Estrategias cuando no se cumple el supuesto de riesgos proporcionales

La violación del supuesto de riesgos proporcionales (PH) no implica necesariamente que el modelo de Cox deba descartarse; más bien, indica la necesidad de ajustar la especificación del modelo para representar adecuadamente la posible variación del efecto de las covariables a lo largo del tiempo.

En este contexto, las estrategias disponibles pueden clasificarse en dos grandes categorías: modelos con efectos dependientes del tiempo y estratificación.

Modelos alternativos:

Covariables dependientes del tiempo

Una de las principales estrategias para abordar la violación del supuesto de riesgos proporcionales consiste en extender el modelo de Cox mediante la incorporación de covariables dependientes del tiempo.

Este enfoque permite modelar explícitamente la variación del efecto de una covariable a lo largo del seguimiento, relajando la restricción de proporcionalidad y proporcionando una representación más flexible del riesgo.

El modelo puede expresarse como:

\[ h(t) = h_0(t)\exp\big(\beta_1 X + \beta_2 X \cdot g(t)\big) \]

donde \(g(t)\) es una función del tiempo. Si el término de interacción resulta significativo, se concluye que el efecto de la covariable varía en el tiempo.

Desde el punto de vista interpretativo, este enfoque permite entender el hazard ratio como una función del tiempo, es decir, \(HR(t)\), en lugar de un efecto constante.

Covariables dependientes del tiempo en forma discreta

Una forma sencilla y didáctica de implementar covariables dependientes del tiempo consiste en dividir el tiempo de seguimiento en intervalos y permitir que el efecto de la covariable varíe entre dichos intervalos.

Por ejemplo, si se define un punto de corte \(\tau\), se pueden considerar dos periodos:

Antes de \(\tau\)
Después de \(\tau\)

El modelo de Cox puede escribirse como:

\[ h(t) = h_0(t)\exp\big(\beta_1 X I(t \leq \tau) + \beta_2 X I(t > \tau)\big) \]

donde:

\(\beta_1\) representa el efecto de la covariable antes de \(\tau\)
\(\beta_2\) representa el efecto después de \(\tau\)

Este enfoque puede interpretarse como una aproximación discreta a un coeficiente que varía en el tiempo, es decir, a \(\beta(t)\).

Desde el punto de vista práctico, este modelo evalúa si el efecto de la covariable cambia a lo largo del seguimiento o sí la relación es diferente al inicio que al final. Específicamente, si \(\beta_1 \approx \beta_2\), el supuesto de riesgos proporcionales es razonable. Si difieren, existe evidencia de no proporcionalidad.

Estratificación

La estratificación constituye una estrategia particularmente útil cuando una covariable viola el supuesto de riesgos proporcionales, pero no es de interés principal en el análisis. En este enfoque, se permite que dicha variable tenga funciones de riesgo basal diferentes en cada uno de sus niveles, evitando imponer la restricción de proporcionalidad.

El modelo de Cox estratificado se expresa como:

\[ h(t|X, Z) = h_{0k}(t)\exp(\beta X) \]

donde:

\(Z\) es la variable de estratificación
\(h_{0k}(t)\) es el riesgo basal específico para cada estrato

La estratificación permite ajustar por una variable que presenta dependencia temporal sin modelar explícitamente su efecto en el tiempo. Sin embargo, no se obtiene una estimación del hazard ratio para la variable estratificada y puede reducir la eficiencia estadística cuando el número de eventos dentro de cada estrato es reducido. Por ello, se recomienda utilizar esta estrategia cuando la variable viola claramente el supuesto de riesgos proporcionales, no es de interés principal, tiene pocas categorías y existe un número suficiente de eventos en cada estrato.

Consideraciones finales

Estas estrategias no son mutuamente excluyentes y, en la práctica, pueden combinarse para lograr una mejor especificación del modelo.

La elección de la estrategia depende del objetivo del análisis y del papel de la covariable en el modelo. Si la covariable es de interés principal, se recomienda modelar su efecto dependiente del tiempo; en cambio, si se trata de una variable de control, la estratificación puede ser una opción más sencilla y robusta.

En todos los casos, es fundamental complementar estas estrategias con herramientas gráficas y pruebas estadísticas, de modo que la evaluación del supuesto de riesgos proporcionales se base en un enfoque integral.

Ejemplo aplicado: evaluación del supuesto de riesgos proporcionales

En este ejemplo veremos los pasos a seguir para evaluar el supuesto de riesgos proporcionales en el modelo de Cox utilizando herramientas gráficas y pruebas estadísticas.

Vamos a utilizar la siguiente base de datos “basecancer.xlsx”, la cual contiene información de pacientes con cáncer, incluyendo el tiempo hasta el evento (tiempo), el indicador de evento (evento), edad, sexo y presencia de comorbilidades.

1. Cargar la base de datos

library(readxl)
basecancer <- read_excel("basecancer.xlsx")
basecancer$sexo <- factor(basecancer$sexo)
basecancer$comorb <- factor(basecancer$comorb)

2. Ajuste del modelo de Cox

library(survival)

modelo <- coxph(Surv(tiempo, evento) ~ edad + sexo + comorb,
                data = basecancer)

summary(modelo)

## Call:
## coxph(formula = Surv(tiempo, evento) ~ edad + sexo + comorb, 
##     data = basecancer)
## 
##   n= 300, number of events= 287 
## 
##                coef exp(coef)  se(coef)      z Pr(>|z|)    
## edad       0.033916  1.034498  0.006749  5.025 5.03e-07 ***
## sexoMujer -0.420488  0.656726  0.121627 -3.457 0.000546 ***
## comorbSi   0.917206  2.502288  0.130795  7.013 2.34e-12 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##           exp(coef) exp(-coef) lower .95 upper .95
## edad         1.0345     0.9667    1.0209    1.0483
## sexoMujer    0.6567     1.5227    0.5174    0.8335
## comorbSi     2.5023     0.3996    1.9364    3.2335
## 
## Concordance= 0.654  (se = 0.017 )
## Likelihood ratio test= 74.04  on 3 df,   p=6e-16
## Wald test            = 75.92  on 3 df,   p=2e-16
## Score (logrank) test = 79.02  on 3 df,   p=<2e-16

Los resultados de este modelo de Cox mostraron que tanto la edad, el sexo y la presencia de comorbilidades se asocian significativamente con el riesgo del evento. En particular, por cada incremento de un año en la edad, el riesgo de presentar el evento aumenta aproximadamente en un 3.5% (HR = 1.0345; IC95%: 1.0209–1.0483), lo que evidencia un efecto acumulativo clínicamente relevante. En cuanto al sexo, las mujeres presentaron un menor riesgo en comparación con los hombres (HR = 0.6567; IC95%: 0.5174–0.8335), indicando un efecto protector. Por su parte, la presencia de comorbilidades fue el factor con mayor impacto, asociándose con un incremento de 2.5 veces en el riesgo del evento (HR = 2.50; IC95%: 1.94–3.23).

En relación con el desempeño del modelo, se observó una adecuada capacidad explicativa, respaldada por resultados altamente significativos en las pruebas globales (p < 0.001). Sin embargo, para poder garantizar la validez de las inferencias realizadas, es fundamental evaluar antes el supuesto de riesgos proporcionales.

3. Evaluación gráfica: Curvas de Kaplan-Meier, log(-log) y residuos de Schoenfeld

Curvas de Kaplan-Meier

Recordemos que las curvas de Kaplan-Meier permiten comparar la supervivencia entre grupos, lo que puede proporcionar una primera aproximación visual sobre el cumplimiento del supuesto de riesgos proporcionales. En este caso, se compararán las curvas de supervivencia primero por sexo y posteriormente por presencia de comorbilidades, que corresponden a las variables categóricas.

Curvas de Kaplan-Meier por sexo

library(survminer)

ggsurvplot(
  survfit(Surv(tiempo, evento) ~ sexo, data = basecancer),
  risk.table = TRUE,
  xlab = "Tiempo",
  ylab = expression(hat(S)(t)),
  main = "Curvas de Kaplan-Meier por sexo",
)

Las curvas de Kaplan-Meier por sexo mostraron una mayor probabilidad de supervivencia en mujeres en comparación con hombres durante la mayor parte del seguimiento, con una separación consistente entre las curvas. Aunque estas tienden a aproximarse en los tiempos más avanzados, probablemente debido a la reducción en el número de individuos en riesgo, no se observan cruces relevantes entre los grupos. Este patrón es consistente con el efecto protector del sexo femenino observado en el modelo multivariado.

Curvas de Kaplan-Meier por comorbilidad

ggsurvplot(
  survfit(Surv(tiempo, evento) ~ comorb, data = basecancer),
  risk.table = TRUE,
  xlab = "Tiempo",
  ylab = expression(hat(S)(t)),
  main = "Curvas de Kaplan-Meier por comorbilidad"
)

Las curvas de Kaplan-Meier por comorbilidad evidenciaron una clara separación entre los grupos, con una supervivencia significativamente menor en pacientes con comorbilidades. Aunque se observa una tendencia a la aproximación de las curvas en tiempos avanzados, no se identifican cruces relevantes ni patrones de convergencia que sugieran una violación del supuesto de riesgos proporcionales. Este comportamiento es coherente con el fuerte efecto de las comorbilidades sobre el riesgo observado en el modelo de Cox.

Para el caso de la variable edad, al ser continua, no es posible realizar una gráfica de Kaplan-Meier. Sin embargo, se pueden categorizar los valores de edad en grupos (por ejemplo, <60 años, 60-70 años, >70 años) para obtener curvas de Kaplan-Meier por categorías de edad. No obstante, esta categorización puede resultar en pérdida de información y potencia estadística, por lo que se recomienda complementar esta evaluación con otras herramientas gráficas y pruebas estadísticas.

Curvas de Kaplan-Meier para los grupos de edad

basecancer$edad_cat <- cut(basecancer$edad, breaks = c(-Inf, 60, 70, Inf), 
                           labels = c("<60", "60-70", ">70"), right = FALSE)
ggsurvplot(
  survfit(Surv(tiempo, evento) ~ edad_cat, data = basecancer),
  risk.table = TRUE,
  xlab = "Tiempo",
  ylab = expression(hat(S)(t)),
  main = "Curvas de Kaplan-Meier por grupos de edad"
)

Se observa un cruce leve al inicio entre los grupos 60–70 años y >70 años, lo que sugiere que el efecto de la edad podría variar ligeramente en los primeros tiempos. Sin embargo, después de ese punto, las curvas se separan y mantienen un orden estable sin nuevos cruces (<60 años mejor, >70 años peor).

En conjunto, esto indica que el supuesto de riesgos proporcionales está globalmente aceptable, aunque con una posible desviación temprana que debe confirmarse la evaluación de los residuos de Schoenfeld.

Curvas log -log

A manera de ejemplo vamos a evaluar el supuesto de PH para la variable sexo utilizando las curvas -ln(-ln) y ln(-ln).

\(Curvas -ln(-ln(\hat{S}))\)

Se caracterizan por presentar un patrón decreciente a lo largo del tiempo, con una separación relativamente constante entre los grupos, similar a la obtenida con la función de Kaplan Meier.

library(survminer)
ggsurvplot(survfit(Surv(tiempo, evento) ~ sexo, data = basecancer), 
           fun = function(s) -log(-log(s)),
           xlab = "Tiempo",
           ylab = expression(ln(-ln(hat(S)(t)))),
           main = "Evaluación gráfica del supuesto PH por sexo",
           legend.title = "Sexo",
           legend.labs = levels(basecancer$sexo))

En este gráfico podemos observar que las curvas similares pero no iguales de la curva de Kaplan Meier. Aunque se observan ligeras intersecciones puntuales entre las curvas, estas no son persistentes ni indican un cambio sistemático en la relación entre los grupos. En términos generales, vemos que el efecto del sexo sobre el riesgo se mantiene aproximadamente constante en el tiempo, por lo cual no rechazariamos el supuesto de riesgos proporcionales.

\(\text{Curvas } ln(-ln(\hat{S}))\)

A diferencia de la gráfica anterior, en esta representación el patrón es creciente y el tiempo se presenta en escala logarítmica.

library(survminer)
ggsurvplot(survfit(Surv(tiempo, evento) ~ sexo, data = basecancer),
           fun = "cloglog",
           xlab = "Tiempo",
           ylab = expression(ln(-ln(hat(S)(t)))),
           main = "Evaluación gráfica del supuesto PH por sexo",
           legend.title = "Sexo",
           legend.labs = levels(basecancer$sexo))

Al evaluar esta gráfica, las curvas muestran un patrón global aproximadamente paralelo, aunque con leves aproximaciones y cruces en ciertos intervalos. Estos cruces son de baja magnitud y no reflejan una inversión sostenida del efecto entre los grupos. El paralelismo general de las curvas, especialmente en la mayor parte del rango temporal, respalda la hipótesis de que la razón de riesgos se mantiene constante.

Residuos de Schoenfeld

El comando “plot” muestra todos los graficos de los residuos para cada covariable incluida en el modelo. Para hacer un mejor análisis, se recomienda revisar cada gráfico de residuos de Schoenfeld de forma individual, lo que permite identificar posibles patrones específicos para cada covariable.

Residuos de Schoenfeld para edad

library(survival)
test_ph <- cox.zph(modelo)
plot(test_ph[1])

El gráfico de residuos de Schoenfeld para la variable edad evidencia una dispersión aleatoria de los puntos alrededor de cero, sin patrones sistemáticos ni tendencias en el tiempo. La línea suavizada se mantiene aproximadamente horizontal, lo que indica que el efecto de la edad sobre el riesgo es constante a lo largo del seguimiento, apoyando el cumplimiento del supuesto de riesgos proporcionales.

Residuos de Schoenfeld para sexo

plot(test_ph[2])

El gráfico de residuos de Schoenfeld para la variable sexo muestra una dispersión de los puntos sin patrones sistemáticos claros a lo largo del tiempo. La curva suavizada presenta una ligera curvatura, pero se mantiene relativamente estable y dentro de los intervalos de confianza, sin evidenciar una tendencia marcada. En conjunto, esto sugiere que el efecto del sexo sobre el riesgo permanece aproximadamente constante en el tiempo, siendo consistente con el cumplimiento del supuesto de riesgos proporcionales.

Residuos de Schoenfeld para comorbilidad

plot(test_ph[3])

En el caso de la variable comorbilidad, los residuos de Schoenfeld presentan una distribución relativamente homogénea alrededor de la tendencia central. La línea suavizada no muestra desviaciones importantes ni cambios sistemáticos en el tiempo, manteniéndose dentro de los intervalos de confianza. Este comportamiento indica que el efecto de la comorbilidad sobre el riesgo es estable durante el seguimiento, apoyando el supuesto de riesgos proporcionales.

Integrando estos resultados con los análisis previos, tanto la evidencia gráfica (Kaplan-Meier, log(-log), y residuos de Schoenfeld para todas las covariables) como la evidencia estadística (test de Schoenfeld no significativo) son consistentes en indicar que el supuesto de riesgos proporcionales se cumple adecuadamente en el modelo de Cox. No se observan patrones sistemáticos de variación temporal en los efectos de edad, sexo o comorbilidad, lo que respalda la validez de las estimaciones del modelo y la interpretación de los hazard ratios como efectos constantes en el tiempo.

4. Evaluación formal: Prueba de Grambsch y Therneau

print(test_ph)

##         chisq df    p
## edad   0.0176  1 0.89
## sexo   0.2803  1 0.60
## comorb 0.0832  1 0.77
## GLOBAL 0.3471  3 0.95

El test de Harrel y Lee basado en residuos de Schoenfeld, no evidenció violaciones del supuesto de riesgos proporcionales para ninguna de las covariables incluidas en el modelo de Cox (edad: p = 0.89; sexo: p = 0.60; comorbilidad: p = 0.77), ni a nivel global (p = 0.95). En consecuencia, no se rechaza la hipótesis nula de proporcionalidad de riesgos.

En concordancia con la evaluación gráfica, estos resultados respaldan que el modelo se encuentra adecuadamente especificado respecto a este supuesto, lo que permite interpretar los hazard ratios como efectos constantes en el tiempo.

De manera integrada, la evidencia consistente de las curvas aproximadamente paralelas, la ausencia de tendencias sistemáticas en los residuos de Schoenfeld y los valores de p no significativos en el test formal (p > 0.05) sustentan que el supuesto de riesgos proporcionales se cumple razonablemente en el modelo analizado.

5. ¿Qué hacer si el supuesto de riesgos proporcionales no se cumple?

Cuando la evaluación gráfica o las pruebas basadas en residuos de Schoenfeld indican una posible violación del supuesto de riesgos proporcionales, es necesario modificar la especificación del modelo para representar adecuadamente la variación del efecto en el tiempo.

A continuación, se presentan algunas estrategias principales:

5.1 Covariables dependientes del tiempo

Una estrategia consiste en permitir que el efecto de una covariable varíe en el tiempo mediante una interacción con una función temporal. Si el término tt(comorb) es significativo, el efecto de la comorbilidad cambia en el tiempo por lo que el hazard ratio ya no es constante, sino depende de t

basecancer$comorb_num <- ifelse(basecancer$comorb == "Si", 1, 0)

modelo_tv <- coxph(Surv(tiempo, evento) ~ edad + sexo + comorb_num +
                   tt(comorb_num),
                   data = basecancer,
                   tt = function(x, t, ...) x * log(t))
summary(modelo_tv)

## Call:
## coxph(formula = Surv(tiempo, evento) ~ edad + sexo + comorb_num + 
##     tt(comorb_num), data = basecancer, tt = function(x, t, ...) x * 
##     log(t))
## 
##   n= 300, number of events= 287 
## 
##                     coef exp(coef)  se(coef)      z Pr(>|z|)    
## edad            0.033945  1.034527  0.006781  5.006 5.56e-07 ***
## sexoMujer      -0.420872  0.656474  0.121952 -3.451 0.000558 ***
## comorb_num      0.911442  2.487907  0.185899  4.903 9.44e-07 ***
## tt(comorb_num)  0.004620  1.004630  0.105911  0.044 0.965209    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##                exp(coef) exp(-coef) lower .95 upper .95
## edad              1.0345     0.9666    1.0209    1.0484
## sexoMujer         0.6565     1.5233    0.5169    0.8337
## comorb_num        2.4879     0.4019    1.7282    3.5816
## tt(comorb_num)    1.0046     0.9954    0.8163    1.2364
## 
## Concordance= 0.654  (se = 0.018 )
## Likelihood ratio test= 74.05  on 4 df,   p=3e-15
## Wald test            = 75.96  on 4 df,   p=1e-15
## Score (logrank) test = 79.11  on 4 df,   p=3e-16

Podemos ver que el término tt(comorb) no resultó estadísticamente significativo (p=0.965209), por lo cual el HR no depende del tiempo.

5.2 Modelo por intervalos (aproximación discreta)

Otra estrategia consiste en dividir el tiempo en intervalos y permitir que el efecto cambie entre ellos.

# Crear ID
basecancer$id <- 1:nrow(basecancer)

# Punto de corte
tau <- 6

# Dividir tiempo
base_split <- survSplit(Surv(tiempo, evento) ~ ., 
                        data = basecancer,
                        cut = tau,
                        episode = "intervalo")

# Variables dependientes del tiempo
base_split$comorb_1 <- ifelse(base_split$intervalo == 1,
                             as.numeric(base_split$comorb == "Si"), 0)

base_split$comorb_2 <- ifelse(base_split$intervalo == 2,
                             as.numeric(base_split$comorb == "Si"), 0)

# Modelo
modelo_piece <- coxph(Surv(tstart, tiempo, evento) ~ edad + sexo +
                     comorb_1 + comorb_2,
                     data = base_split)

summary(modelo_piece)

## Call:
## coxph(formula = Surv(tstart, tiempo, evento) ~ edad + sexo + 
##     comorb_1 + comorb_2, data = base_split)
## 
##   n= 444, number of events= 287 
## 
##                coef exp(coef)  se(coef)      z Pr(>|z|)    
## edad       0.034022  1.034607  0.006772  5.024 5.07e-07 ***
## sexoMujer -0.421940  0.655774  0.121871 -3.462 0.000536 ***
## comorb_1   0.897548  2.453580  0.163817  5.479 4.28e-08 ***
## comorb_2   0.951463  2.589496  0.215414  4.417 1.00e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##           exp(coef) exp(-coef) lower .95 upper .95
## edad         1.0346     0.9666    1.0210    1.0484
## sexoMujer    0.6558     1.5249    0.5164    0.8327
## comorb_1     2.4536     0.4076    1.7798    3.3825
## comorb_2     2.5895     0.3862    1.6977    3.9498
## 
## Concordance= 0.654  (se = 0.018 )
## Likelihood ratio test= 74.08  on 4 df,   p=3e-15
## Wald test            = 76.12  on 4 df,   p=1e-15
## Score (logrank) test = 79.25  on 4 df,   p=3e-16

No se encontró evidencia para asumir que se esta violando el supuesto de riesgos proporcionales para la comorbilidad, ya que los efectos estimados por intervalos fueron similares en magnitud.

5.3 Estratificación

Si la variable que viola el supuesto no es de interés principal, puede utilizarse la estratificación:. En este caso, la idea es permitir que el riesgo basal sea diferente por sexo, sin embargo se sigue asumiendo que el efecto de edad y comorb es el mismo en hombres y mujeres. La idea es estimar el riesgo para edad y comorbilidad, ajustando por sexo.

modelo_strat <- coxph(Surv(tiempo, evento) ~ edad + comorb +
                      strata(sexo),
                      data = basecancer)

summary(modelo_strat)

## Call:
## coxph(formula = Surv(tiempo, evento) ~ edad + comorb + strata(sexo), 
##     data = basecancer)
## 
##   n= 300, number of events= 287 
## 
##             coef exp(coef) se(coef)     z Pr(>|z|)    
## edad     0.03465   1.03526  0.00680 5.096 3.47e-07 ***
## comorbSi 0.89939   2.45810  0.13056 6.889 5.63e-12 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##          exp(coef) exp(-coef) lower .95 upper .95
## edad         1.035     0.9659     1.022     1.049
## comorbSi     2.458     0.4068     1.903     3.175
## 
## Concordance= 0.645  (se = 0.016 )
## Likelihood ratio test= 67.09  on 2 df,   p=3e-15
## Wald test            = 68.95  on 2 df,   p=1e-15
## Score (logrank) test = 72.12  on 2 df,   p=<2e-16

Con estos resultados, la estratificación por sexo no modificó de manera relevante los estimadores del modelo (resultaron practicamente iguales), lo que sugiere que el efecto de edad y comorbilidad es robusto frente a posibles diferencias en el riesgo basal entre hombres y mujeres.

En términos globales, no se encontró evidencia consistente de violación del supuesto de riesgos proporcionales. En particular, el efecto de la comorbilidad sobre el riesgo del evento se mantiene relativamente estable a lo largo del tiempo, lo que respalda el uso del modelo de Cox sin necesidad de incorporar términos dependientes del tiempo ni aplicar estratificación.

6. Conclusión

Cuando el supuesto de riesgos proporcionales no se cumple, no es necesario descartar el modelo de Cox. En su lugar, se pueden utilizar covariables dependientes del tiempo o modelos por intervalos si la variable es de interés, o estratificación si se trata de una variable de control.

Lecturas complementarias

Kleinbaum DG, Klein M. Survival analysis: A self-learning text. 3rd ed. New York: Springer; 2012.
Hosmer DW, Lemeshow S, May S. Applied survival analysis: Regression modeling of time-to-event data. 2nd ed. Hoboken (NJ): Wiley; 2008.
Therneau TM. A package for survival analysis in R [Internet]. Version 3.8-6. Vienna: R Foundation for Statistical Computing; 2026 [cited 2026 Apr 14]. Available from: https://CRAN.R-project.org/package=survival
Schoenfeld D. Partial residuals for the proportional hazards regression model. Biometrika. 1982;69(1):239–41.
Klein JP, Moeschberger ML. Survival analysis: Techniques for censored and truncated data. 2nd ed. New York: Springer; 2003.

Semana 3. Evaluación del supuesto de proporcionalidad

Material de contenido y aplicación

Martín Alonso Rondón Sepúlveda

Introducción

Fundamentos teóricos del supuesto de proporcionalidad

Métodos gráficos para evaluar el supuesto de proporcionalidad

Curvas log-log de supervivencia

Gráfico de curvas observadas versus esperadas

Prueba de Grambsch y Therneau

Covariables dependientes del tiempo

Estrategias cuando no se cumple el supuesto de riesgos proporcionales

Modelos alternativos:

Covariables dependientes del tiempo

Covariables dependientes del tiempo en forma discreta

Estratificación

Consideraciones finales

Ejemplo aplicado: evaluación del supuesto de riesgos proporcionales

1. Cargar la base de datos

2. Ajuste del modelo de Cox

3. Evaluación gráfica: Curvas de Kaplan-Meier, log(-log) y residuos de Schoenfeld

Curvas de Kaplan-Meier

Curvas de Kaplan-Meier por sexo

Curvas de Kaplan-Meier por comorbilidad

Curvas de Kaplan-Meier para los grupos de edad

Curvas log -log

\(Curvas -ln(-ln(\hat{S}))\)

\(\text{Curvas } ln(-ln(\hat{S}))\)

Residuos de Schoenfeld

Residuos de Schoenfeld para edad

Residuos de Schoenfeld para sexo

Residuos de Schoenfeld para comorbilidad

4. Evaluación formal: Prueba de Grambsch y Therneau

5. ¿Qué hacer si el supuesto de riesgos proporcionales no se cumple?

5.1 Covariables dependientes del tiempo

5.2 Modelo por intervalos (aproximación discreta)

5.3 Estratificación

6. Conclusión

Lecturas complementarias