Estou traçando um modelo aditivo generalizado não linear (gam) usando mgcv
o pacote do R:
library(mgcv)
V <- rep(1, nrow(dt)
fit <- gam(cbind(V, group_number) ~ s(time_elapsed, exposure_group, bs='fs', k=1, m=1) + covs,
data = dt,
family=cox.ph,
weights=dt$outcome,
control=gam.control(trace=TRUE, maxit=500)
)
plot.gam(fit)
Tenho um conjunto de dados em nível de paciente dt
com uma coluna com múltiplas exposições codificadas como um fator ordenado (1, 2, 3 e 4), onde exposure_group
1 é a referência. Além disso, contém uma coluna dt
binária , uma coluna com os dias até o resultado e uma coluna que define os estratos. Além disso, existem algumas outras colunas com covariáveis resumidas comooutcome
time_elapsed
group_number
covs
Quando simplesmente ploto os dados usando , plot.gam()
fico pensando em como interpretar o eixo y. O eixo x representa claramente o time_elapsed
, mas em nenhum lugar da documentação está exatamente indicado o que estou observando. O eixo y representa riscos absolutos? Ou razões de risco relativas (provavelmente transformadas em logaritmo)? O rótulo padrão do eixo y simplesmente indica s(time_elapsed, exposure_group)
e alguns dígitos dentro deles()
PS: esta não é uma duplicata do Gráfico de Razão de Risco do modelo mgcv::gam cox.ph , pois tenho múltiplas exposições e, portanto, múltiplas linhas no meu gráfico GAM. A resposta dada ali, no entanto, talvez também se aplique aqui?