Depois de ajustar um modelo linear generalizado usando {sparklyr} em um notebook do Azure Databricks, como mapear os valores dos coeficientes do modelo para nomes de preditores?
Aqui está um exemplo de ajuste de um modelo e extração dos coeficientes. Gostaria de determinar os nomes associados a cada coeficiente.
library(sparklyr)
sc <- spark_connect(method = "databricks")
data <- copy_to(sc, mtcars, "mtcars", overwrite = TRUE)
pipeline <- ml_pipeline(sc) %>%
ft_r_formula(vs ~ cyl + carb) %>%
ml_generalized_linear_regression(family = "binomial")
partitioned_data <- sdf_random_split(data, train = 0.80, test = 0.20, seed = 42)
fitted_pipeline <- ml_fit(pipeline, partitioned_data$train)
glrm_transformer <- ml_stage(fitted_pipeline, length(fitted_pipeline$stages))
with(glrm_transformer, c(intercept, coefficients))
Esta pergunta é bem parecida com esta , mas em R em vez de Python.