Tenho um conjunto de dados com 125 animais em 3 locais e 100.500 observações. Ambos aparecem corretamente ao analisar a estrutura dos dados, mas quando executo o modelo com um quadro de dados atualizado (adicionei uma variável), eles não estão aparecendo corretamente. Alguém sabe como corrigir isso?
Formula:
type.x ~ std_rdden + std_forest2 + std_dev2 + (1 | site) +
(1 | Animal.ID) + Age.x + time.cat + Sex.x + road_category + season
Data: df7
AIC BIC logLik deviance df.resid
75769.3 75903.4 -37869.7 75739.3 56275
Random effects:
Conditional model:
Groups Name Variance Std.Dev.
site (Intercept) 2.936e-08 0.0001713
Animal.ID (Intercept) 2.000e-01 0.4472232
Number of obs: 56290, groups: site, 3; Animal.ID, 70
str()
saída mostrando que eles aparecem como fator e com os números corretos no quadro de dados:
'data.frame': 100501 obs. of 55 variables:
Animal.ID : Factor w/ 125 levels "D1060
É difícil saber com certeza, mas o problema mais provável é que
glmmTMB
(como a maioria das funções de modelagem R) realiza uma análise de caso completa : ou seja, descarta quaisquer observações com valores ausentes para a resposta ou qualquer uma das variáveis preditoras no modelo.Uma maneira de testar isso é usar
model.frame
a fórmula e ver quantas linhas restam, por exemploSe esse problema for de fato devido a
NA
valores ausentes (ou seja, valores ausentes), você terá que tomar algumas decisões sobre o que fazer: você pode (1) conviver com o tamanho reduzido do conjunto de dados, (2) excluir alguns preditores se eles tiveremNA
valores demais ou (3) se estiver disposto a se esforçar mais, pode usar omice
pacote para realizar imputações múltiplas para preencher os valores ausentes com base nas relações com os outros dados (não ausentes). O Capítulo 3 de Estratégias de Modelagem de Regressão de Harrell discute o tratamento de dados ausentes em detalhes.PS: geralmente não é aconselhável modelar variáveis de agrupamento com menos de 5 níveis (por exemplo
Site
) como efeitos aleatórios, mesmo que elas se enquadrem conceitualmente/filosoficamente nessa categoria...