Adicionar número de série para atividade de cópia ao blob

Question

joran

Asked: 2024-12-24 07:50:14 +0800 CST2024-12-24 07:50:14 +0800 CST 2024-12-24 07:50:14 +0800 CST

Significado de "." na fórmula do modelo vs como é documentado em ?formula

772

Nele ?formuladiz:

Há duas interpretações especiais de . em uma fórmula. A usual é no contexto de um argumento de dados de funções de ajuste de modelo e significa 'todas as colunas que não estão na fórmula': veja terms.formula. No contexto de update.formula, somente, significa 'o que estava anteriormente nesta parte da fórmula'.

Minha leitura da primeira parte desse pedaço de documentação me levou a supor que este código:

dat <- data.frame(
  y = rnorm(10),
  x1 = runif(10),
  x2 = rbinom(10,size = 1,prob = 0.5),
  x3 = rbinom(10,size = 1,prob = 0.5)
)

mt <- terms.formula(
  x = y ~ x1 + . + (.)^2,
  data = dat
)

mm <- model.matrix(mt,dat)

...produziria uma matriz modelo com um termo de interação somente para x2:x3, já que essas são as únicas duas colunas em dat"não de outra forma na fórmula". No entanto:

> colnames(mm)
[1] "(Intercept)" "x1"          "x2"          "x3"          "x1:x2"      
[6] "x1:x3"       "x2:x3"

...em vez disso, obtemos todas as interações.

Se eu escrever explicitamente, é claro, obtenho o que espero:

> mt1 <- terms.formula(
+   x = y ~ x1 + x2 + x3 + (x2 + x3)^2,
+   data = dat
+ )
> 
> mm1 <- model.matrix(mt1,dat)
> colnames(mm1)
[1] "(Intercept)" "x1"          "x2"          "x3"          "x2:x3"

Sei que fórmulas e matrizes de modelos às vezes são sutilmente confusas, mas estou tendo dificuldade em conciliar minha leitura da documentação com o comportamento.

Estou interpretando a documentação incorretamente, ou possivelmente escrevendo a fórmula incorretamente (para o que estou tentando fazer)? Ou a documentação não é totalmente precisa?

1 respostas

Voted

Ben Bolker · Answer 1 · 2024-12-24T08:20:33+08:00

Best Answer

Ben Bolker

2024-12-24T08:20:33+08:002024-12-24T08:20:33+08:00

Parece que "não de outra forma na fórmula" pode realmente significar "não no lado esquerdo da fórmula": por exemplo

terms.formula( y + x1 ~ x1 + .^2, data = dat)

(enquanto bobo) não inclui x1nas interações. Por outro lado, incluir offset(x1)não conta.

O código interno para termsé assustador, mas este comentário

/* Se houver um dotsxp sendo expandido, então precisamos ver se alguma das variáveis no data frame corresponde à variável no lhs . Se sim, elas não devem ser incluídas nos fatores */

(ênfase adicionada) reforça a conclusão.

Vale ressaltar que isso também funciona para excluir x1da interação:

terms.formula( y ~ x1 + (.-x1)^2 , data = dat)

4

Significado de "." na fórmula do modelo vs como é documentado em ?formula

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle?

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Quando devo usar um std::inplace_vector em vez de um std::vector?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

Significado de "." na fórmula do modelo vs como é documentado em ?formula

1 respostas

relate perguntas