Adicionar número de série para atividade de cópia ao blob

Question

zhang

Asked: 2024-11-20 20:19:01 +0800 CST2024-11-20 20:19:01 +0800 CST 2024-11-20 20:19:01 +0800 CST

Como percorrer o nó interno hclust em R

772

Considere que temos esse quadro de dados para agrupamento.

# df
dput(df)
structure(c(1L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 1L, 0L, 
0L, 0L, 0L, 0L, 0L, 1L, 1L, 1L, 1L, 0L, 0L, 0L, 0L, 0L, 1L, 1L, 
1L, 1L, 1L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 1L, 0L, 0L, 0L, 0L, 
0L, 1L, 0L, 1L, 1L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 1L, 0L, 
0L, 0L, 0L, 0L, 0L, 0L, 0L, 1L, 1L, 1L, 1L, 0L, 0L, 0L, 0L, 0L, 
1L, 1L, 1L, 1L, 0L, 0L, 0L, 0L, 0L, 0L, 1L, 1L, 1L, 0L, 0L, 0L, 
0L, 0L, 0L, 0L, 1L, 1L), dim = c(9L, 11L), dimnames = list(c("1", 
"2", "3", "4", "5", "6", "7", "8", "9"), c("C", "D", "E", "F", 
"G", "H", "K", "L", "M", "N", "P")))

dist_matrix <- dist(df, method = "manhattan")
clust <- hclust(dist_matrix, method = "complete")
plot(clust)

Podemos obter os seguintes resultados de agrupamento, onde as letras itálicas são marcadores adicionais.

Permita-me usar pseudocódigo para ilustrar a função que desejo implementar.

obter o nó esquerdo e o nó direito de um nó específico.

FUNC GET_RIGHT_NODE(D)
RETUEN E,F,G
FUNC GET_LEFT_NODE(ROOT)
RETUEN A,B,C

obter elemento folha de nó específico

FUNC GET_LEAF(D)
RETURN 5,3,1,2,4

Tópico relacionado:

R: ajuda a analisar o conteúdo do cluster em clustering hierárquico

Como você imprime as linhas de um objeto hclust em R?

Algoritmo de agrupamento hierárquico de vizinhos mais próximos em R

1 respostas

Voted

jblood94 · Answer 1 · 2024-11-20T22:47:52+08:00

As informações que você precisa estão codificadas em clust$merge(veja ?hclust).

clust$merge
#>      [,1] [,2]
#> [1,]   -2   -4
#> [2,]   -8   -9
#> [3,]   -7    2
#> [4,]   -1    1
#> [5,]   -3    4
#> [6,]   -6    3
#> [7,]   -5    5
#> [8,]    6    7

Aqui, o nó 1 (a primeira linha de clust$merge) é formado pelas folhas 2e 4, o nó 3 (a terceira linha) é formado pela folha 7e o nó 2, etc.

Seus rótulos corresponderiam clust$mergeao seguinte:

cbind(as.data.frame(clust$merge),
      Label = c("G", "C", "B", "F", "E", "A", "D", "Root"))
#>   V1 V2 Label
#> 1 -2 -4     G
#> 2 -8 -9     C
#> 3 -7  2     B
#> 4 -1  1     F
#> 5 -3  4     E
#> 6 -6  3     A
#> 7 -5  5     D
#> 8  6  7  Root

Funções para fazer o que você pediu:

Primeiro, os nós à esquerda (direita) de um nó especificado:

get_node <- function(cl, n, left = TRUE) {
  m <- cl$merge
  
  if (left) {
    if (m[n, 1] > 0) n <- m[n, 1] else return(integer(0))
  } else {
    if (m[n, 2] > 0) n <- m[n, 2] else return(integer(0))
  }
  
  e <- environment()
  out <- integer(n)
  out[1] <- n
  i <- 1L
  
  f <- function(n) {
    if (m[n, 1] > 0) {
      e$i <- e$i + 1L
      e$out[e$i] <- m[n, 1]
      Recall(e$out[d$i])
    }
    
    if (m[n, 2] > 0) {
      e$i <- e$i + 1L
      e$out[e$i] <- m[n, 2]
      Recall(e$out[e$i])
    }
  }
  
  f(n)
  out[1:i]
}

As folhas sob um nó especificado:

get_leaf <- function(cl, n) {
  m <- cl$merge
  e <- environment()
  i <- 0L
  out <- integer(n + 1)
  
  f <- function(n) {
    if (m[n, 1] > 0) {
      Recall(m[n, 1])
    } else {
      e$i <- e$i + 1L
      e$out[e$i] <- -m[n, 1]
    }
    
    if (m[n, 2] > 0) {
      Recall(m[n, 2])
    } else {
      e$i <- e$i + 1L
      e$out[e$i] <- -m[n, 2]
    }
  }
  
  f(n)
  out[1:i]
}

Demonstrando:

get_node(clust, 7, FALSE) # get all nodes to the right of "D"
#> [1] 5 4 1
get_node(clust, 8)        # get all nodes to the left of "Root"
#> [1] 6 3 2
get_leaf(clust, 7)        # get all leaves under "D"
#> [1] 5 3 1 2 4
get_leaf(clust, 6)        # get all leaves under "A"
#> [1] 6 7 8 9

Como percorrer o nó interno hclust em R

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle?

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Quando devo usar um std::inplace_vector em vez de um std::vector?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

Como percorrer o nó interno hclust em R

1 respostas

relate perguntas