Adicionar número de série para atividade de cópia ao blob

Question

bill999

Asked: 2024-12-01 00:35:59 +0800 CST2024-12-01 00:35:59 +0800 CST 2024-12-01 00:35:59 +0800 CST

Verifique se o elemento de um dataframe está em outro dataframe, dentro do grupo

772

Digamos que eu tenha estes dados:

library(dplyr)
df1 <- data.frame(x = c(1, 2, 3, 4), z = c("A", "A", "B", "B"))
df2 <- data.frame(x = c(2, 4, 6, 8), z = c("A", "A", "B", "C"))

Posso verificar facilmente se cada elemento de xin df1está presente em xof df2:

df1 <- df1 %>% mutate(present = x %in% df2$x)

Existe uma maneira fácil de fazer a mesma coisa (de preferência no tidyverse), mas verificar apenas dentro do grupo?

Em outras palavras, para que uma observação em seja df1, duas coisas devem ser verdadeiras: 1) o grupo ( ) em deve ser o mesmo que o grupo em e 2) o valor de em deve ser o mesmo que o valor em .presentTRUEzdf2df1xdf2df1

Então, somente a segunda observação ( 2) seria TRUEporque existe uma observação em df2com um xde 2e um zde A. A última observação de xseria FALSEporque mesmo que haja um valor em df2com valor 4, esta observação está em grupo A, não B.

4 respostas

Voted

Andre Wildberg · Answer 1 · 2024-12-01T02:32:20+08:00

Andre Wildberg

2024-12-01T02:32:20+08:002024-12-01T02:32:20+08:00

Uma abordagem cominner_join

Editar, agora funciona com múltiplas correspondências e remove o uso de uma variável temporária

library(dplyr)

bind_rows(df1, inner_join(df1, df2), .id="id") %>% 
  summarize(present = n() > 1 & var(id) > 0, .by = -id)

saída

  x z present
1 1 A   FALSE
2 2 A    TRUE
3 3 B   FALSE
4 4 B   FALSE

4

FJCC · Answer 2 · 2024-12-01T01:00:56+08:00

Best Answer

FJCC

2024-12-01T01:00:56+08:002024-12-01T01:00:56+08:00

Isso funciona nos seus dados de exemplo, embora pareça deselegante.

library(dplyr)
#> 
#> Attaching package: 'dplyr'
#> The following objects are masked from 'package:stats':
#> 
#>     filter, lag
#> The following objects are masked from 'package:base':
#> 
#>     intersect, setdiff, setequal, union
df1 <- data.frame(x = c(1, 2, 3, 4), z = c("A", "A", "B", "B"))
df2 <- data.frame(x = c(2, 4, 6, 8), z = c("A", "A", "B", "C"))
df1 |> rowwise() |> mutate(present = x %in% df2[df2$z == z, "x"])
#> # A tibble: 4 × 3
#> # Rowwise: 
#>       x z     present
#>   <dbl> <chr> <lgl>  
#> 1     1 A     FALSE  
#> 2     2 A     TRUE   
#> 3     3 B     FALSE  
#> 4     4 B     FALSE

^{Criado em 2024-11-30 com reprex v2.1.1}

2

e.matt · Answer 3 · 2024-12-01T07:06:20+08:00

e.matt

2024-12-01T07:06:20+08:002024-12-01T07:06:20+08:00

library (tidyverse)      
 df1 %>%
        left_join(df2 %>% mutate(present = T)) %>% 
        replace_na(list("present"= F))

2

jay.sf · Answer 4 · 2024-12-01T06:08:38+08:00

jay.sf

2024-12-01T06:08:38+08:002024-12-01T06:08:38+08:00

Baseado em R podemos usar match.

> df1 |> transform(present=rowSums(mapply(match, df1, df2, nomatch=0)) == 2)
  x z present
1 1 A   FALSE
2 2 A    TRUE
3 3 B   FALSE
4 4 B   FALSE

1

Verifique se o elemento de um dataframe está em outro dataframe, dentro do grupo

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle?

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Quando devo usar um std::inplace_vector em vez de um std::vector?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

Verifique se o elemento de um dataframe está em outro dataframe, dentro do grupo

4 respostas

relate perguntas