Adicionar número de série para atividade de cópia ao blob

Question

Ryan Gary

Asked: 2025-04-16 01:10:34 +0800 CST2025-04-16 01:10:34 +0800 CST 2025-04-16 01:10:34 +0800 CST

Adicionar linhas ao dataframe no pipe dplyr com base em valores ausentes

772

Tenho um dataframe parecido com este:

data	pesca	dia_do_torneio	pescador	período_ffs	usados_ffs
30/01/2025	Lago Conroe	1	Vila Martin	P1	verdadeiro
31/01/2025	Lago Conroe	2	Vila Martin	P2	verdadeiro
2025-02-1	Lago Conroe	3	Vila Martin	P1	verdadeiro
2025-02-13	Corrente Harris	1	Vila Martin	P3	verdadeiro

structure(list(date = structure(c(1738195200, 1738281600, 1738368000, 
1739404800, 1741219200, 1741305600, 1743638400, 1743724800, 1743811200
), tzone = "UTC", class = c("POSIXct", "POSIXt")), fishery = c("Lake Conroe", 
"Lake Conroe", "Lake Conroe", "Harris Chain", "Lake Murray", 
"Lake Murray", "Lake Guntersville", "Lake Guntersville", "Lake Guntersville"
), tournament_day = c(1, 2, 3, 1, 1, 2, 1, 2, 3), angler = c("Martin Villa", 
"Martin Villa", "Martin Villa", "Martin Villa", "Martin Villa", 
"Martin Villa", "Martin Villa", "Martin Villa", "Martin Villa"
), ffs_period = c("P1", "P2", "P1", "P3", "P1", "P1", "P3", "P2", 
"P1"), used_ffs = c(TRUE, TRUE, TRUE, TRUE, TRUE, TRUE, TRUE, 
TRUE, TRUE)), row.names = c(NA, -9L), class = c("tbl_df", "tbl", 
"data.frame"))

Meu problema é que existem 3 observações "ffs_period" para cada data única: P1, P2, P3. Só tenho dados para a observação "used_ffs" que é "TRUE". Para as duas observações adicionais para cada data, pescaria, dia do torneio e pescador, preciso preencher as duas linhas restantes com "ffs_period" e "used_ffs", que não estão presentes. Por exemplo, a primeira observação em que "ffs_period" é P1 e "used_ffs" é TRUE, eu precisaria preencher duas linhas com a mesma data, pescaria, dia do torneio e pescador, em que "ffs_period" é P2 e P3 e used_ffs é FALSE para ambos. O resultado final seria assim:

data	pesca	dia_do_torneio	pescador	período_ffs	usados_ffs
30/01/2025	Lago Conroe	1	Vila Martin	P1	verdadeiro
30/01/2025	Lago Conroe	1	Vila Martin	P2	FALSO
30/01/2025	Lago Conroe	1	Vila Martin	P3	FALSO
31/01/2025	Lago Conroe	2	Vila Martin	P1	FALSO
31/01/2025	Lago Conroe	2	Vila Martin	P2	verdadeiro
31/01/2025	Lago Conroe	2	Vila Martin	P3	FALSO
2025-02-1	Lago Conroe	3	Vila Martin	P1	verdadeiro
2025-02-1	Lago Conroe	3	Vila Martin	P2	FALSO
2025-02-1	Lago Conroe	3	Vila Martin	P3	FALSO
2025-02-13	Corrente Harris	1	Vila Martin	P1	FALSO
2025-02-13	Corrente Harris	1	Vila Martin	P2	FALSO
2025-02-13	Corrente Harris	1	Vila Martin	P3	verdadeiro

Isso é possível? Ou é muito complicado?

1 respostas

Voted

Jon Spring · Answer 1 · 2025-04-16T01:23:38+08:00

tidyr::completeSeria bom aqui. Como você quer todos ffs_periodpara cada combinação existente de data/pescaria/torneio/pescador, podemos usar nestingpara limitar a saída às combinações existentes dessas combinações e especificar os níveis desejados para ffs_periodgarantir que todas as três apareçam para cada combinação, mesmo que nem todas as três apareçam nos dados de exemplo.

Também podemos usar o fillparâmetro para especificar o used_ffsvalor das linhas adicionadas.

library(tidyr)
df[1:4,] |>
  complete(nesting(date, fishery, tournament_day, angler),
           ffs_period = c("P1", "P2", "P3"),
           fill = list(used_ffs = FALSE))

Resultado


# A tibble: 12 × 6
   date                fishery      tournament_day angler       ffs_period used_ffs
   <dttm>              <chr>                 <dbl> <chr>        <chr>      <lgl>   
 1 2025-01-30 00:00:00 Lake Conroe               1 Martin Villa P1         TRUE    
 2 2025-01-30 00:00:00 Lake Conroe               1 Martin Villa P2         FALSE   
 3 2025-01-30 00:00:00 Lake Conroe               1 Martin Villa P3         FALSE   
 4 2025-01-31 00:00:00 Lake Conroe               2 Martin Villa P1         FALSE   
 5 2025-01-31 00:00:00 Lake Conroe               2 Martin Villa P2         TRUE    
 6 2025-01-31 00:00:00 Lake Conroe               2 Martin Villa P3         FALSE   
 7 2025-02-01 00:00:00 Lake Conroe               3 Martin Villa P1         TRUE    
 8 2025-02-01 00:00:00 Lake Conroe               3 Martin Villa P2         FALSE   
 9 2025-02-01 00:00:00 Lake Conroe               3 Martin Villa P3         FALSE   
10 2025-02-13 00:00:00 Harris Chain              1 Martin Villa P1         FALSE   
11 2025-02-13 00:00:00 Harris Chain              1 Martin Villa P2         FALSE   
12 2025-02-13 00:00:00 Harris Chain              1 Martin Villa P3         TRUE

Adicionar linhas ao dataframe no pipe dplyr com base em valores ausentes

Reformatar números, inserindo separadores em posições fixas

Por que os conceitos do C++20 causam erros de restrição cíclica, enquanto o SFINAE antigo não?

Problema com extensão desinstalada automaticamente do VScode (tema Material)

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Adicionar linhas ao dataframe no pipe dplyr com base em valores ausentes

1 respostas

relate perguntas