Adicionar número de série para atividade de cópia ao blob

Question

Amanda Goldberg

Asked: 2024-10-24 02:51:13 +0800 CST2024-10-24 02:51:13 +0800 CST 2024-10-24 02:51:13 +0800 CST

Como faço para remover duplicatas dentro de grupos que foram coletados com intervalo de 60 minutos entre si?

772

Tenho dados de armadilhas fotográficas onde quero remover detecções de animais potencialmente duplicadas. Estou definindo o intervalo como 60min (1 hora) para que qualquer indivíduo detectado da mesma espécie na mesma câmera seja o mesmo indivíduo se for detectado novamente dentro de <60min. Meus dados são coletados em vários blocos com vários locais dentro de um bloco.

#Data example:
Block<-c("a","a","a","a","a","b","b","b","b","b") #2 block
Site<-c("p1","p1","p2","p2","p2","p1","p1","p1","p2","p2") #two sites
Species<-c("c","c","c","c","e","d","d","c","c","c")
datetime<-c("2021-03-29 05:45:00","2021-03-29 06:40:00","2021-03-30 05:45:00","2021-03-30 07:45:00","2021-03-29 09:45:00","2021-03-29 05:45:00","2021-03-29 05:55:00","2021-03-29 08:45:00","2021-03-29 10:45:00","2021-03-30 10:59:00")
df<-data.frame(Block, Site, Species, datetime)

#what I want for the output: 

   Block Site Species            datetime
1      a   p1       c 2021-03-29 05:45:00
2      a   p2       c 2021-03-30 05:45:00
3      a   p2       c 2021-03-30 07:45:00
4      a   p2       e 2021-03-29 09:45:00
5      b   p1       d 2021-03-29 05:45:00
6      b   p1       c 2021-03-29 08:45:00
7      b   p2       c 2021-03-29 10:45:00
8      b   p2       c 2021-03-30 10:59:00

A parte complicada, pelo menos para mim, é que preciso remover duplicatas de Bloco/Site/Espécie que aparecem com intervalo de 1 hora entre si (não posso simplesmente dizer para manter a primeira dentro de um período de uma hora do dia).

Obrigado pela ajuda.

1 respostas

Voted

score 1 · Answer 1 · 2024-10-24T04:03:03+08:00

Best Answer

2024-10-24T04:03:03+08:002024-10-24T04:03:03+08:00

Usando diffe então filterpor set intv

library(dplyr)

intv <- 60

df %>% 
  mutate(datetime = as.POSIXct(datetime)) %>% 
  arrange(Block, Site, Species, datetime) %>% 
  filter(c(intv + 1, diff(datetime, units="mins")) > intv, 
         .by = c(Block, Site, Species))
  Block Site Species            datetime
1     a   p1       c 2021-03-29 05:45:00
2     a   p2       c 2021-03-30 05:45:00
3     a   p2       c 2021-03-30 07:45:00
4     a   p2       e 2021-03-29 09:45:00
5     b   p1       c 2021-03-29 08:45:00
6     b   p1       d 2021-03-29 05:45:00
7     b   p2       c 2021-03-29 10:45:00
8     b   p2       c 2021-03-30 10:59:00

1

Como faço para remover duplicatas dentro de grupos que foram coletados com intervalo de 60 minutos entre si?

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle?

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Quando devo usar um std::inplace_vector em vez de um std::vector?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

Como faço para remover duplicatas dentro de grupos que foram coletados com intervalo de 60 minutos entre si?

1 respostas

relate perguntas