AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / coding / Perguntas / 79410705
Accepted
denis
denis
Asked: 2025-02-04 14:02:28 +0800 CST2025-02-04 14:02:28 +0800 CST 2025-02-04 14:02:28 +0800 CST

Como preencher um texto fornecido até outro texto fornecido e assim por diante em R?

  • 772

Provavelmente já respondido, mas estou com dificuldade para encontrar a resposta para esta pergunta: Em uma nova coluna 'new_text', como preencher um texto fornecido com outro texto fornecido, e assim por diante...

No exemplo abaixo, como preencher 'Potter' com 'Wisley' e depois 'Wisley' com 'Granger', etc...?

A ideia é aplicar a solução proposta a dataframes de milhares de linhas (obtidos com pdftools::pdf_data) selecionando uma sequência de palavras específicas para preencher dessa maneira.

Obrigado pela ajuda.

> dat0
      text new_text
1   Potter   Potter
2     hj7d   Potter
3    kl8ep   Potter
4      f3d   Potter
5   rtyzs2   Potter
6   Wisley   Wisley
7     lq6s   Wisley
8      2fg   Wisley
9  Granger  Granger
10    r8ka  Granger
11      h9  Granger
12   qm9ne  Granger  

Dados:

dat0 <-
structure(list(text = c("Potter", "hj7d", "kl8ep", "f3d", "rtyzs2", 
"Wisley", "lq6s", "2fg", "Granger", "r8ka", "h9", "qm9ne"), new_text = c("Potter", 
"Potter", "Potter", "Potter", "Potter", "Wisley", "Wisley", "Wisley", 
"Granger", "Granger", "Granger", "Granger")), class = "data.frame", row.names = c(NA, 
-12L))
  • 2 2 respostas
  • 84 Views

2 respostas

  • Voted
  1. Best Answer
    Edward
    2025-02-04T14:55:01+08:002025-02-04T14:55:01+08:00

    Uma maneira é converter os não-nomes para NA e então usar fillfrom tidyr. Você precisará configurar as palavras específicas (nomes) que deseja manter primeiro.

    library(tidyr)
    
    Names <- c("Potter", "Wisley", "Granger")
    
    transform(dat0, text=ifelse(text %in% Names, text, NA)) |>
      fill(text)
          text new_text
    1   Potter   Potter
    2   Potter   Potter
    3   Potter   Potter
    4   Potter   Potter
    5   Potter   Potter
    6   Wisley   Wisley
    7   Wisley   Wisley
    8   Wisley   Wisley
    9  Granger  Granger
    10 Granger  Granger
    11 Granger  Granger
    12 Granger  Granger
    
    • 4
  2. ThomasIsCoding
    2025-02-04T16:39:57+08:002025-02-04T16:39:57+08:00

    Obviamente que a solução do @Edwardfill é a opção mais concisa para o seu problema, você definitivamente não vai querer perder isso.

    Minha solução é construída na base R (se você estiver interessado e jogar por diversão), onde você pode usar cumsum+ %in%+ avecomo abaixo

    nms <- c("Potter", "Wisley", "Granger")
    transform(
        df,
        new_text = nms[ave(
            match(text, nms),
            cumsum(text %in% nms),
            FUN = na.omit
        )]
    )
    

    o que dá

          text new_text
    1   Potter   Potter
    2     hj7d   Potter
    3    kl8ep   Potter
    4      f3d   Potter
    5   rtyzs2   Potter
    6   Wisley   Wisley
    7     lq6s   Wisley
    8      2fg   Wisley
    9  Granger  Granger
    10    r8ka  Granger
    11      h9  Granger
    12   qm9ne  Granger
    13  Potter   Potter
    14    abcd   Potter
    15    d9k2   Potter
    16    89kx   Potter
    17    dkdi   Potter
    

    dados

    df <- structure(list(text = c(
        "Potter", "hj7d", "kl8ep", "f3d", "rtyzs2",
        "Wisley", "lq6s", "2fg", "Granger", "r8ka", "h9", "qm9ne",
        "Potter", "abcd", "d9k2", "89kx", "dkdi"
    )), row.names = c(
        NA,
        -17L
    ), class = "data.frame")
    
    > df
          text
    1   Potter
    2     hj7d
    3    kl8ep
    4      f3d
    5   rtyzs2
    6   Wisley
    7     lq6s
    8      2fg
    9  Granger
    10    r8ka
    11      h9
    12   qm9ne
    13  Potter
    14    abcd
    15    d9k2
    16    89kx
    17    dkdi
    
    • 3

relate perguntas

  • Adicionar número de série para atividade de cópia ao blob

  • A fonte dinâmica do empacotador duplica artefatos

  • Selecione linhas por grupo com 1s consecutivos

  • Lista de chamada de API de gráfico subscritoSkus estados Privilégios insuficientes enquanto os privilégios são concedidos

  • Função para criar DFs separados com base no valor da coluna

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Reformatar números, inserindo separadores em posições fixas

    • 6 respostas
  • Marko Smith

    Por que os conceitos do C++20 causam erros de restrição cíclica, enquanto o SFINAE antigo não?

    • 2 respostas
  • Marko Smith

    Problema com extensão desinstalada automaticamente do VScode (tema Material)

    • 2 respostas
  • Marko Smith

    Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

    • 1 respostas
  • Marko Smith

    Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

    • 1 respostas
  • Marko Smith

    Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

    • 6 respostas
  • Marko Smith

    `(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

    • 3 respostas
  • Marko Smith

    Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

    • 1 respostas
  • Marko Smith

    PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

    • 2 respostas
  • Marko Smith

    AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

    • 1 respostas
  • Martin Hope
    Fantastic Mr Fox Somente o tipo copiável não é aceito na implementação std::vector do MSVC 2025-04-23 06:40:49 +0800 CST
  • Martin Hope
    Howard Hinnant Encontre o próximo dia da semana usando o cronógrafo 2025-04-21 08:30:25 +0800 CST
  • Martin Hope
    Fedor O inicializador de membro do construtor pode incluir a inicialização de outro membro? 2025-04-15 01:01:44 +0800 CST
  • Martin Hope
    Petr Filipský Por que os conceitos do C++20 causam erros de restrição cíclica, enquanto o SFINAE antigo não? 2025-03-23 21:39:40 +0800 CST
  • Martin Hope
    Catskul O C++20 mudou para permitir a conversão de `type(&)[N]` de matriz de limites conhecidos para `type(&)[]` de matriz de limites desconhecidos? 2025-03-04 06:57:53 +0800 CST
  • Martin Hope
    Stefan Pochmann Como/por que {2,3,10} e {x,3,10} com x=2 são ordenados de forma diferente? 2025-01-13 23:24:07 +0800 CST
  • Martin Hope
    Chad Feller O ponto e vírgula agora é opcional em condicionais bash com [[ .. ]] na versão 5.2? 2024-10-21 05:50:33 +0800 CST
  • Martin Hope
    Wrench Por que um traço duplo (--) faz com que esta cláusula MariaDB seja avaliada como verdadeira? 2024-05-05 13:37:20 +0800 CST
  • Martin Hope
    Waket Zheng Por que `dict(id=1, **{'id': 2})` às vezes gera `KeyError: 'id'` em vez de um TypeError? 2024-05-04 14:19:19 +0800 CST
  • Martin Hope
    user924 AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos 2024-03-20 03:12:31 +0800 CST

Hot tag

python javascript c++ c# java typescript sql reactjs html

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve