AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / computer / Perguntas / 1786951
Accepted
NotepadPlusPlus PRO
NotepadPlusPlus PRO
Asked: 2023-06-02 01:26:33 +0800 CST2023-06-02 01:26:33 +0800 CST 2023-06-02 01:26:33 +0800 CST

Expressão regular para pesquisar/substituir várias vezes na mesma linha

  • 772

Estou tentando usar a expressão regular para pesquisar e substituir várias vezes na mesma linha. Acredito que o Regex pode fazer isso usando o recurso lookahead/lookbehind positivo.

Tenho uma longa lista de estados e aeroportos neles. E estou tentando colocá-los todos em State, Aiportpares, uma linha de cada vez.

Aqui está a entrada

State, Airports
----------------
Chicago, ORD, MDW
NY, JFK, LGA, EWR
California, LAX, JWA, LGB, BUR

Aqui está a saída.

Chicago, ORD
Chicago, MDW  
NY, JFK
NY, LGA
NY, EWR
California, LAX
California, JWA
California, LGB
California, BUR

Você pode ajudar a sugerir um regex ou qualquer outra maneira de fazer isso? Obrigado.

Eu uso o Notepad++ para o Regex, mas posso usar qualquer editor de texto para isso.

notepad++
  • 4 4 respostas
  • 112 Views

4 respostas

  • Voted
  1. Ξένη Γήινος
    2023-06-02T02:01:49+08:002023-06-02T02:01:49+08:00

    Esse regex é muito complicado. Ao usar uma linguagem de programação real, as coisas serão muito mais simples.

    Aqui eu dou um exemplo em Python. Obtenha o Python aqui .

    Digamos que você tenha esta entrada:

    Chicago, ORD, MDW
    NY, JFK, LGA, EWR
    California, LAX, JWA, LGB, BUR
    

    E você deseja convertê-lo em sua saída fornecida:

    Chicago, ORD
    Chicago, MDW  
    NY, JFK
    NY, LGA
    NY, EWR
    California, LAX
    California, JWA
    California, LGB
    California, BUR
    

    É simples, primeiro divida a string em linhas, depois divida cada linha em listings strpor vírgulas. Por fim, retorne a combinação do primeiro elemento e todos os outros elementos do mesmo list.

    lines = """Chicago, ORD, MDW
    NY, JFK, LGA, EWR
    California, LAX, JWA, LGB, BUR"""
    
    for line in lines.splitlines():
        lst = line.split(', ')
        first = lst[0]
        for e in lst[1:]:
            print(f'{first}, {e}')
    
    • 2
  2. Best Answer
    Toto
    2023-06-02T01:46:48+08:002023-06-02T01:46:48+08:00
    • Ctrl+H
    • Encontrar o que:^(\w+,\h*)(\w+)(?:,\h*(\w+))?(?:,\h*(\w+))?(?:,\h*(\w+))?(?:,\h*(\w+))?(?:,\h*(\w+))?(?:,\h*(\w+))?(?:,\h*(\w+))?(?:,\h*(\w+))?(?:,\h*(\w+))?
    • Substituir com:$1$2\n(?3$1$3)(?4\n$1$4)(?5\n$1$5)(?6\n$1$6)(?7\n$1$7)(?8\n$1$8)(?9\n$1$9)
    • Caixa de correspondência TICK
    • TICK Envolver
    • SELECT Expressão regular
    • DESMARCAR . matches newline
    • Replace all

    Explicação:

    ^               # beginning of line
        (               # group 1
            \w+             # 1 or more word characters
            ,               # a comma
            \h*             # 0 or more horizontal spaces
        )               # end group 1
        (\w+)           # group 2, 1 or more word characters
        (?:             # non capture group
            \h*             # 0 or more horizontal spaces
            (\w+)           # group 3, 1 or more word characters
        )?              # end group, optional
    (?:,\h*(\w+))?      # same as above
    (?:,\h*(\w+))?      # same as above
    (?:,\h*(\w+))?      # same as above
    (?:,\h*(\w+))?      # ... 
    (?:,\h*(\w+))?      # ... 
    (?:,\h*(\w+))?      # ... 
    (?:,\h*(\w+))?      # ... 
    (?:,\h*(\w+))?      # ... 
    

    Substituição:

    $1              # content of group 1
    $2              # content of group 2
    \n              # line feed, you can use \r\n for Windows
    (?3             # if group 3 exists
        $1              # content of group 1
        $3              # content of group 3
    )               # endif
    (?4\n$1$4)      # same as above
    (?5\n$1$5)      # ...
    (?6\n$1$6)      # ...
    (?7\n$1$7)      # ...
    (?8\n$1$8)      # ...
    (?9\n$1$9)      # ...
    

    Captura de tela (antes):

    insira a descrição da imagem aqui

    Captura de tela (depois):

    insira a descrição da imagem aqui

    • 1
  3. Destroy666
    2023-06-02T03:37:38+08:002023-06-02T03:37:38+08:00

    Para o Notepad++, se você precisar usá-lo, também pode usar o PythonScript :

    1. Plugins-> Plugins Admin...-> Marque PythonScripte clique em Install.
    2. Plugins-> PythonScript-> New Script-> crie-o no scriptsdiretório padrão.
    3. Adicione este conteúdo e salve:
    import re
    
    def split_text(match):
      # Split by comma and any number of horizontal whitespace
      parts = re.split(',[\t ]*', match.group(1))  
      results = []
      
      # Skip first item and create strings with all the combinations
      for part in parts[1:]:
        results.append("%s, %s"%(parts[0], part))
        
      # Combine all parts with separated by newline
      return "\n".join(results)
    
    # Ensure proper matches and call split_text() handler function
    # (?!\A) - don't match start of file (first line)
    # [\w\t ,]+ - match only word characters, horizontal whitespace and commas
    editor.rereplace('^(?!\A)([\w\t ,]+)$', split_text);
    

    Isso funciona com o cabeçalho e o preserva.

    • 1
  4. jcaron
    2023-06-02T20:58:22+08:002023-06-02T20:58:22+08:00

    Eu sei que você pediu um regex para usar no Notepad ++, mas aqui está um perl one-liner de qualquer maneira:

    perl -nle '($state,@f) = split /,\s*/; print "$state, $_" for @f;' < txt
    

    Explicação:

    • perl: invocar perl
    • -nsinalizador: executará um loop em cada linha da entrada e executará o código fornecido para cada linha
    • -lsinalizador: remove automaticamente os finais de linha na entrada e os adiciona às saídas
    • -esinalizador: use o código fornecido como argumento
    • ($state,@f) = split /,\s*/: divida a linha em qualquer lugar onde houver uma vírgula, separada por espaço em branco opcional, coloque o primeiro valor em $state e o restante em array@f
    • print "$state, $_" for @f: para cada item em @f(portanto, cada aeroporto), imprima uma linha com o estado e o aeroporto

    Alternativa:

    perl -F',\s*' -le '$state = shift @F; print "$state, $_" for @F;' < txt
    
    • -F',\s*'sinalizador: divisão automática usando o regex separador fornecido, armazene os resultados em @F. Implica -n.
    • $state = shift @F: remova o primeiro item de @Fe armazene-o em$state

    Claro que Chicago não é um estado :-)

    • 1

relate perguntas

  • Mantenha o tipo/extensão de arquivo atual na caixa de diálogo "Salvar como..." do Notepad++

  • Contando vírgulas em uma string de texto e adicionando uma nova linha

  • Removendo informações

  • Notepad ++ excluir até dois pontos para cada linha com substituir tudo

  • NotePad++ User Defined Lang não mostra instruções condicionais

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Como posso reduzir o consumo do processo `vmmem`?

    • 11 respostas
  • Marko Smith

    Baixar vídeo do Microsoft Stream

    • 4 respostas
  • Marko Smith

    O Google Chrome DevTools falhou ao analisar o SourceMap: chrome-extension

    • 6 respostas
  • Marko Smith

    O visualizador de fotos do Windows não pode ser executado porque não há memória suficiente?

    • 5 respostas
  • Marko Smith

    Como faço para ativar o WindowsXP agora que o suporte acabou?

    • 6 respostas
  • Marko Smith

    Área de trabalho remota congelando intermitentemente

    • 7 respostas
  • Marko Smith

    O que significa ter uma máscara de sub-rede /32?

    • 6 respostas
  • Marko Smith

    Ponteiro do mouse movendo-se nas teclas de seta pressionadas no Windows?

    • 1 respostas
  • Marko Smith

    O VirtualBox falha ao iniciar com VERR_NEM_VM_CREATE_FAILED

    • 8 respostas
  • Marko Smith

    Os aplicativos não aparecem nas configurações de privacidade da câmera e do microfone no MacBook

    • 5 respostas
  • Martin Hope
    Vickel O Firefox não permite mais colar no WhatsApp web? 2023-08-18 05:04:35 +0800 CST
  • Martin Hope
    Saaru Lindestøkke Por que os arquivos tar.xz são 15x menores ao usar a biblioteca tar do Python em comparação com o tar do macOS? 2021-03-14 09:37:48 +0800 CST
  • Martin Hope
    CiaranWelsh Como posso reduzir o consumo do processo `vmmem`? 2020-06-10 02:06:58 +0800 CST
  • Martin Hope
    Jim Pesquisa do Windows 10 não está carregando, mostrando janela em branco 2020-02-06 03:28:26 +0800 CST
  • Martin Hope
    andre_ss6 Área de trabalho remota congelando intermitentemente 2019-09-11 12:56:40 +0800 CST
  • Martin Hope
    Riley Carney Por que colocar um ponto após o URL remove as informações de login? 2019-08-06 10:59:24 +0800 CST
  • Martin Hope
    zdimension Ponteiro do mouse movendo-se nas teclas de seta pressionadas no Windows? 2019-08-04 06:39:57 +0800 CST
  • Martin Hope
    jonsca Todos os meus complementos do Firefox foram desativados repentinamente, como posso reativá-los? 2019-05-04 17:58:52 +0800 CST
  • Martin Hope
    MCK É possível criar um código QR usando texto? 2019-04-02 06:32:14 +0800 CST
  • Martin Hope
    SoniEx2 Altere o nome da ramificação padrão do git init 2019-04-01 06:16:56 +0800 CST

Hot tag

windows-10 linux windows microsoft-excel networking ubuntu worksheet-function bash command-line hard-drive

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve