Eu tenho um arquivo de texto longo com alguns dados de lixo que preciso limpar.
As entradas são as seguintes.
American Chopper 0x4156003D American Chopper 5849
American Chopper 2: Full Throttle 0x4156004F American Chopper 2 Full Throttle 5849
America's Army: Rise of a Soldier 0x55530043 America’s Army:RoaS 5849
Preciso remover tudo além das sequências alfanuméricas de 10 dígitos que começam com0x
O resultado deve parecer
American Chopper 0x4156003D
American Chopper 2: Full Throttle 0x4156004F
America's Army: Rise of a Soldier 0x55530043
Você pode encontrar personagens vindo depois deles fazendo o seguinte:
(?<=0x[A-Z0-9]{8}).*
.Como sua string parece ser sempre um número hexadecimal, você pode substituir o
Z
na fórmula por umF
. Você também pode adicionara-f
ao provisionado para o caso de letras minúsculas. A fórmula será:(?<=0x[A-Fa-f0-9]{8}).*
Explicação:
?<=0x[A-Z0-9]{8}).*
é uma visão positiva que encontrará/combinará todos os caracteres que vêm logo após a sequência de 10 caracteres alfanuméricos.