AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / unix / Perguntas / 498133
Accepted
Brad Parks
Brad Parks
Asked: 2019-02-02 05:39:50 +0800 CST2019-02-02 05:39:50 +0800 CST 2019-02-02 05:39:50 +0800 CST

Bash - Extrair o valor da chave pelo nome de um texto arbitrário?

  • 772

Eu gostaria de ter um script simples que me permitisse passar qualquer texto e extraísse um valor para uma chave da string.

Eu gostaria que isso fosse flexível e aceitasse entrada XML ou JSON e até mesmo entradas mal formadas, como texto de um log.

por exemplo, dada qualquer uma das seguintes entradas, deve ser capaz de extrair o valor da testchave.

por exemplo

$ echo "test:5 hi there" | extract_key_value test

deve resultar em

5

Observe que eu não me importo com o que está escrito, então node, ruby, etc está bem para mim, mas a portabilidade (Linux/osx) é boa ;-)

entrada1

this is test:5 i saw a value

entrada2

this is test:'another value' i saw a value

entrada3

this is test=5 i saw a value

entrada 4

test='a string value here'

entrada 5

my data
on line 2 test='a string value here'
more data

Minha dica rápida para isso é o seguinte, que acho que pode ser muito melhorado e parece que deve ser resolvido em algum lugar!

extract_key_value

#!/usr/bin/env bash

function show_help()
{
  IT=$(cat <<EOF
  
  Helps you extract a key value from a string, typically a log msg

  usage: key {keyBeginDelim} {keyEndDelim}

  e.g. given "asd f asdf asdf test=easy asdf me=you" as input

  extract_key_value test        
  => returns easy
EOF
)
  echo "$IT"
  exit
}

if [ "$1" == "help" ]
then
  show_help
fi
if [ -z "$1" ]
then
  show_help
fi

INPUT=$(cat -)
KEY="$1"

function getVal()
{
  DELIM1="$1"
  DELIM2="$2"
  echo "$INPUT" | awk -F "$DELIM1" '{print $2}' | awk -F "$DELIM2" '{print $1}'
}

# Try whatever the user passed in or defaults for delims
if [ -n "$2" ]
then
  IT=$(getVal "$2" "$3")
fi

# Try other use cases
if [ -z "$IT" ]
then
  IT=$(getVal "$KEY:'" "'")
fi
if [ -z "$IT" ]
then
  IT=$(getVal "$KEY='" "'")
fi
if [ -z "$IT" ]
then
  IT=$(getVal "$KEY=\"" "\"")
fi
if [ -z "$IT" ]
then
  IT=$(getVal "$KEY:\"" "\"")
fi
if [ -z "$IT" ]
then
  IT=$(getVal "$KEY:" " ")
fi
if [ -z "$IT" ]
then
  IT=$(getVal "$KEY=" " ")
fi
if [ -z "$IT" ]
then
  IT=$(getVal "$KEY=" ";")
fi
if [ -z "$IT" ]
then
  IT=$(getVal "$KEY:" ";")
fi

echo "$IT"
bash
  • 2 2 respostas
  • 546 Views

2 respostas

  • Voted
  1. Best Answer
    Stéphane Chazelas
    2019-02-02T06:23:12+08:002019-02-02T06:23:12+08:00

    Com pcregrep:

    extract_key_value() {
      pcregrep -Mo1 "(?sx)
       (?:
           \Q$1\E      # key literally
         | \"\Q$1\E\"  # same in double quotes
         | '\Q$1\E'    # same in single quotes
       )
       [=:]
       (?|  # branch reset
           '(.*?)'
         | \"(.*?)\"
         | ([^\"'\s]+)
       )"
    }
    
    • -M: correspondência de várias linhas (para permitir test:'foo\nbar'...)
    • -o1: saída do texto correspondente ao primeiro grupo de captura (veja abaixo sobre a redefinição do branch ).
    • (?sx): habilite o ssinalizador (faça .corresponder também os caracteres de nova linha) e xo sinalizador (permita essa multilinha com formato de comentário)
    • \Q$1\Eo conteúdo de $1(o primeiro argumento para a função) deve ser tomado literalmente. Isso pressupõe que não se contém \E. Em shells do tipo ksh93 como bash, você pode substituir $1por ${1//\\E/\\E\\\\E\\Q}para contornar isso.
    • (?|.(.).|.(.).)redefinição de ramal. A numeração do grupo de captura inicia em 1 após cada |, portanto -o1, retornará o primeiro grupo de captura que corresponder em qualquer uma das alternâncias.
    • '.*?'. .*?é a variante não gananciosa de .*, portanto '.*', corresponderá de 'para o primeiro 'depois disso.
    • \s: qualquer caractere de espaço em branco.

    Isso não tenta resolver casos de canto como as \xcodificações em json, a incorporação de aspas entre aspas (o que é feito de maneira diferente dependendo do idioma). Ele não permite espaços em branco em nenhum dos lados do :ou =. Todos esses podem ser abordados, se necessário. Isso dependerá do tipo de entrada exata que você está tentando processar.

    • 4
  2. Thiago Luís
    2019-02-02T06:55:41+08:002019-02-02T06:55:41+08:00

    Um exemplo com grep:

    function extract_key_value() {
        egrep -o "$1[:=]['\"[:alnum:]]+" | egrep -o "['\"[:alnum:]]+$" | egrep -o "[[:alnum:]]+"
    }
    
    echo -e "on line 1\ntest:123 asasas\non line 3\ntest='abc'\non line 5" | extract_key_value test
    
    • 3

relate perguntas

  • exportar variáveis ​​​​env programaticamente, via stdout do comando [duplicado]

  • Problema estranho ao passar variáveis ​​do arquivo de texto

  • Enquanto a linha lê mantendo os espaços de escape?

  • ordem de substituição de processos `te` e `bash`

  • Execute um script muito lento até que seja bem-sucedido

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Possível firmware ausente /lib/firmware/i915/* para o módulo i915

    • 3 respostas
  • Marko Smith

    Falha ao buscar o repositório de backports jessie

    • 4 respostas
  • Marko Smith

    Como exportar uma chave privada GPG e uma chave pública para um arquivo

    • 4 respostas
  • Marko Smith

    Como podemos executar um comando armazenado em uma variável?

    • 5 respostas
  • Marko Smith

    Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

    • 3 respostas
  • Marko Smith

    apt-get update error no Kali Linux após a atualização do dist [duplicado]

    • 2 respostas
  • Marko Smith

    Como ver as últimas linhas x do log de serviço systemctl

    • 5 respostas
  • Marko Smith

    Nano - pule para o final do arquivo

    • 8 respostas
  • Marko Smith

    erro grub: você precisa carregar o kernel primeiro

    • 4 respostas
  • Marko Smith

    Como baixar o pacote não instalá-lo com o comando apt-get?

    • 7 respostas
  • Martin Hope
    user12345 Falha ao buscar o repositório de backports jessie 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl Por que a maioria dos exemplos do systemd contém WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky Como exportar uma chave privada GPG e uma chave pública para um arquivo 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll status systemctl mostra: "Estado: degradado" 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim Como podemos executar um comando armazenado em uma variável? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S Por que /dev/null é um arquivo? Por que sua função não é implementada como um programa simples? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 Como ver as últimas linhas x do log de serviço systemctl 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - pule para o final do arquivo 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla Por que verdadeiro e falso são tão grandes? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis Substitua a string em um arquivo de texto enorme (70 GB), uma linha 2017-12-30 06:58:33 +0800 CST

Hot tag

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve