AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / unix / Perguntas / 694397
Accepted
user518378
user518378
Asked: 2022-03-15 12:27:03 +0800 CST2022-03-15 12:27:03 +0800 CST 2022-03-15 12:27:03 +0800 CST

Extraindo a pressão do nível do mar do KML usando o Shell

  • 772

Atualmente estou trabalhando em um pequeno projeto; em um arquivo kml chamado weatherdata.kml, gostaria de extrair a pressão do nível do mar para cada <Placemark>elemento. Estou tentando analisar as informações sobre a pressão do nível do mar e colocá-las em um arquivo chamado report.csv; e imprima a pressão ao nível do mar em uma nova linha a cada vez.

Eu acho que isso funcionaria awke até agora eu tentei isso:

 awk -F '[>,]' '/minSeaLevelPres/ {print $2}' report.csv

Mas quando executo este comando no shell, recebo isso:

1002</minSeaLevelPres
1002</minSeaLevelPres
1002</minSeaLevelPres
1001</minSeaLevelPres
1001</minSeaLevelPres
1001</minSeaLevelPres
1001</minSeaLevelPres
1001</minSeaLevelPres
1001</minSeaLevelPres
1001</minSeaLevelPres
1001</minSeaLevelPres
1002</minSeaLevelPres
1002</minSeaLevelPres
1003</minSeaLevelPres

quando eu quero pegar isso:

1002
1002
1002
1001
1001
1001
1001
1001
1001
1001
1001
1002
1002
1003

Não consigo descobrir como me livrar de </minSeaLevelPres. Alguém saberia ajudar?

Abaixo está um exemplo de parte de um elemento de marcador emweatherdata.kml

 <Placemark>
        <styleUrl>#ex</styleUrl>
        <lat>19.2</lat>
        <lon>-24.1</lon>
        <stormName>NINE</stormName>
    <stormNum>10</stormNum>
    <basin>AL</basin>
        <stormType>LO</stormType>
        <intensity>20</intensity>
           <intensityMPH>23</intensityMPH>
           <intensityKPH>37</intensityKPH>
           <minSeaLevelPres>1002</minSeaLevelPres>
           <atcfdtg>2020082350</atcfdtg>
        <dtg>0000 UTC JAN 07</dtg>
       </Placemark>
awk xml
  • 4 4 respostas
  • 818 Views

4 respostas

  • Voted
  1. Cyrus
    2022-03-15T13:00:22+08:002022-03-15T13:00:22+08:00

    Sugiro usar uma ferramenta que possa manipular XML corretamente:

    xmlstarlet select --template --value-of '//minSeaLevelPres' -n weatherdata.kml
    

    Resultado:

    1002
    

    Ver:xmlstarlet select --help

    • 17
  2. Marcus Müller
    2022-03-15T13:03:14+08:002022-03-15T13:03:14+08:00

    KML é uma linguagem XML. XML não é uma linguagem com a qual você possa analisar de forma confiável awk. Você pode ter sorte com os arquivos que possui – eles podem ser estruturados de forma mais confiável do que a definição da linguagem permite – mas simplesmente não há razão para escrever seu próprio analisador restrito em AWK quando você obtém um que funciona sempre, com ferramentas diferentes. Suas coisas quebram quando as coisas removem ou adicionam quebras de linha, comentários, por exemplo.

    Acho que você está simplesmente tentando usar a ferramenta errada. Tão provável quanto você awkinstalou em seu sistema é que você pythoninstalou, por exemplo, e então você teria um analisador XML e poderia, sem nenhum código externo além da biblioteca padrão do Python, escrever um programa realmente pequeno que escreve seus CSVs. (Lembre-se, a filosofia UNIX não é "você tem um martelo, agora tudo é um prego", mas "você tem ferramentas para diferentes propósitos, encontre a ferramenta certa para seu propósito").

    import sys
    import xml.etree.ElementTree as ElemTree
    
    fname = sys.argv[1]
    tree = ElemTree.parse(fname)
    for placemark in tree.getroot().iter("Placemark"):
        print(placemark.find("minSeaLevelPres").text)
    

    E é isso. Salve em um arquivo, dê o direito de execução do arquivo ( chmod o+x {filename}), e então você pode executar /path/to/filename input.kml.

    Observação geral:

    Como weatherdata.kml é um arquivo tão grande,

    Não sei o que constitui "grande" para você, mas se você acabar escrevendo um CSV com vários milhões de linhas, não obterá uma representação de dados muito eficiente. Descubra quais formatos binários o consumidor desses dados suporta e escreva isso diretamente. É provável que exista uma biblioteca Python para isso.

    • 5
  3. Best Answer
    Nasir Riley
    2022-03-16T03:34:14+08:002022-03-16T03:34:14+08:00

    Como os outros, eu não recomendaria fazer isso awkporque você está trabalhando com XML. No entanto, se você quiser usá-lo por algum motivo e seu arquivo foi formatado de tal forma que awkfuncionaria ou melhor ainda, se fosse um arquivo de texto simples, então vou mostrar exatamente porque o comando que você tem na sua pergunta não estava funcionando:

    Seu comando tem o separador de campo como >ou ,conforme indicado por[>,]

    awk -F '[>,]' '/minSeaLevelPres/ {print $2}' report.csv
    

    O que isso significa é que o segundo campo é o que vem após a primeira instância de qualquer um desses dois caracteres que estão em seu arquivo >e na(s) linha(s) que contém a string minSeaLevelPres, {print $2}fornecerá exatamente o que você estava obtendo:

    1002</minSeaLevelPres>
    

    Neste caso específico, se você quiser apenas obter 1002do texto de exemplo que você forneceu, o que você precisaria é isso

    awk -F '[><]' '/minSeaLevelPres/ {print $3}' weatherdata.kml
    

    Isso definiria o separador de campo como >ou <o que faria 1002e apenas 1002o terceiro campo que seria impresso a partir do comando acima e daria o que você deseja:

    1002
    

    Novamente, não estou recomendando o uso de awkum XML ou, para fins de argumentação, um arquivo HTML, mas estou apenas fornecendo esta resposta para mostrar por que seu comando não estava funcionando e o que você faria para que funcionasse se você estava operando em um arquivo de texto simples. Você pode fazer referência a isso quando usar awkno futuro.

    • 3
  4. jubilatious1
    2022-03-16T00:10:46+08:002022-03-16T00:10:46+08:00

    Usando Raku (anteriormente conhecido como Perl_6)

    ~$ raku -MXML -e 'my $xml=open-xml($*ARGFILES.Str); 
            .put for $xml.lookfor(:TAG<minSeaLevelPres>)>>.[0];' weatherdata.kml
    

    Acima está uma resposta codificada em Raku, um membro da família Perl de linguagens de programação. Você pode carregar o XMLMódulo Raku na linha de comando com o -MXMLsinalizador de linha de comando. Em seguida, analise o XML, usando o lookforcomando (pesquisa de elemento recursivo). Na etapa final, >>.[0] ou .map(*.[0])mapeia na tag, retornando apenas o valor contido nela.

    Observe que não está claro como seu weatherdata.kmlarquivo realmente se parece, se ele tem um ou todos os marcadores simples, flutuantes e/ou extrudados. O comando acima simplesmente procura :TAG<minSeaLevelPres>recursivamente, gerando valores um por linha.

    Exemplo de entrada, consulte:

    https://developers.google.com/kml/documentation/KML_Samples.kml

    Saída de amostra (altere TAGacima :TAG<tessellate>para testar):

    1
    0
    1
    1
    1
    1
    1
    1
    1
    1
    

    https://github.com/raku-community-modules/XML
    https://raku.org/

    • 2

relate perguntas

  • remova o número de linhas duplicadas com base na correspondência antes da primeira vírgula

  • anexar linhas após outros arquivos linha por linha

  • Como remover uma única linha entre duas linhas

  • Reorganize as letras e compare duas palavras

  • Embaralhamento de arquivo de várias linhas

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Possível firmware ausente /lib/firmware/i915/* para o módulo i915

    • 3 respostas
  • Marko Smith

    Falha ao buscar o repositório de backports jessie

    • 4 respostas
  • Marko Smith

    Como exportar uma chave privada GPG e uma chave pública para um arquivo

    • 4 respostas
  • Marko Smith

    Como podemos executar um comando armazenado em uma variável?

    • 5 respostas
  • Marko Smith

    Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

    • 3 respostas
  • Marko Smith

    apt-get update error no Kali Linux após a atualização do dist [duplicado]

    • 2 respostas
  • Marko Smith

    Como ver as últimas linhas x do log de serviço systemctl

    • 5 respostas
  • Marko Smith

    Nano - pule para o final do arquivo

    • 8 respostas
  • Marko Smith

    erro grub: você precisa carregar o kernel primeiro

    • 4 respostas
  • Marko Smith

    Como baixar o pacote não instalá-lo com o comando apt-get?

    • 7 respostas
  • Martin Hope
    user12345 Falha ao buscar o repositório de backports jessie 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl Por que a maioria dos exemplos do systemd contém WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky Como exportar uma chave privada GPG e uma chave pública para um arquivo 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll status systemctl mostra: "Estado: degradado" 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim Como podemos executar um comando armazenado em uma variável? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S Por que /dev/null é um arquivo? Por que sua função não é implementada como um programa simples? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 Como ver as últimas linhas x do log de serviço systemctl 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - pule para o final do arquivo 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla Por que verdadeiro e falso são tão grandes? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis Substitua a string em um arquivo de texto enorme (70 GB), uma linha 2017-12-30 06:58:33 +0800 CST

Hot tag

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve