dylanjm提出的问题 -unix

dylanjm

Asked: 2020-01-11 10:19:07 +0800 CST

Como analisar Stdout como uma mistura de CSV e JSON?

3

Atualmente, estou trabalhando em uma classe que nos faz enviar nosso código para um auto-classificador e, em seguida, retorna nossos resultados. O formato que ele retorna é meio difícil de analisar visualmente, então eu gostaria de escrever um script que eu possa usar em um pipe para facilitar a leitura.

Aqui está a saída do auto-classificador:

Problem,Correct?,Correct Answer,Agent's Answer
"Challenge Problem B-04",0,4,-1
"Basic Problem B-12",0,1,-1
"Challenge Problem B-05",0,6,-1
"Challenge Problem B-07",0,6,-1
"Challenge Problem B-06",0,3,-1
"Basic Problem B-11",0,1,-1
"Basic Problem B-10",0,3,-1
"Challenge Problem B-03",0,3,-1
"Challenge Problem B-02",0,1,-1
"Challenge Problem B-01",0,6,-1
"Challenge Problem B-09",0,4,-1
"Challenge Problem B-08",0,4,-1
"Basic Problem B-08",0,6,-1
"Basic Problem B-09",0,5,-1
"Basic Problem B-04",0,3,-1
"Basic Problem B-05",0,4,-1
"Basic Problem B-06",0,5,-1
"Basic Problem B-07",0,6,-1
"Basic Problem B-01",0,2,-1
"Basic Problem B-02",0,5,-1
"Basic Problem B-03",0,1,-1
"Challenge Problem B-10",0,4,-1
"Challenge Problem B-11",0,5,-1
"Challenge Problem B-12",0,1,-1
{
    "Basic Problems B": {
        "Incorrect": "0",
        "Skipped": "12",
        "Correct": "0",
        "Set": "Basic Problems B"
    },
    "Challenge Problems B": {
        "Incorrect": "0",
        "Skipped": "12",
        "Correct": "0",
        "Set": "Challenge Problems B"
    }
}

É uma mistura de valores separados por vírgula e JSON. Seria bom colocar tudo isso em uma mesa bonita que eu possa ler.

Atualmente, tenho algo como

python submit.py --provider gt --assignment error-check | column -t -s, | less -S

Quais saídas:

{
    "Basic Problems B": {
        "Incorrect": "0",
        "Skipped": "12",
        "Correct": "0",
        "Set": "Basic Problems B"
    },
    "Challenge Problems B": {
        "Incorrect": "0",
        "Skipped": "12",
        "Correct": "0",
        "Set": "Challenge Problems B"
    }
}
Problem                   Correct?  Correct Answer  Agent's Answer
"Challenge Problem B-04"  0         4               -1
"Basic Problem B-12"      0         1               -1
"Challenge Problem B-05"  0         6               -1
"Challenge Problem B-07"  0         6               -1
"Challenge Problem B-06"  0         3               -1
"Basic Problem B-11"      0         1               -1
"Basic Problem B-10"      0         3               -1
"Challenge Problem B-03"  0         3               -1
"Challenge Problem B-02"  0         1               -1
"Challenge Problem B-01"  0         6               -1
"Challenge Problem B-09"  0         4               -1
"Challenge Problem B-08"  0         4               -1
"Basic Problem B-08"      0         6               -1
"Basic Problem B-09"      0         5               -1
"Basic Problem B-04"      0         3               -1
"Basic Problem B-05"      0         4               -1
"Basic Problem B-06"      0         5               -1
"Basic Problem B-07"      0         6               -1
"Basic Problem B-01"      0         2               -1
"Basic Problem B-02"      0         5               -1
"Basic Problem B-03"      0         1               -1
"Challenge Problem B-10"  0         4               -1
"Challenge Problem B-11"  0         5               -1
"Challenge Problem B-12"  0         1               -1

Isso me leva a maior parte do caminho até lá. Agora eu estou querendo saber se existe uma maneira que eu possa lidar com o JSON?

Não posso confiar em dividir a saída em um determinado número de linha, mas estou pensando que posso segmentar a saída quando encontrar um arquivo {.

Eu gostaria de fazer isso o mínimo possível para que eu possa compartilhá-lo com os colegas. Portanto, quanto menos dependências, melhor.

Eu vi outras postagens de análise JSON sugerindo o uso de códigos externos.

Uma saída ideal seria algo como:

Problem                   Correct?  Correct Answer  Agent's Answer
"Challenge Problem B-04"  0         4               -1
"Basic Problem B-12"      0         1               -1
"Challenge Problem B-05"  0         6               -1
"Challenge Problem B-07"  0         6               -1
"Challenge Problem B-06"  0         3               -1
"Basic Problem B-11"      0         1               -1
"Basic Problem B-10"      0         3               -1
"Challenge Problem B-03"  0         3               -1
"Challenge Problem B-02"  0         1               -1
"Challenge Problem B-01"  0         6               -1
"Challenge Problem B-09"  0         4               -1
"Challenge Problem B-08"  0         4               -1
"Basic Problem B-08"      0         6               -1
"Basic Problem B-09"      0         5               -1
"Basic Problem B-04"      0         3               -1
"Basic Problem B-05"      0         4               -1
"Basic Problem B-06"      0         5               -1
"Basic Problem B-07"      0         6               -1
"Basic Problem B-01"      0         2               -1
"Basic Problem B-02"      0         5               -1
"Basic Problem B-03"      0         1               -1
"Challenge Problem B-10"  0         4               -1
"Challenge Problem B-11"  0         5               -1
"Challenge Problem B-12"  0         1               -1

Set                   Incorrect Skipped Correct
Basic Problems B      0         12      0
Challenge Problems B  0         12      0

dylanjm

Asked: 2019-08-30 15:26:44 +0800 CST

Maneira correta de codificar a opção de simulação sem ter que me repetir?

1

Estou codificando um script que procura arquivos em um servidor remoto e os transfere de volta para meu computador local. Quero poder fazer uma simulação primeiro, para saber quais arquivos estou trazendo de volta.

Atualmente, estou usando uma combinação de getoptsredirecionamento de saída de algum código que encontrei aqui .

Parece-me, através da minha pesquisa, que é impraticável retornar arrays de funções ZSH ou Bash. Para mim, isso torna difícil entender como eu codificaria esse script sem ter que me repetir muito.

Aqui está o meu script atual:

EDIT: Por favor, perdoe-me misturar alguns bashisms com coisas zsh, comecei a escrever este script usando, #!/bin/bashmas mudei para zsh.

#!/usr/local/bin/zsh
RED='\033[0;31m'
NC='\033[0m'
GREEN='\033[0;32m'
YELLOW='\033[0;33m'

dry_run=0
yesterday=1

# Establish -n flag means to do a dry run.
while getopts "ny:" flag; do
    case "$flag" in
        n) dry_run=1 ;;
        y) yesterday=${OPTARG} ;;
        *) echo 'error in command line parsing' >&2
           exit 1
    esac
done
shift $(($OPTIND-1))

# This is the folder I'm interested in getting files from
folder=${1:?"You must define a folder of interest"}

# Check to see if dry-run, if not proceed with copying the files over. 
if [ "$dry_run" -eq 1 ]; then
    print -Pn "\n%S%11F%{Initiating Dry-Run%}%s%f"

    # SSH onto server and find the most recently updated folder.
    # Then place that newest folder and folder of interest into the absolute file path.
    # Then SSH again and use find with that file-path
    # Return array of file paths
    # TODO: **THIS IS THE SECTION I NEED TO REFACTOR INTO A FUNCTION**
    bison_remote_files=($(
        {
            {
                bison_latest_run=$(ssh -qn falcon1 'find /projects/bison/git/* -mindepth 0 -maxdepth 0 -type d -printf "%T@\t%f\n"' |
                    sort -t$'\t' -r -nk1,5 |
                    sed -n "$yesterday"p |
                    cut -f2-)

                bison_remote_path=$(
                    echo $bison_latest_run |
                        awk -v folder="$folder" '{print "/projects/bison/git/"$1"/assessment/LWR/validation/"folder}')

                ssh -qn falcon1 \
                    "find $bison_remote_path -type f -name '*_out.csv' -not -path '*/doc/*' 2>/dev/null" >&3 3>&-; echo "$?"

                print -Pn "\n\n%U%B%13F%{Fetching data from:%}%u %B%12F%{ /projects/bison/git/${bison_latest_run}%}%b%f\n" >&2

            } | {
                until read -t1 ret; do
                    print -Pn "%S%11F%{.%}%s%f" >&2
                done
                exit "$ret"
            }
        } 3>&1))


    # Maninpulate remote file paths to match the local machine directory
    local_file_path=($(for i in "${bison_remote_files[@]}"; do
                           echo $i |
                               gsed -E "s|/projects/bison/git/bison_[0-9]{8}|$HOME/Documents/projects/bison|g"
                       done
                     ))

    # Loop through remote and local and show where they will be placed
    for ((i=1; i<=${#bison_remote_files[@]}; i++)); do
        print -P "\u251C\U2500%B%1F%{Remote File ->%}%b%f ${bison_remote_files[i]}"
        print -P "\u251C\U2500%B%10F%{Local File  ->%}%b%f ${local_file_path[i]}"

        if [[ $i -lt ${#bison_remote_files[@]} ]]; then
            print -Pn "\U2502\n"
        else
            print -Pn "\U2514\U2500\U2504\U27E2\n"
        fi
    done

# If it's not a dry run, grab all the files using scp
# This is the part I am stuck...
# All my defined variables are un-run in the scope above
# How do I craft a function (or something else) so I don't have to do all the above all over again?    
else
    printf "${YELLOW}Fetching Data from ${NC}(${GREEN}${bison_latest_run}${NC})${YELLOW}...${NC}\n"

    for ((i=0; i<${#NEW_RFILEP[@]}; i++)); do

        scp -qp mcdodyla@falcon1:"${NEW_RFILEP[i]}" "${LOCAL_FILEP[i]}"

        # Check if scp was successful, if it was show green.
        if [ ${PIPESTATUS[0]} -eq 0 ]; then      
            printf "${GREEN}File Created/Updated at:${NC} ${LOCAL_FILEP[i]}\n"
        else
            printf "${RED}Error Fetching File:${NC} ${NEW_RFILEP[i]}\n"
        fi
    done
    printf "${YELLOW}Bison Remote Fetch Complete!${NC}\n"
fi

Como você pode ver, todos os meus dados ficam presos no primeiro caso de instrução if e, portanto, se eu não quiser fazer uma simulação, terei que executar todo esse código novamente. Como o bash/zsh realmente não retorna arrays, como refatoro esse código?

EDIT: Aqui está um exemplo de caso de uso:

> bfetch -n "HBEP"

Initiating Dry-Run...

Fetching data from:  /projects/bison/git/bison_20190827
├─Remote File -> /projects/bison/git/bison_20190827/assessment/LWR/validation/HBEP/analysis/BK370/HBEP_BK370_out.csv
├─Local File  -> /Users/mcdodj/Documents/projects/bison/assessment/LWR/validation/HBEP/analysis/BK370/HBEP_BK370_out.csv
│
├─Remote File -> /projects/bison/git/bison_20190827/assessment/LWR/validation/HBEP/analysis/BK363/HBEP_BK363_out.csv
├─Local File  -> /Users/mcdodj/Documents/projects/bison/assessment/LWR/validation/HBEP/analysis/BK363/HBEP_BK363_out.csv
│
├─Remote File -> /projects/bison/git/bison_20190827/assessment/LWR/validation/HBEP/analysis/BK365/HBEP_BK365_out.csv
├─Local File  -> /Users/mcdodj/Documents/projects/bison/assessment/LWR/validation/HBEP/analysis/BK365/HBEP_BK365_out.csv

dylanjm

Asked: 2019-07-24 09:13:30 +0800 CST

Encontre diretórios que não contenham um arquivo apenas em diretórios que seguem um diretório específico

0

Eu tenho um grande projeto para o qual estou tentando encontrar diretórios que não contenham um *_out.csvarquivo. Eu olhei para outras respostas semelhantes e acho que estou quase lá.

O problema que estou enfrentando é que eu só quero procurar em diretórios que prosseguem analysis/, mas também não quero procurar em alguns diretórios específicos que também procedem à análise.

Eu configurei um pequeno problema de exemplo:

$ tree
.
├── case1
│   ├── analysis
│   │   ├── test1
│   │   │   ├── gold
│   │   │   └── test1_out.csv
│   │   └── test2
│   └── doc
└── case2
    ├── analysis
    │   ├── test3
    │   │   └── gold
    │   └── test4
    │       └── test4_out.csv
    └── doc

12 directories, 2 files

Não quero procurar em diretórios intitulados */doc/*ou */gold/*. Meu comando atual é:

find . -type d -not -name "doc" -not -name "gold" '!' -exec test -e "{}/*_out.csv" ';' -print

O que resulta em:

.
./case1
./case1/analysis
./case1/analysis/test1
./case1/analysis/test2
./case2
./case2/analysis
./case2/analysis/test3
./case2/analysis/test4

Minha saída ideal seria

./case1/analysis/test2
./case2/analysis/test3

Então, como você pode ver, meu findcomando atual está excluindo os diretórios doce gold, mas não está excluindo os diretórios que possuem um *_out.csvarquivo e também não excluindo os diretórios que não prosseguem analysis/.

dylanjm

Asked: 2019-04-10 07:30:53 +0800 CST

Substituir o meio do caminho do arquivo mantendo o nome do arquivo no final?

0

Estou tentando manipular um caminho de arquivo usando o bash. A primeira parte do meu objetivo foi concluída, onde substituo a primeira metade do caminho do arquivo pelo caminho no meu computador local.

$> fp=$"/projects/bison/git/bison_20190405/assessment/LWR/validation/HBEP/analysis/BK363/HBEP_BK363_out.csv"
$> echo $fp | 
    sed -E "s#/projects/bison/git/bison_[0-9]{8}#/Users/djm/Documents/projects/bison#"

$> /Users/djm/Documents/projects/bison/assessment/LWR/validation/HBEP/analysis/BK363/HBEP_BK363_out.csv

A próxima parte eu estou tendo problemas com. Gostaria de substituir tudo entre /analysis/e o nome do arquivo por /doc/figures/FILENAME, incluindo análise. Consegui criar essa funcionalidade usando um Rscript, mas não consigo descobrir como manter o nome do arquivo na instrução pipe.

Entrada esperada:

/Users/djm/Documents/projects/bison/assessment/LWR/validation/HBEP/analysis/BK363/HBEP_BK363_out.csv

Saída esperada:

/Users/djm/Documents/projects/bison/assessment/LWR/validation/HBEP/doc/figures/HBEP_BK363_out.csv

Aqui está meu Rscript atual com o regexp necessário:

library(dplyr)
library(stringr)

test <- "/projects/bison/git/bison_20190405/assessment/LWR/validation/HBEP/analysis/BK363/HBEP_BK363_out.csv"

str_replace_all(test, "/projects/bison/git/bison_[0-9]{8}",
                      "Users/djm/Documents/projects/bison") %>% 
  str_replace_all("(?:analysis).*$", 
                  paste0("doc/figures/", basename(.)))

#> [1] "Users/djm/Documents/projects/bison/assessment/LWR/validation/HBEP/doc/figures/HBEP_BK363_out.csv"

^{Criado em 2019-04-09 pelo pacote reprex (v0.2.1)}

dylanjm

Asked: 2019-04-06 11:50:19 +0800 CST

Use scp para copiar arquivos de extensão específica do diretório

-1

Estou escrevendo um script bash que precisa buscar tudo *_out.csvde um diretório, em um servidor remoto. Todos esses arquivos são vários diretórios dentro de outro diretório. Por exemplo, digamos que o diretório seja chamado ox_20190404/. Eu posso encontrar todos os meus arquivos indo:

find ox_20190404/assessment/LWR/validation -type f -name "*_out.csv"

Esta pergunta responde parte da minha pergunta , mas como não quero copiar o diretório inteiro, preciso descobrir como implementar o código acima. Suponha que eu comece com isso:

$ dir="/projects/ox/git"
$ server="myusername@server"
$ scp $server:$dir/$(ssh $server 'ls -t $dir | head -1') .

Como eu pegaria os arquivos que preciso de lá?

A última parte da minha pergunta se pergunta se existe uma maneira de pegar todos os arquivos copiados e colocá-los no mesmo caminho de arquivo e diretório em que estavam no servidor remoto.

Como analisar Stdout como uma mistura de CSV e JSON?

Maneira correta de codificar a opção de simulação sem ter que me repetir?

Encontre diretórios que não contenham um arquivo apenas em diretórios que seguem um diretório específico

Substituir o meio do caminho do arquivo mantendo o nome do arquivo no final?

Use scp para copiar arquivos de extensão específica do diretório

Possível firmware ausente /lib/firmware/i915/* para o módulo i915

Falha ao buscar o repositório de backports jessie

Como exportar uma chave privada GPG e uma chave pública para um arquivo

Como podemos executar um comando armazenado em uma variável?

Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

apt-get update error no Kali Linux após a atualização do dist [duplicado]

Como ver as últimas linhas x do log de serviço systemctl

Nano - pule para o final do arquivo

erro grub: você precisa carregar o kernel primeiro

Como baixar o pacote não instalá-lo com o comando apt-get?

dylanjm's questions