通过命令的标准输出以编程方式导出环境变量[重复]

Question

user648855

Asked: 2025-02-02 03:39:03 +0800 CST2025-02-02 03:39:03 +0800 CST 2025-02-02 03:39:03 +0800 CST

如何提取变量内的带引号的字符串？

772

我承认以前这里也问过类似的问题，但我见过的所有问题都比我想要实现的要简单。最好只使用 Bash 的解决方案。

我有一个变量，其中包含一个看起来像某种比较的字符串，我想将其拆分为一个数组。以下是一些示例，包括我希望如何拆分它们：

var='name="value"'                # arr=([0]=name [1]='=' [2]=value)
var="name != '!value='"           # arr=([0]=name [1]='!=' [2]='!value=')
var='"na=me" = value'             # arr=([0]=na=me [1]='=' [2]=value)
var='name >= value'               # arr=([0]=name [1]='>=' [2]=value)
var='name'                        # arr=([0]=name)
var='name = "escaped \"quotes\""' # arr=([0]=name [1]='=' [2]=escaped\ \"quotes\")
var="name = \"nested 'quotes'\""  # arr=([0]=name [1]='=' [2]=nested\ \'quotes\')
var="name = 'nested \"quotes\"'"  # arr=([0]=name [1]='=' [2]=nested\ \"quotes\")

您明白了吧。两边（或两边都不用）都可以用单引号或双引号引起来。可能会有转义引号或嵌套引号。它们之间的运算符可以是预定义的任何集合，但它们也可以包含在带引号的字符串中。可能有空格，也可能没有空格。可能根本没有运算符。

我必须解析很多行，因此我不想每次都派生出一个新进程，这就是为什么我更喜欢只使用 Bash 的解决方案。这是对现有 Bash 脚本的补充，不需要移植到其他 shell，并且它在 Bash 5.2 上运行，所以我可以使用可能有用的现代 Bash 功能。

IFS=\" read -a arr <<<"$var"很好，因为它知道如何处理转义引号，如果我只需要处理单引号或双引号而不是两者，我就可以让它工作。就目前而言，我只是希望我不必在 shell 脚本中编写整个标记器算法，并且有一些我尚未考虑过的功能组合可以可靠地解析它。

2 个回答

Voted

choroba · Answer 1 · 2025-02-02T05:43:38+08:00

您需要编写一个解析器：根据当前字符逐个字符地读取字符串，扩展当前单词或开始一个新单词。保留一个标志以指示解析器位于引号字符串内。

像这样：

#!/bin/bash
set -eu

validate() {
    size=$1
    shift

    if ((size != $#)) ; then
        echo "Not OK # Wrong size: $size $#"
        return
    fi

    ok=1
    for ((j=1; j <= size; ++j)) ; do
        [[ ${!j} = ${arr[j-1]} ]] || ok=0
    done
    if ((ok)) ; then
        echo $i OK
    else
        echo $i Not OK
    fi
}


i=0
for var in 'name="value"'                \
           "name != '!value='"           \
           '"na=me" = value'             \
           'name >= value'               \
           'name'                        \
           'name = "escaped \"quotes\""' \
           "name = \"nested 'quotes'\""  \
           "name = 'nested \"quotes\"'"  \
; do
    arr=()
    left=""
    quoted=""
    while ! (( ${#arr[@]} )) && [[ $var ]] ; do
        char=${var:0:1}
        var=${var:1}
        if [[ $char = [\'\"] ]] ; then
            if [[ -z $left ]] ; then
                quoted=$char
            elif [[ $quoted = $char ]] ; then
                quoted=${quoted:0:-1}
                arr=("$left")
            else
                echo 'Unexpected quote' >&2
                exit 1
            fi
        elif [[ $char = [\ =!\>] && -z $quoted ]] ; then
            arr=("$left")
            if [[ $char != ' ' ]] ; then
                var=$char$var
            fi
        else
            left+=$char
        fi
    done
    arr=("$left")

    op=""
    arr[1]=""
    while [[ $var && ! ${arr[1]} ]] ; do
        char=${var:0:1}
        var=${var:1}
        if [[ $char = [=\<\>\!] ]] ; then
            op+=$char
        elif [[ $char = ' ' ]] ; then
            if [[ $op ]] ; then
                arr[1]=$op
            else
                :
            fi
        else
            arr[1]=$op
            var=$char$var
        fi
    done
    [[ -z ${arr[1]} ]] && unset arr[1]

    if [[ $var ]] ; then
        quoted=""
        right=""
        while [[ $var ]] ; do
            char=${var:0:1}
            var=${var:1}
            if [[ $quoted ]] ; then
                if [[ $char = ${quoted: -1} ]] ; then
                    quoted=${quoted:0:-1}
                elif [[ $char = \\ ]] ; then
                    nextchar=${var:0:1}
                    if [[ $nextchar = ${quoted: -1} ]] ; then
                        right+=$nextchar
                        var=${var:1}
                    fi
                else
                    right+=$char
                fi
            elif [[ $char = [\"\'] ]] ; then
                quoted+=$char
            else
                right+=$char
            fi
        done
        arr+=("$right")
    fi

    case $i in
        (0) exp=(name = value) ;;
        (1) exp=(name '!=' '!value=') ;;
        (2) exp=(na=me = value) ;;
        (3) exp=(name '>=' value) ;;
        (4) exp=(name) ;;
        (5) exp=(name = 'escaped "quotes"') ;;
        (6) exp=(name = "nested 'quotes'") ;;
        (7) exp=(name = 'nested "quotes"') ;;
        (*) exit 1 ;;
    esac

    validate ${#arr[@]} "${exp[@]}"

    ((++i))
done

它正确地解析了您给出的所有示例，但还远未完成（它不检查未关闭的引号等）。

Fravadona · Answer 2 · 2025-02-02T09:50:08+08:00

正如 @choroba 指出的那样，您可能无法避免编写词法分析器来拆分输入字符串。幸运的是，使用 ERE 逐个标记“扫描”它们就足够了。我想说使用具有“非捕获”和“命名”组的语言是最好的选择，但如果您坚持使用 Bash，那么您可以这样做：

#!/bin/bash

vn='[[:alnum:]_]+'                    # a varname token
sq="'[^']*'"                          # a single-quoted string token
dq='"(\\.|[^"\\])*"'                  # a double-quoted string token
op='[^[:space:][:alnum:]_"'"']+"      # an operator token

for var in ...; do

arr=()
while [[ $var =~ ^[[:space:]]*($vn|$sq|$dq|$op) ]]
do
    var=${var:${#BASH_REMATCH[0]}}    # remove the matched part from $var
    tok=${BASH_REMATCH[1]}            # get the matched token
    case ${tok:0:1} in
    ( \" ) tok=${tok//\\\"/\"} ;&     # decode the double-quoted strings
    ( \' ) tok=${tok:1:-1}     ;;     # unquote the quoted strings
    esac
    arr+=("$tok")
done

[[ $var =~ ^[[:space:]]*$ ]] || exit  # exit on parsing error

declare -p arr

done

^{注意：需要 bash 4.3+}

输出：

declare -a arr=([0]="name" [1]="=" [2]="value")
declare -a arr=([0]="name" [1]="!=" [2]="!value=")
declare -a arr=([0]="na=me" [1]="=" [2]="value")
declare -a arr=([0]="name" [1]=">=" [2]="value")
declare -a arr=([0]="name")
declare -a arr=([0]="name" [1]="=" [2]="escaped \"quotes\"")
declare -a arr=([0]="name" [1]="=" [2]="nested 'quotes'")
declare -a arr=([0]="name" [1]="=" [2]="nested \"quotes\"")

供读者修复：

我对“变量名”和“运算符”做了一些假设。基本上，“变量名”由字母数字/下划线字符组成；而“运算符”是不包含空格的任何内容（单词和带引号的字符串除外）。
虽然正则表达式使用双引号字符串中存在的任何反斜杠转义序列，但仅\"被解释；您可能还需要实现其他转义序列的解码。

如何提取变量内的带引号的字符串？

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

如何提取变量内的带引号的字符串？

2 个回答

相关问题