如何从命令行仅安装安全更新？关于如何管理更新的一些提示

Question

Insideup

Asked: 2020-10-26 09:34:33 +0800 CST2020-10-26 09:34:33 +0800 CST 2020-10-26 09:34:33 +0800 CST

如果特定行包含子字符串，则输出其他子字符串

772

我想在文件的每一行上查找一个字符串，如果它存在，则返回一个不同的特定字符串。

在发布解决方案后，此帖子已被编辑，以帮助更好地说明问题（因此一些较早的回复不再适用）

我有这个代码：

Numlines=$(grep "" -c File.txt)
for (( line=1; line<=$Numlines; line++ )) ; do 
awk -v line="$line" 'NR==line ...???

我正在寻找的字符串是style-name="T. 如果该字符串在 for 循环中的一行中，则返回T. 中的行File.txt可能包含类似的字符串style-name="T2"，在这种情况下，我只想返回2. 该字符串不在中的每一行的相同位置File.txt，所以我认为我不能在中使用字段名称awk。

IIRC，"/style-name\=\"T/"应该提供匹配，但如果我在我的代码中使用它，它要么给我一个错误，要么什么都不返回。也许脚本会检查它是否可以产生匹配，如果可以，使用第二行代码来获取字符串，尽管我认为awk可以通过单行代码完成它，一旦前驱代码被计算出来出去。

这是一个示例File.txt：

<TEST1>     <text:p text:style-name="P4">Hello<text:span text:style-name="T2">world</text:span></text:p>
<tyi.ggg>     <text:p text:style-name="P9">Hi<text:span text:style-name="T16">there</text:span></text:p>
<TEST2>     <text:p text:style-name="P540">0 <text:s/>oooh yeah<text:s text:c="2"/>kool-aid<text:s text:c="12"/>0:00</text:p>

第一行（第一次通过for循环）的输出应该是 2。第二行（第二次通过for循环）的输出应该是 16。第三行的输出应该是什么。

2 个回答

Voted

BeastOfCaerbannog · Answer 1 · 2020-10-26T11:18:01+08:00

我使用以下文本作为示例（修改了 OP 提供的示例）：

<TEST1>     <text:p text:style-name="P4">Hello<text:span text:style-name="T2">world</text:span><text:span text:style-name="T3"></text:p>
<TEST2>     <text:p text:style-name="P540">0 <text:s/>oooh yeah<text:s text:c="2"/>kool-aid<text:s text:c="12"/>0:00</text:p>
<ANOTHER_TEST15>     <text:p text:style-name="P9">Hi<text:span text:style-name="T16">there</text:span></text:p>

我想出了这种grep和sed命令的组合，它可能不是最有效的，但相对容易理解：

grep -n 'style-name="T' File.txt | grep -P -o '^\d+:<\w*>|style-name="T\d+' | sed -z 's/style-name="//g; s/:/ /; s/\nT/ T/g'

分解命令：

grep -n 'style-name="T' File.txtstyle-name="T添加匹配的行号。

输出是：

1:<TEST1>     <text:p text:style-name="P4">Hello<text:span text:style-name="T2">world</text:span><text:span text:style-name="T3"></text:p>
3:<ANOTHER_TEST15>     <text:p text:style-name="P9">Hi<text:span text:style-name="T16">there</text:span></text:p>

grep -P -o '^\d+:<\w*>|style-name="T\d+'使用先前的输出作为输入，并将行号与内部:<和>旁边的文本以及旁边的数字相匹配style-name="T。每个匹配项都打印在新行中。

输出是：
```
1:<TEST1>
style-name="T2
style-name="T3
3:<ANOTHER_TEST15>
style-name="T16
```
sed -z 's/style-name="//g; s/:/ /; s/\nT/ T/g'使用先前的输出作为输入，并删除style-name="和替换( ):之前的换行符，并用一个空格后跟( ) 替换。T\nTT T

输出是：
```
1 <TEST1> T2 T3
3 <ANOTHER_TEST15> T16
```

steeldriver · Answer 2 · 2020-10-26T11:50:42+08:00

我看不到使用 shell 循环多次处理文件的任何价值。

在 GNU awk 中，您可以使用该函数将子模式捕获到数组中match。所以你可以简单地做：

gawk 'match($0,/style-name="T([0-9]+)"/,m){print m[1]}' File.txt

在常规 POSIX awk 中，该match函数没有此扩展功能，但您可以改用它的RSTARTandRLENGTH来提取所需的子字符串：

awk 'match($0,/style-name="T[0-9]+"/){print substr($0,RSTART+13,RLENGTH-14)}' File.txt

[如果由于某种未指定的原因，您必须在每次迭代中针对特定行号的 shell 循环中执行此操作，那么您可以将规则更改为NR==line && match(...) {...}]。

如果您需要为每条记录提取多个值，则可以将其包装在一个遍历ex 的循环中：T#match$0

gawk '
  {test=$1}       # save the `TEST#` before we start the `match` loop 
  {
    T=""
    while(match($0,/style-name="T([0-9]+)"/,m)) {
      T = T=="" ? m[1] : T OFS m[1]     # append the `T#`
      $0 = substr($0,RSTART+RLENGTH)    # remove the part we already matched
    }
  } 
  T !="" {
    print NR,test,T    # print the record (line) number, `TEST#`, and accumulated `T#`s
  }
' File.txt
1 <TEST1> 2
2 <TEST2> 16

RSTART要使用我之前展示的andRLENGTH方法在非 GNU awk 中执行相同的操作，请将while循环替换为：

while(match($0,/style-name="T[0-9]+"/)) {
  t = substr($0,RSTART+13,RLENGTH-14)
  T = T=="" ? t : T OFS t
  $0 = substr($0,RSTART+RLENGTH)    # remove the part we already matched
}

如果特定行包含子字符串，则输出其他子字符串

如何运行 .sh 脚本？

如何安装 .tar.gz（或 .tar.bz2）文件？

如何列出所有已安装的软件包

无法锁定管理目录 (/var/lib/dpkg/) 是另一个进程在使用它吗？

如果特定行包含子字符串，则输出其他子字符串

2 个回答

相关问题