为什么在传递 {} 时重载解析更喜欢 std::nullptr_t 而不是类？

Question

echo

Asked: 2023-08-26 11:36:39 +0800 CST2023-08-26 11:36:39 +0800 CST 2023-08-26 11:36:39 +0800 CST

将文件每一行的后半部分替换为另一个文件中相应行的后半部分[关闭]

772

我有两个文件 A 和 B。两个文件中的每一行都被视为一个项目。每个项目的格式都是固定的，由键和描述组成，并用空格分隔。如下例所示。

UASPCH-XCF02-XXB1CF02-UACF02-ih_CW100M2_0000027_0000104 /users/documents/ark

第一部分UASPCH-XCF02-XXB1CF02-UACF02-ih_CW100M2_0000027_0000104是关键，最后一部分/users/documents/ark是描述。文件 A 和 B 分别有 1000 和 100000 个项目。在我们的示例中，每个键都可以分为两部分：索引（例如：UASPCH-XCF02-XXB1CF02-UACF02-ih_CW100M2）和时间戳（例如：0000027_0000104）。时间戳中的数字没有任何规则。索引和时间戳之间的字符固定为_。每个键都是唯一的，每个索引在同一个文件中也是唯一的。文件 A 中包含的每个索引也出现在文件 B 中，并且具有不同的时间戳。如下一个简单的例子所示。

文件A

UASPCH-XCF02-SP062-XXB2CF02-UACF02-ih_CW100M2_0000000_0000119 /users/documents/ark1
UASPCH-XCF02-XXB1CF02-UACF02-ih_CW100M2_0000027_0000104 /users/documents/ark2

文件B

UASPCH-XCF02-SP062-XXB2CF02-UACF02-ih_CW100M2_0000002_0000118 /users/documents/ark3
UASPCH-XCF02-XXB1CF02-UACF02-ih_CW100M2_0000026_0000107 /users/documents/ark4
UASPCH-XXM16-XXXB1M16-XUAM16-ih_CW100M3_0000039_0000129 /users/documents/ark5

我想将文件B中相同索引对应的描述替换为文件A中索引对应的描述。示例中的结果如下所示。

文件B

UASPCH-XCF02-SP062-XXB2CF02-UACF02-ih_CW100M2_0000002_0000118 /users/documents/ark1
UASPCH-XCF02-XXB1CF02-UACF02-ih_CW100M2_0000026_0000107 /users/documents/ark2
UASPCH-XXM16-XXXB1M16-XUAM16-ih_CW100M3_0000039_0000129 /users/documents/ark5

如何实现这个目标？

4 个回答

Voted

potong · Answer 1 · 2023-08-26T14:49:58+08:00

potong

2023-08-26T14:49:58+08:002023-08-26T14:49:58+08:00

这可能对你有用（GNU sed）：

sed -E 's|([^_]*_).*( .*)|/^\1/s# .*#\2#|' fileA | sed -f - fileB

从 fileA 构建 sed 脚本以应用于 fileB。

fileA 中的每一行都被转换为匹配和替换。索引用作匹配，其描述用于替换，然后应用于 fileB。匹配的行将具有 fileA 中的描述。

注意：在两个替换命令中使用备用分隔符。如果描述可能包含该#字符，则使用任何描述中都不存在的另一个字符作为分隔符。

3

Kaz · Answer 2 · 2023-08-26T12:43:50+08:00

TXR Lisp中的解决方案：

$ txr subst.tl filea fileb
UASPCH-XCF02-SP062-XXB2CF02-UACF02-ih_CW100M2_0000002_0000118 /users/documents/ark1
UASPCH-XCF02-XXB1CF02-UACF02-ih_CW100M2_0000026_0000107 /users/documents/ark2
UASPCH-XXM16-XXXB1M16-XUAM16-ih_CW100M3_0000039_0000129 /users/documents/ark5

代码：

(tree-bind (filea fileb) *args*
  (let ((h (hash)))
    (with-stream (s (open-file filea))
      (whilet ((line (get-line s)))
        (match `@a-@{b}_@{c}_@d @path` line
          (set [h `@a-@b-@c`] path))))
    (with-stream (s (open-file fileb))
      (whilet ((line (get-line s)))
        (match `@a-@{b}_@{c}_@d @path` line
          (put-line `@a-@{b}_@{c}_@d @(or [h `@a-@b-@c`] path)`))))))

或者，使用awk宏来扫描文件；但除此之外同样的方法：

(awk
  (:let (h (hash)))
  ((= fnr nr)
   (match `@a-@{b}_@{c}_@d @path` rec
     (set [h `@a-@b-@c`] path))
   (next))
  ((match `@a-@{b}_@{c}_@d @path` rec
    (prn `@a-@{b}_@{c}_@d @(or [h `@a-@b-@c`] path)`))))

ufopilot · Answer 3 · 2023-08-26T15:06:30+08:00

Best Answer

ufopilot

2023-08-26T15:06:30+08:002023-08-26T15:06:30+08:00

awk '
    NR==FNR{
        split($1,p,"_")
        a[p[1]"_"p[2]] = $NF
        next
    } 
    split($1,b,"_") && (b[1]"_"b[2] in a){ 
        $NF = a[b[1]"_"b[2]]
    }1
' FileA FileB

UASPCH-XCF02-SP062-XXB2CF02-UACF02-ih_CW100M2_0000002_0000118 /users/documents/ark1
UASPCH-XCF02-XXB1CF02-UACF02-ih_CW100M2_0000026_0000107 /users/documents/ark2
UASPCH-XXM16-XXXB1M16-XUAM16-ih_CW100M3_0000039_0000129 /users/documents/ark5

1

Ed Morton · Answer 4 · 2023-08-26T20:46:37+08:00

使用任何 awk：

$ cat tst.awk
{ key = substr($1,1,length($1)-16) }
NR == FNR {
    sub(/[^ ]+/,"")
    map[key] = $0
    next
}
key in map {
    $0 = $1 map[key]
}
{ print }

$ awk -f tst.awk FileA FileB
UASPCH-XCF02-SP062-XXB2CF02-UACF02-ih_CW100M2_0000002_0000118 /users/documents/ark1
UASPCH-XCF02-XXB1CF02-UACF02-ih_CW100M2_0000026_0000107 /users/documents/ark2
UASPCH-XXM16-XXXB1M16-XUAM16-ih_CW100M3_0000039_0000129 /users/documents/ark5

即使您的任何“描述”包含空格，上述内容也将起作用，例如给出以下输入：

$ head File[AB]
==> FileA <==
UASPCH-XCF02-SP062-XXB2CF02-UACF02-ih_CW100M2_0000000_0000119 /users/saved documents/this    is     interesting ark1
UASPCH-XCF02-XXB1CF02-UACF02-ih_CW100M2_0000027_0000104 /users/saved documents/ark2

==> FileB <==
UASPCH-XCF02-SP062-XXB2CF02-UACF02-ih_CW100M2_0000002_0000118 /users/saved documents/ark3
UASPCH-XCF02-XXB1CF02-UACF02-ih_CW100M2_0000026_0000107 /users/saved documents/and    so     is   this   ark4
UASPCH-XXM16-XXXB1M16-XUAM16-ih_CW100M3_0000039_0000129 /users/saved documents/and   this   too  ark5

我们仍然得到所需的输出：

$ awk -f tst.awk FileA FileB
UASPCH-XCF02-SP062-XXB2CF02-UACF02-ih_CW100M2_0000002_0000118 /users/saved documents/this    is     interesting ark1
UASPCH-XCF02-XXB1CF02-UACF02-ih_CW100M2_0000026_0000107 /users/saved documents/ark2
UASPCH-XXM16-XXXB1M16-XUAM16-ih_CW100M3_0000039_0000129 /users/saved documents/and   this   too  ark5

将文件每一行的后半部分替换为另一个文件中相应行的后半部分[关闭]

使用 <font color="#xxx"> 突出显示 html 中的代码