将复制活动的序列号添加到 Blob

Question

deschen

Asked: 2024-10-09 04:22:16 +0800 CST2024-10-09 04:22:16 +0800 CST 2024-10-09 04:22:16 +0800 CST

删除文本中第 n 次出现之后的所有字符串（包括第 n 次出现）

772

我承认这些正则表达式问题之前已经被问过，但我仍然在努力寻找可行的解决方案（即使在咨询了 ChatGPT 之后）。

因此输出应该是：output <- c("test1", "test2 | ", "test3 | test3", "test4 | test4")

当带有最多两个“|”文本时，我可以让它工作str_remove(text, "( \\| [^\\|]+$)")，但是这不适用于该匹配模式出现两次以上的情况。

3 个回答

Voted

Jonathan V. Solórzano · Answer 1 · 2024-10-09T05:25:24+08:00

Jonathan V. Solórzano

2024-10-09T05:25:24+08:002024-10-09T05:25:24+08:00

一种解决方案可能是提取感兴趣的字符串，而不是删除不需要的部分。为此，您可以使用正则表达式匹配感兴趣的三种情况，按长度降序排列：[:graph:]+ \\| [:graph:]+、[:graph:]+ \\|或[:graph:]+。

library(stringr)
str_extract(text, "^([:graph:]+ \\| [:graph:]+|[:graph:]+ \\||[:graph:]+)")
[1] "test1"         "test2 |"       "test3 | test3" "test4 | test4"

1

Wiktor Stribiżew · Answer 2 · 2024-10-09T06:13:48+08:00

Best Answer

Wiktor Stribiżew

2024-10-09T06:13:48+08:002024-10-09T06:13:48+08:00

您可以使用

library(stringr)
n <- 2
str_replace(text, paste0("^(.*?(?: \\| .*?){", n-1, "}) \\| .*"), "\\1")

在哪里

\| 是你的分隔符
.*?匹配任何文本（除换行符外，(?s)在模式开头添加以使其跨行匹配）
str_replace要求在删除匹配值后保留第一个组值。

在线查看R 演示（这里是最终的正则表达式演示）。

1

bobble bubble · Answer 3 · 2024-10-09T07:10:58+08:00

bobble bubble

2024-10-09T07:10:58+08:002024-10-09T07:10:58+08:00

另一个想法是使用sub具有这种模式的基本 R 函数。

output <- sub('^([^|]*\\|[^|]*?)\\s*\\|.*', '\\1', text)

请参阅 regex101 上的此演示或tio.run 上的 R 演示

所需部分由第一组捕获，该组也用作替换。消耗字符串的其余部分（将被删除）。管道符号之间是除之外的否定字符类字符。之前的惰性字符用于防止以空格结尾。.*| [^|]*?\s*|

要将其调整为第 n 次出现，请将其替换[^|]*\\|为(?:[^|]*\\|){n}（regex101 demo with n=2）。如果由于缺乏对惰性量词的支持而无法正常工作（演示有效），请附上,perl=T。

1

删除文本中第 n 次出现之后的所有字符串（包括第 n 次出现）

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

为什么这个简单而小的 Java 代码在所有 Graal JVM 上的运行速度都快 30 倍，但在任何 Oracle JVM 上却不行？

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

何时应使用 std::inplace_vector 而不是 std::vector？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

删除文本中第 n 次出现之后的所有字符串（包括第 n 次出现）

3 个回答

相关问题