关于【regex】的问题- 第1页

Anonymous

Asked: 2025-04-09 05:03:11 +0800 CST

折叠 mkfs 输出的最简单方法（退格键和空格键）

5

我将 mkfs 的输出转储到日志文件中，但它以交互方式显示其进程，打印退格键以使光标返回，然后打印空格以删除，然后再次执行退格键并打印新消息。

在日志里看起来乱糟糟的。以下是我找到的办法，把一组 BS 合并到单个空间里。

# echo -e "AAABBB\x08\x08\x08\x08\x08\x08CCC" | sed -e 's/\(\x08\)\1\+/\1/g' -e 's/\(\x08\)/x/'
AAABBBxCCC

但是有没有更好的方法可以用正则表达式将 BSs + 空格 + BSs ... 序列折叠成单个空格字符？我可以编写二进制文件来实现，但在我看来，这有点矫枉过正……

示例输入为

# echo -e "123\x08\x08\x08   \x08\x08\x08456    789"

转换为

123 456    789

更新：一开始我说的是 mkfs 输出的。我给你看个例子，方便你理解字符集。

mke2fs 1.47.0 (5-Feb-2023)
fs_types for mke2fs.conf resolution: 'ext4'
Discarding device blocks:       0/16463361572864/1646336               done                            
Filesystem label=data_volume
OS type: Linux
Block size=4096 (log=2)
Fragment size=4096 (log=2)
Stride=0 blocks, Stripe width=0 blocks
412080 inodes, 1646336 blocks
82316 blocks (5.00%) reserved for the super user
First data block=0
Maximum filesystem blocks=1686110208
51 block groups
32768 blocks per group, 32768 fragments per group
8080 inodes per group
Filesystem UUID: c27f71c7-2d9e-4a33-9d54-449ab3e2f378
Superblock backups stored on blocks: 
    32768, 98304, 163840, 229376, 294912, 819200, 884736, 1605632
Allocating group tables:  0/51     done                            
Writing inode tables:  0/51     done                            
Creating journal (16384 blocks): done
Writing superblocks and filesystem accounting information:  0/51     done

退格键未显示在上面的窗口中（复制粘贴后它们被删除）。

Wang Xinghe

Asked: 2025-04-08 22:47:39 +0800 CST

正则表达式排除字符串末尾的字符

5

例如，我有一些文本

aaa foo
bbb foo
ccc foo?
ddd foo
eee foo?
...

我想搜索所有foo不带 s 的字符?，例如上面文本中的第 1,2,4 行。该怎么做？

JH Park

Asked: 2025-04-08 05:38:53 +0800 CST

使用 sed 和正则表达式从文件中提取字符串

8

我想询问如何使用 sed 和正则表达式从文件中提取特定字符串。

以下是输入文本文件（testfile.txt）的示例：

# This file contains a short description of the columns in the
# meta-analysis summary file, named '/some/output/directory/result.txt'

# (Skipping some comment lines...)

# Input for this meta-analysis was stored in the files:
# --> Input File 1 : /some/input/directory/cohort1/dataset1_chrAll.regenie.txt
# --> Input File 2 : /some/input/directory/cohort2/subdir1/chrAll-out.txt
# --> Input File 3 : /some/input/directory/cohort2/subdir2/chrAll-out_ver2.txt
# --> Input File 4 : /some/input/directory/cohort3/resfile.txt
# --> Input File 5 : /some/input/directory/cohort4/regenie_res_chrAll.txt

从这个文件，我想提取输入文件名的列表，因此结果应该是这样的：

/some/input/directory/cohort1/dataset1_chrAll.regenie.txt
/some/input/directory/cohort2/subdir1/chrAll-out.txt
/some/input/directory/cohort2/subdir2/chrAll-out_ver2.txt
/some/input/directory/cohort3/resfile.txt
/some/input/directory/cohort4/regenie_res_chrAll.txt

以下是我尝试过的：

尝试 1

这是我使用的初始命令。

cat testfile.txt | sed -e 's/\/some\/input\/directory\/([A-z0-9\/\.\-]*)\.txt/$1/g'

结果：

sed: -e expression #1, char 55: Invalid range end

尝试 2

经过一番搜索后，我尝试使用反斜杠转义括号。

cat testfile.txt | sed -e 's/\/some\/input\/directory\/\([A-z0-9\/\.\-]*\).txt/$1/g'

结果：

sed: -e expression #1, char 56: Invalid range end

所以它并没有解决问题。

尝试 3

我也尝试过转义括号。

cat testfile.txt | sed -e 's/\/some\/input\/directory\/\(\[A-z0-9\/\.\-\]\*\)\.txt/$1/g'

结果：

# This file contains a short description of the columns in the
# meta-analysis summary file, named '/some/output/directory/result.txt'

# (Skipping some comment lines...)

# Input for this meta-analysis was stored in the files:
# --> Input File 1 : /some/input/directory/cohort1/dataset1_chrAll.regenie.txt
# --> Input File 2 : /some/input/directory/cohort2/subdir1/chrAll-out.txt
# --> Input File 3 : /some/input/directory/cohort2/subdir2/chrAll-out_ver2.txt
# --> Input File 4 : /some/input/directory/cohort3/resfile.txt
# --> Input File 5 : /some/input/directory/cohort4/regenie_res_chrAll.txt

这并没有引发错误，但这不是我想要的。

尝试 4

最后，我尝试添加 -r 选项，但不转义括号或方括号。

cat testfile.txt | sed -re 's/\/some\/input\/directory\/([A-z0-9\/\.\-]*)\.txt/$1/g'

结果：

sed: -e expression #1, char 55: Invalid range end

第一次尝试时显示相同的错误消息。

我想问我的命令行中存在什么问题以及是否有任何可能的解决方案。

谢谢。

Jerome

Asked: 2025-04-06 12:35:08 +0800 CST

关于 ruby 处理模式的开始和结束的困惑[重复]

2

在以下情况下，需要通过正则表达式从字符串中提取父项

input_string = "02150 ESPOO"
input_string[pattern]

无论pattern正则表达式是否是书尾（开始和结束），都会出现两种截然不同的结果/^\d{5}$//\d{5}/

在后一种情况下，我得到了期望的结果，而前一种情况则返回nil。为什么 bookened 正则表达式会失败？

Benny Brudner

Asked: 2025-04-04 03:13:07 +0800 CST

正则表达式匹配正则表达式字符串中所有未转义的“$”

8

我想建立一个正则表达式，以匹配代表$正则表达式的字符串中的所有未转义的内容。

在这种情况下，如果字符后面包含相同数量的反斜杠，则该字符不会被转义（每对反斜杠代表反斜杠字符本身，因此下一个字符不会被转义）。

我想出了这个模式： (?<!\\)(\\{2})*\$

解释：虽然这也会匹配前面的反斜杠$，但这是我找到的最接近的解决方案。这确保了前面的反斜杠数量相等，$而前面没有其他反斜杠，因此反斜杠数量为奇数。

我的问题是，似乎我需要 2 个连续的非消耗组才能使反斜杠总数相等，但这是不可能的。还有其他方法可以做到这一点吗？

Jo Makein

Asked: 2025-03-08 02:15:21 +0800 CST

如何在 Notepad++ 中的 N 个符号前换行？

9

如何使用正则表达式查找/替换来换行，以便每行不会超过 20 个符号？

我发现了这个：

Find: \s(?<=.{20})
Replace: $0\r\n

这将是完美的，但是如果单词在 20 个符号之前开始，那么它会将大于 20 个符号的单词留在行中。

我需要一个类似的表达式，但是如果最后一项使行变大，它也应该转到新行，因此最后一行总是会有<20个符号。

我知道我很久以前就做过这个，也许是用了一些插件，但现在我无法让它工作。我该怎么做？

InStackOfHelp

Asked: 2025-03-06 15:35:21 +0800 CST

如何删除字符前面的单词以及字符本身

6

我正在使用 IMPORTXML 来获取一些数据，然后使用正则表达式来提取一些文本。我想要提取的部分是姓名。

它总是跟在“全名：”（减去引号）后面。名字后面总是有一个单词，后面跟着另一个冒号。这个单词可以是发音、语言学、类型，或者其他任何词。

我能得到的最接近的公式是这个：

=IFERROR(REGEXEXTRACT(REGEXREPLACE(JOIN(" ", IMPORTXML(B13, "//div[@id='meta']")), "\s+", " "), "Full Name:\s*([A-Za-z]+(?:[-'\s][A-Za-z]+)*)"), "")

不幸的是，最后一句话还是留下来了。

例如如果你有：

全名：亚伯拉罕·林肯昵称：诚实的亚伯。

我只想让它拉出亚伯拉罕·林肯。我有这个公式输出：

亚伯拉罕·林肯昵称

其他示例：

全名： John Smith-Rogers 完成：
全名：David Ben-Williams 序言：
全名：Sean O'Brian 昵称：
全名： D'Andre Ayton 时间：
全名：Andy Van Slyke 姓名：

各自的输出：

约翰·史密斯-罗杰斯
戴维·本·威廉姆斯
肖恩·奥布莱恩
安德烈·艾顿
安迪·范·斯莱克

实例： https://www.baseball-reference.com/players/l/lopezal01.shtml

公式应输出：Alfonso Ramon Lopez

https://www.baseball-reference.com/players/r/ruthba01.shtml

公式应输出：George Herman Ruth

我还需要做什么才能确保 O'Brien 和 Smith-Rogers 这样的名字不受影响？

Judith

Asked: 2025-02-28 18:17:42 +0800 CST

Regex Powershell：查找一个字符串，然后替换另一个字符串的第 n 次出现

5

我有 200 个包含文本行的文件，它们可能看起来像以下任何一种模式：

{hello} "this is an example" {{ config(alias="customertable") }}
{{hello}} "this is an example" {{ config ( alias = 'monthly revenue') }}
{ { config ( alias = 'record 3 breaking news') } } {{hello}} "this is an example"
{{hello}} 'this is an example' { { config( alias = "designer bags 4 u") }} {{hello}} "this is an example"

单词alias后面的字符串始终用单引号或双引号引起来。我想将_link放在该字符串的末尾，因此它看起来像这样：“customertable_link”或“monthly revenue_link”，并想使用 powershell。我希望返回整行，因此第四个示例应该返回以下内容：

{{hello}}'这是一个例子'{ { config( alias = "designer bags 4 u_link") }} {{hello}}“这是一个例子”

例如，在一行上搜索字符串别名，然后在"或'的第二个实例左侧添加_link。

这是我目前所拥有的：

$string -replace 'alias=(?:[^"]*"){2}', '$0_link'

对于第一个例子来说，这几乎是可行的（只是引用的位置不对），但我无法正确理解。任何帮助都将不胜感激！

Samul

Asked: 2025-02-28 07:52:00 +0800 CST

带有后视搜索子字符串的正则表达式

7

我需要正则表达式方面的帮助。我想将所有出现的5%或7%或183%或替换99%为``（空字符串），但如果出现的是0%或100%（可能有几十个我想保留的出现），我不想做任何事情。

例如：

aaa 0% bbb应该变成aaa 0% bbb（没有改变）

然而

aaa 40% bbb应该成为aaa bbb

我想出了一个使用负向后视的正则表达式，但它只会删除%符号，而不会删除数字。这是正则表达式：

替换(?<!(0|100))%为 ``（空字符串）

上述正则表达式应用于字符串时aaa 40% bbb将返回aaa 40 bbb。

Suhani Bhatia

Asked: 2025-02-27 13:42:45 +0800 CST

如何使用正则表达式 replaceAll 从 Scala 中的字符串中删除方括号和反引号

5

我试图用以下公式字符串替换[& ：]

col_formula:regexp_replace( regexp_replace([`cellid`], "(.*)_N", "N"), "_(.*)", "")
 
var replaced_col_formula= col_formula.replaceAll("/[\\[\\]']+/g", "")
println(s"replaced_col_formula:$replaced_col_formula")
 
replaced_col_formula:regexp_replace( regexp_replace([`cellid`], "(.*)_N", "N"), "_(.*)", "")

我期待的是下面这样的

replaced_col_formula:regexp_replace( regexp_replace(cellid, "(.*)_N", "N"), "_(.*)", "")

折叠 mkfs 输出的最简单方法（退格键和空格键）

正则表达式排除字符串末尾的字符

使用 sed 和正则表达式从文件中提取字符串

尝试 1

尝试 2

尝试 3

尝试 4

关于 ruby 处理模式的开始和结束的困惑[重复]

正则表达式匹配正则表达式字符串中所有未转义的“$”

如何在 Notepad++ 中的 N 个符号前换行？

如何删除字符前面的单词以及字符本身

Regex Powershell：查找一个字符串，然后替换另一个字符串的第 n 次出现

带有后视搜索子字符串的正则表达式

如何使用正则表达式 replaceAll 从 Scala 中的字符串中删除方括号和反引号

为什么 C++20 概念会导致循环约束错误，而老式的 SFINAE 不会？

VScode 自动卸载扩展的问题（Material 主题）

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

何时应使用 std::inplace_vector 而不是 std::vector？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

问题[regex](coding)

尝试 1

尝试 2

尝试 3

尝试 4