替换第三个值

Question

roediGERhard

Asked: 2023-09-26 07:38:33 +0800 CST2023-09-26 07:38:33 +0800 CST 2023-09-26 07:38:33 +0800 CST

使用 sed “格式化”每个单词的前两个字母

772

我正在尝试获取一个sed命令来格式化（HTML）纯文本输入中每个单词的前两个字母。我想输入纯文本，并用标签将前两个字母标记为粗体，<b>以形成一个表示相同文本但格式如下所示的 html 文件： https://www.reddit.com/media?url = https%3A%2F%2Fi.redd.it%2Fzwp75sv6dgqb1.png

不幸的是，我无法获得前两个字母，但它仅适用于第一个字母。所以我得到了这个：

sed -e 's/\(\b\w{1,2}\)/<b>\1<\/b>/g' test.txt > test.html

但它没有按预期工作

input: this is a test
output: this is a test
intended: <b>th</b>is <b>is</b> <b>a</b> <b>te</b>st

我不知道为什么，但这个命令确实可以只标记第一个字母：

sed -e 's/\(\b\w\)/<b>\1<\/b>/g' test.txt > test.html

为什么不是另一个我在 {1,(or)2} 时间场合标记 \w(ord 字符) 的地方，即使 regex101 显示我应该是对的（https://regex101.com/r/hBb6Yt/4）？

1 个回答

Voted

dave_thompson_085 · Answer 1 · 2023-09-26T09:58:45+08:00

Best Answer

dave_thompson_085

2023-09-26T09:58:45+08:002023-09-26T09:58:45+08:00

像(capturegroup),{min,max}是一个扩展的正则表达式功能，并且必须使用反斜杠，sed除非您sed有并且使用了扩展正则表达式的选项（GNU -E -r --regexp-extended；BSD/Mac？-E）。此外，您也不需要此处的捕获组：

sed -e 's/\b\w\{1,2\}/<b>&<\/b>/g' in >out
sed -Ee 's/\b\w{1,2}/<b>&<\/b>/g' in >out

2

使用 sed “格式化”每个单词的前两个字母

如何减少“vmmem”进程的消耗？

从 Microsoft Stream 下载视频

Google Chrome DevTools 无法解析 SourceMap：chrome-extension

Windows 照片查看器因为内存不足而无法运行？

支持结束后如何激活 WindowsXP？

远程桌面间歇性冻结

子网掩码 /32 是什么意思？

鼠标指针在 Windows 中按下的箭头键上移动？

VirtualBox 无法以 VERR_NEM_VM_CREATE_FAILED 启动

应用程序不会出现在 MacBook 的摄像头和麦克风隐私设置中

使用 sed “格式化”每个单词的前两个字母

1 个回答

相关问题