AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / computer / 问题 / 1790814
Accepted
Just Me
Just Me
Asked: 2023-06-23 17:37:46 +0800 CST2023-06-23 17:37:46 +0800 CST 2023-06-23 17:37:46 +0800 CST

正则表达式:删除其他 2 个标签内的所有 html 标签,除了 <a href=.*?"> 和 </a>

  • 772

我想删除其他 2 个标签内的所有 html 标签,除了<a href=.*?">和</a>

例如:

<p class="mb-40px">Another blending </h2>option is to all the <div>brushstrokes to show. In the painting of trees above, I didn’t spend much time trying to <a href=https://orfun.com/acrylic class="color-bebe" target="_new">blend the colors</a>. I simply mix each color and apply it without fussing with it.</p>

输出:

<p class="mb-40px">Another blending option is to all the brushstrokes to show. In the painting of trees above, I didn’t spend much time trying to <a href=https://orfun.com/acrylic class="color-bebe" target="_new">blend the colors</a>. I simply mix each color and apply it without fussing with it.</p>

我的正则表达式不是很好:

寻找:<p class="mb-40px">.*?</p>(?!</a>)|(?!<a href=.*?">)

notepad++
  • 2 2 个回答
  • 53 Views

2 个回答

  • Voted
  1. Best Answer
    Toto
    2023-06-23T18:32:34+08:002023-06-23T18:32:34+08:00
    • Ctrl+H
    • 找什么:(?:<p class="mb-40px">|\G).*?\K(?:<a href=.+?</a>(*SKIP)(*FAIL)|<(?:(?!/?p).)+?>)
    • 用。。。来代替:LEAVE EMPTY
    • 勾选 环绕
    • 选择正 则表达式
    • Replace all

    解释:

    (?:                     # non capture group
        <p class="mb-40px">     # literally
      |                       # OR
        \G                      # restart from last match position
    )                       # end group
    .*?                     # 0 or more any character
    \K                      # forget all we have seen until this position
    (?:                     # non capture group
        <a href=.+?</a>         # <a href=...
        (*SKIP)(*FAIL)          # skip this match and consider it has failled
      |                       # OR
        <(?:(?!/?p).)+?>)       # any tag that is not </p>
    )                       # end group
    

    截图(之前):

    在此输入图像描述

    截图(之后):

    在此输入图像描述

    • 1
  2. Just Me
    2023-06-24T06:08:29+08:002023-06-24T06:08:29+08:00

    寻找: (?:<p class="mb-40px">|\G).*?\K(?:<a href=.+?</a>(*SKIP)(*FAIL)|<(?:(?!/?p class="mb-40px">|/p>).)+?>)

    替换为: LEAVE EMPTY

    或者:

    寻找: <p class="mb-40px">(?:[^<]+|<(?!/?[ap]|a\s[^>]>))?</p>(*SKIP)(FAIL)|<(?!/?[ap]|a\s[^>]>)[^>]+>

    替换为: LEAVE EMPTY


    元素 [ap] 是匹配“a”或“p”的字符类。在正则表达式中,使用字符类允许您为模板中的给定位置指定一组可能的字符。

    在我们的例子中,[ap] 用于 <(?!/?[ap]|a\s[^>]*>) 部分,我们在其中检查以 '<' 开头且后面不带 ' 的标签a' 或 'p'。通过使用 [ap],我们表明我们希望“<”之后的下一个字母是“a”或“p”。因此,任何不以“a”或“p”开头的标签都将包含在正则表达式匹配中并被替换。

    我希望这个解释能够澄清 [ap] 元素在提议的正则表达式中的使用。

    • 0

相关问题

  • 在 Notepad++“另存为...”对话框中保留当前文件类型/扩展名

  • 计算文本字符串中的逗号并添加新行

  • 删除信息

  • Notepad++ 删除直到冒号替换所有行

  • NotePad++ 用户定义语言不显示条件语句

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何减少“vmmem”进程的消耗?

    • 11 个回答
  • Marko Smith

    从 Microsoft Stream 下载视频

    • 4 个回答
  • Marko Smith

    Google Chrome DevTools 无法解析 SourceMap:chrome-extension

    • 6 个回答
  • Marko Smith

    Windows 照片查看器因为内存不足而无法运行?

    • 5 个回答
  • Marko Smith

    支持结束后如何激活 WindowsXP?

    • 6 个回答
  • Marko Smith

    远程桌面间歇性冻结

    • 7 个回答
  • Marko Smith

    子网掩码 /32 是什么意思?

    • 6 个回答
  • Marko Smith

    鼠标指针在 Windows 中按下的箭头键上移动?

    • 1 个回答
  • Marko Smith

    VirtualBox 无法以 VERR_NEM_VM_CREATE_FAILED 启动

    • 8 个回答
  • Marko Smith

    应用程序不会出现在 MacBook 的摄像头和麦克风隐私设置中

    • 5 个回答
  • Martin Hope
    Vickel Firefox 不再允许粘贴到 WhatsApp 网页中? 2023-08-18 05:04:35 +0800 CST
  • Martin Hope
    Saaru Lindestøkke 为什么使用 Python 的 tar 库时 tar.xz 文件比 macOS tar 小 15 倍? 2021-03-14 09:37:48 +0800 CST
  • Martin Hope
    CiaranWelsh 如何减少“vmmem”进程的消耗? 2020-06-10 02:06:58 +0800 CST
  • Martin Hope
    Jim Windows 10 搜索未加载,显示空白窗口 2020-02-06 03:28:26 +0800 CST
  • Martin Hope
    andre_ss6 远程桌面间歇性冻结 2019-09-11 12:56:40 +0800 CST
  • Martin Hope
    Riley Carney 为什么在 URL 后面加一个点会删除登录信息? 2019-08-06 10:59:24 +0800 CST
  • Martin Hope
    zdimension 鼠标指针在 Windows 中按下的箭头键上移动? 2019-08-04 06:39:57 +0800 CST
  • Martin Hope
    jonsca 我所有的 Firefox 附加组件突然被禁用了,我该如何重新启用它们? 2019-05-04 17:58:52 +0800 CST
  • Martin Hope
    MCK 是否可以使用文本创建二维码? 2019-04-02 06:32:14 +0800 CST
  • Martin Hope
    SoniEx2 更改 git init 默认分支名称 2019-04-01 06:16:56 +0800 CST

热门标签

windows-10 linux windows microsoft-excel networking ubuntu worksheet-function bash command-line hard-drive

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve