我正在尝试缩减一个庞大的数据库,以便将相关信息用于 JSON 文件。它有一些很长的行(每行约 400 个字符)和几千个条目,我需要在其中省略所有内容(
,包括所有内容http
,或者所有内容,MISSING
具体取决于行。
大多数行不包含()[]
信息,但都包含http
信息。http
信息始终遵循()
包含它的行上的信息。
这是一个例子,出于明显的原因,我切断了长度。
PCSH10160 Attack of the Toy Tanks (3.61+!) [3.69] http://zeu
PCSH10162 Paradox Soul http://zeus.dl.playstation.net/cdn
PCSH10146 Hoggy2 http://zeus.dl.playstation.net/cdn/HP2005/
PCSB01394 Mekabolt http://zeus.dl.playstation.net/cdn/EP0
PCSH10186 Himno http://zeus.dl.playstation.net/cdn/HP2
PCSG01285 MELLKISS http://zeus.dl.playstation.net/cdn/JP0
PCSB01365 Habroxia http://zeus.dl.playstation.net/cdn/EP5
PCSE01423 Color Slayer http://zeus.dl.playstation.net/cdn
PCSE01396 Habroxia http://zeus.dl.playstation.net/cdn/UP4
PCSG01127 Sen no Hatou, Tsukisome no Kouki http://zeus.dl
PCSB01396 Tic-Tac-Letters by POWGI http://zeus.dl.playsta
PCSH10203 Gravity Duck http://zeus.dl.playstation.net
PCSH10175 Crossovers by POWGI http://zeus.dl.playstation
PCSH10169 Mixups by POWGI (3.61+!) [3.69] http://zeus.dl
PCSH10167 One Word by POWGI http://zeus.dl.playstation
PCSH10166 Word Search by POWGI http://zeus.dl.playsta
PCSH10179 Word Wheel by POWGI http://zeus.dl.playstation
PCSH10180 Wordsweeper by POWGI http://zeus.dl.playsta
PCSH10168 Word Sudoku by POWGI http://zeus.dl.playsta
PCSB00625 SENRAN KAGURA: Bon Appétit! Stacked Soundtrack ht
最终结果应该是
PCSH10160 Attack of the Toy Tanks
PCSH10162 Paradox Soul
PCSH10146 Hoggy2
PCSB01394 Mekabolt
PCSH10186 Himno
PCSG01285 MELLKISS
PCSB01365 Habroxia
PCSE01423 Color Slayer
PCSE01396 Habroxia
PCSG01127 Sen no Hatou, Tsukisome no Kouki
PCSB01396 Tic-Tac-Letters by POWGI
PCSH10203 Gravity Duck
PCSH10175 Crossovers by POWGI
PCSH10169 Mixups by POWGI
PCSH10167 One Word by POWGI
PCSH10166 Word Search by POWGI
PCSH10179 Word Wheel by POWGI
PCSH10180 Wordsweeper by POWGI
PCSH10168 Word Sudoku by POWGI
PCSB00625 SENRAN KAGURA: Bon Appétit! Stacked Soundtrack
我不关心 ID 和标题之间的间距,因为可以手动修复。
哎呀。我搞砸了。运行提供的表达式后,我注意到有几行包含单词MISSING
和各种信息。有没有办法将它包含在 and 旁边的表达式(
中http
?
或者作为一个单独的表达方式,它只需要尊重这种情况,因为我担心“缺失”这个词出现在某个地方的标题中,并且它会超出上述点。
PCSG00742 Kiss Ato
PCSG00744 One Piece: Burning Blood - Gold Edition
PCSG00747 Zero Escape: Zero Time Dilemma
PCSG00748 Jikkyou Powerful Pro Yakyuu 2016 MISSING KO5ifR1dQ+d7
PCSG00750 Kai-ri-Sei Million Arthur
PCSG00751 Arcana Famiglia -La Storia Della Arcana Famiglia- Ancora
PCSG00752 Touhou Soujinengi V
PCSG00753 Eikoku Tantei Mysteria: The Crown MISSING KO5ifR1dQ+d7
PCSG00756 I am Setsuna
我需要省略一切来自
(
和超越,或一切来自http
和超越菜单“搜索”>“替换”(或Ctrl+ H)
将“查找内容”设置为
\(.*?$|http.*?$
将“替换为”留空
启用“正则表达式”
点击“全部替换”
之前:
之后:
笔记:
\(.*?$|http.*?$|MISSING.*?$
在评论中的对话之后,最快的正则表达式是
\h+(?:\(|http|MISSING).+$
进一步阅读
提高性能(感谢@IsmaelMiguel)并回答新的要求。
\h+(?:\(|http|MISSING).+$
LEAVE EMPTY
. matches newline
解释:
截图(之前):
截图(之后):