使用另一个数据帧填充 Pandas 数据帧中的缺失值

Question

Asked: 2024-04-07 18:29:16 +0800 CST2024-04-07 18:29:16 +0800 CST 2024-04-07 18:29:16 +0800 CST

如何将字母、数字、破折号、分号、点和逗号匹配在一起，但如果没有数字和字母则不匹配？

772

例如这是我的方法

import re
text = "ONE:;TWO:,,d,-;THREE:fsdfsd;FOUR:43879293847;FIVE:dsa. dsa, 56;SIX: ;SEVEN:,,,;EIGHT:--;"

def parser(string):
    prepare = []
    string = list(filter(None, string.split(";")))
    for i in string:
        s = i.split(":")
        j = len(list(filter(None, s)))
        if j == 2 and re.match("^[A-Za-z0-9_-]*$",s[1]):
            prepare.append(i)

    final = ";".join(prepare) + ";"
    return final
        
print(parser(text))

它只返回THREE, FOURand EIGTH，但我也想包含TWOandFIVE和排除EIGTH。也许这不是实现我的目标的最佳方法，但如何将TWOand包含FIVE在其中而不包含SEVENand EIGTH？

先感谢您。

1 个回答

Voted

The fourth bird · Answer 1 · 2024-04-07T20:24:49+08:00

对于现有代码，您可以使用 re.search 和字符类检查第二部分是否包含数字或数字[A-Za-z0-9]

import re

text = "ONE:;TWO:,,d,-;THREE:fsdfsd;FOUR:43879293847;FIVE:dsa. dsa, 56;SIX: ;SEVEN:,,,;EIGHT:--;"


def parser(string):
    prepare = []
    string = list(filter(None, string.split(";")))
    for i in string:
        s = i.split(":")
        j = len(list(filter(None, s)))
        if j == 2 and re.search("[A-Za-z0-9]", s[1]):
            prepare.append(i)

    final = ";".join(prepare) + ";"
    return final


print(parser(text))

输出

TWO:,,d,-;THREE:fsdfsd;FOUR:43879293847;FIVE:dsa. dsa, 56;

作为单个正则表达式的替代方案：

[\w .,-]+:[\w .,-]*[^\W_][\w .,-]*;

解释

[\w .,-]+匹配任何列出的字符 1 次以上
:匹配冒号
[\w .,-]*匹配 0+ 次任何列出的字符
[^\W_]匹配不包括下划线的单个单词字符
[\w .,-]*;匹配 0+ 次任何列出的字符，后跟分号

查看正则表达式演示和Python 演示

例子：

import re

text = "ONE:;TWO:,,d,-;THREE:fsdfsd;FOUR:43879293847;FIVE:dsa. dsa, 56;SIX: ;SEVEN:,,,;EIGHT:--;"
regex = re.compile(r"[\w .,-]+:[\w .,-]*[^\W_][\w .,-]*;")


def parser(string):
    return "".join(re.findall(regex, string))


print(parser(text))

输出

TWO:,,d,-;THREE:fsdfsd;FOUR:43879293847;FIVE:dsa. dsa, 56;

如何将字母、数字、破折号、分号、点和逗号匹配在一起，但如果没有数字和字母则不匹配？

为什么双破折号 (--) 会导致此 MariaDB 子句评估为 true？

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

ELF 重定位的应用顺序在哪里指定？

为什么 GCC 生成有条件执行 SIMD 实现的代码？

Selenium urllib.error.HTTPError：HTTP 错误 404：未找到

Box::new() 会从堆栈复制到堆吗？

sizeof("string") 的正确输出是什么？

使用 <font color="#xxx"> 突出显示 html 中的代码

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

C++17 中 std::byte 只能按位运算？

如何将字母、数字、破折号、分号、点和逗号匹配在一起，但如果没有数字和字母则不匹配？

1 个回答

相关问题