Postfix 在特定端口上接受邮件

Question

Asked: 2024-02-14 05:05:48 +0800 CST2024-02-14 05:05:48 +0800 CST 2024-02-14 05:05:48 +0800 CST

如何检测电子邮件主题中的非拉丁文字？

772

在运行 Postfix 的邮件服务器上，我想拒绝主题中使用一些非拉丁文字的邮件，特别是阿拉伯语和西里尔语，因为我的用户（家庭）都不会说使用它们的语言。

我尝试使用 PCRE 标头检查，如下所示：

/Subject:.*\p{Arabic}/i WARN Arabic detected

不幸的是，当我向服务器发送测试邮件时，这不会触发警告。我已经WARN使用规则验证了消息确实出现在系统日志中/Subject:.*Test/i WARN Test，该规则确实触发了。

如何使用 Postfix 检测主题中的阿拉伯语和西里尔语？

为了完整起见，main.cf我在我的内容中包括header_checks这样的内容：

header_checks = pcre:/etc/postfix/header_checks

2 个回答

Voted

Esa Jokinen · Answer 1 · 2024-02-14T06:05:44+08:00

根据RFC 5322, 3.6.5，Subject标头定义为

subject = "Subject:" unstructured CRLF

RFC 5322, 2.2.1定义了“非结构化”：

本规范中的一些字段主体简单地定义为“非结构化”（在第 3.2.5 节中指定为任何可打印的 US-ASCII 字符加空白字符），没有进一步的限制。

由于标头中只允许使用 US-ASCII 字符Subject，因此任何非 US-ASCII 字符都必须编码为 US-ASCII，RFC 2047为此定义了一个广泛使用的标准草案。例如，使用“Quoted-Printable”又名“Q”编码（第 4.2 节），

西里尔字母Тест变成Subject: =?UTF-8?Q?=D0=A2=D0=B5=D1=81=D1=82?=
阿拉伯语متحان变成Subject: =?UTF-8?Q?=D9=85=D8=AA=D8=AD=D8=A7=D9=86?=.

PCRE 中的匹配header_checks应针对该编码进行。但是，使用 PCRE 等正则表达式匹配unicode 块非常困难，如下表所示。

统一码块	范围	QP开始	QP结束
西里尔	U+0400..U+04FF	`=D0=80`	`=D3=BF`
阿拉伯	U+0600..U+06FF	`=D8=80`	`=DB=BF`

Postfix 内置内容检查文档中也提到了此限制：

Postfix header/body 检查的限制

标头/正文检查不会解码消息标头或消息正文内容。例如，如果消息正文中的文本是 BASE64 编码 ( RFC 2045 )，那么您的正则表达式必须与 BASE64 编码形式匹配。同样，具有编码非 ASCII 字符 ( RFC 2047 ) 的消息标头需要以其编码形式进行匹配。

我建议改用 SpamAssassin 规则。TextCat语言猜测器甚至ok_languages可以从消息正文中检测语言。

Zac67 · Answer 2 · 2024-02-14T05:46:11+08:00

RFC 2047定义了如何将非 ASCII 字符集编码到主题标头中。

本质上，它使用=?charset?encoding?encoded-text?=wherecharset可以是为 MIME 定义的任何字符集，例如UTF-8，encoding是B用于 base64 或Q用于引用的可打印，encoded-text是实际的主题行。只需查看这些编码消息之一的源代码，您就会明白这一点。

如何检测电子邮件主题中的非拉丁文字？

新安装后 postgres 的默认超级用户用户名/密码是什么？

SFTP 使用什么端口？

命令行列出 Windows Active Directory 组中的用户？

什么是 Pem 文件，它与其他 OpenSSL 生成的密钥文件格式有何不同？

如何确定bash变量是否为空？

如何检测电子邮件主题中的非拉丁文字？

2 个回答

相关问题