AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题 / 1161951
Accepted
Zulakis
Zulakis
Asked: 2024-07-03 19:59:01 +0800 CST2024-07-03 19:59:01 +0800 CST 2024-07-03 19:59:01 +0800 CST

sort 如何比较字符串?

  • 772

我希望 bash sort 能够像这样比较字符串:

  • 从第一个字符开始(两个字符串)
  • 如果字符相等,则继续下一个字符
  • 如果不相等,则返回大于/小于的结果给排序算法
  • 如果没有更多字符,则返回等于

出于某种原因,这似乎不是事实。

让我们接受以下输入:

a
b
.
-

这是由 bash sort 排序的

-
.
a
b

现在,输入

b.de
bb.de

我期望排序结果如下:

b.de
bb.de

因为第一个字符是相等的,并且对于第二个字符来说,.它在前面b(如在第一个测试中所见)。

由于某种原因,情况并非如此,字符串的排序如下:

bb.de
b.de

为什么会sort出现这样的行为?有没有办法让它表现得“如预期”?

我已经使用 python 测试了同样的例子,python 的排序与预期一致。

bash
  • 2 2 个回答
  • 155 Views

2 个回答

  • Voted
  1. Best Answer
    Jasen
    2024-07-03T21:07:59+08:002024-07-03T21:07:59+08:00

    默认情况下,排序会进行区域感知排序,即使用您所在地区的词典编纂规则。请参阅 strcoll(3)

    ltrace(3) 给了我这个:

    strcoll("b.de", "bb.de") = 20

    定位感知比较似乎将字符串拆分成单词并对其进行排序。由于单词从不以“.”开头,因此 sort 会看到长度为 0 的单词并将其放在列表的开头。但是“.”在单词中是被允许的,例如:“Jr.”“Ph.D”

    如果您需要按字节比较,请导出 LC_COLLATE=C 或 LC_COLLATE=POSIX

    • 3
  2. Matthew Ife
    2024-07-03T20:22:59+08:002024-07-03T20:22:59+08:00

    我检查了该coreutils包,如果你不提供任何参数,它看起来(最终)使用 Cstrcmp例程。唯一不正确的情况是行中的值可以解释为整数。

    其手册页指出:

    在 glibc 中,与大多数其他实现一样,返回值是从 s1 中最后一个比较的字节中减去 s2 中最后一个比较的字节的算术结果。(如果两个字符相等,则该差为 0。)

    这意味着和strcmp确实已经到达最后一个字符。bb.deb.de

    也就是说if 'd' < 'e'(至少以 ascii 表示)哪个if 100 < 101是正确的。

    • -1

相关问题

  • Mac OS X:从 python 脚本中更改 $PATH

  • Bash 脚本:要求脚本以 root 身份运行(或使用 sudo)

  • crontab ifconfig 什么都不输出

  • 使用命令行工具按排序顺序计算重复项

  • 是否有 bash 等效于 ruby​​ 的“一些内容#{foo}”?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    新安装后 postgres 的默认超级用户用户名/密码是什么?

    • 5 个回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve