user56834 Asked: 2021-10-26 03:50:44 +0800 CST2021-10-26 03:50:44 +0800 CST 2021-10-26 03:50:44 +0800 CST linux 标准流中的单个“原子”到底是什么? 772 从概念上讲,流是“字符”或“原子”的序列,即二进制流是 0 和 1 的序列。但是在 Linux 标准流中,如果我编写一个询问“读取”的 bash 脚本,那么我认为它将单行(以“ENTER”结尾)视为“字符”,但我不确定。这向我表明单个“原子”是一个字符串,并且原子由 ENTER 分隔。另外,我假设对于其他程序,它们不会将字符串作为输入,而是其他数据类型。 我在正确的轨道上吗?标准流中的原子/字符是什么?程序如何知道如何将文件分割成原子? linux files 1 个回答 Voted Best Answer ilkkachu 2021-10-26T04:22:35+08:002021-10-26T04:22:35+08:00 从根本上说,管道/文件/套接字或您连接的任何东西 stdin/stdout/stderr 都是bytes的流(*) 。相关的系统调用是read()and write(),它们的 POSIX 描述说: write() 函数应尝试将 nbyte 字节从 buf 指向的缓冲区写入文件 [...] 和 read() 函数应尝试从与打开的文件描述符、fildes、[...] 关联的文件中读取 nbyte 字节。 此外,POSIX 将字节定义为完全等于 octet,即八位单元。 因此,一个八位字节是您一次可以读取或写入的最小单位,如果您愿意的话,就是一个“原子”。 但是各种实用程序的作用是另一回事。read默认情况下读取一行,但库函数也是如此fgets()。根据外壳程序,您可能可以要求read只读取固定数量的字节,例如在 Bash 中: $ echo foo | ( read -n 1 a; echo "first: $a"; read -n 1 b; echo "second: $b" ) first: f second: o 虽然请注意,Bashread遵守语言环境并将计数作为characters,这可能是多字节的。但这并不能阻止我们读取单个字节: $ echo äöä | (read -n 1 a; echo "first: $a"; LC_ALL=C read -n 1 b; echo "second: $b" ) first: ä second: � (* 还有数据报套接字,它们仍然是字节粒度的,但也保留在套接字中发送的消息(零个或多个字节)之间的边界。您可能可以将正确设置的数据报套接字插入到 stdin/stdout/stderr,但几乎没有人这样做过。)
从根本上说,管道/文件/套接字或您连接的任何东西 stdin/stdout/stderr 都是bytes的流(*) 。相关的系统调用是
read()
andwrite()
,它们的 POSIX 描述说:和
此外,POSIX 将字节定义为完全等于 octet,即八位单元。
因此,一个八位字节是您一次可以读取或写入的最小单位,如果您愿意的话,就是一个“原子”。
但是各种实用程序的作用是另一回事。
read
默认情况下读取一行,但库函数也是如此fgets()
。根据外壳程序,您可能可以要求read
只读取固定数量的字节,例如在 Bash 中:虽然请注意,Bash
read
遵守语言环境并将计数作为characters,这可能是多字节的。但这并不能阻止我们读取单个字节:(* 还有数据报套接字,它们仍然是字节粒度的,但也保留在套接字中发送的消息(零个或多个字节)之间的边界。您可能可以将正确设置的数据报套接字插入到 stdin/stdout/stderr,但几乎没有人这样做过。)