Bagas Sanjaya Asked: 2017-12-20 05:48:21 +0800 CST2017-12-20 05:48:21 +0800 CST 2017-12-20 05:48:21 +0800 CST 为什么 Linux 使用 LF 作为换行符? 772 据我所知,每个操作系统都有不同的方式来标记行尾 (EOL) 字符。商业操作系统对 EOL 使用回车(Windows 上的回车和换行,Mac 上只有回车)。另一方面,Linux 仅对 EOL 使用换行符。 为什么 Linux 不使用 EOL 的回车(而只使用换行符)? files history 4 个回答 Voted Best Answer jlliagre 2017-12-20T07:11:24+08:002017-12-20T07:11:24+08:00 Windows 使用CRLF它是因为它从 MS-DOS 继承了它。 MS-DOS 使用CRLF它是因为它受到 CP/M 的启发,而 CP/M 已经在使用CRLF. CP/M 和 80 年代及更早的许多操作系统都使用CRLF它,因为它是结束在电传打字机上打印的一行的方式(返回到行首并跳到下一行,就像普通打字机一样)。这简化了文件的打印,因为不需要或不需要预处理。还有一些机械要求使单个字符无法使用。可能需要一些时间才能让托架返回并使压板旋转。 Gnu/Linux 使用LF,因为它是 Unix克隆。1 Unix 从一开始就使用单个字符 ,LF以节省空间并标准化为规范的行尾,使用两个字符效率低下且模棱两可。这种选择是从早在 1964 年就使用它的 Multics 继承而来的。内存、存储、CPU 功率和带宽非常稀少,因此每行节省一个字节是值得的。打印文件时,驱动程序将换行(换行)转换为目标设备所需的控制字符。 LF首选,CR因为后者仍然有特定的用法。通过将打印的字符重新定位到同一行的开头,它允许覆盖已经键入的字符。 Apple 最初决定也使用单个字符,但出于某种原因选择了另一个字符:CR. 当它切换到 BSD 界面时,它移动到LF. 这些选择与操作系统是否商业化无关。 1这是你的问题的答案。 user32929 2017-12-21T03:03:40+08:002017-12-21T03:03:40+08:00 关于“换行符”的维基百科文章追溯了 1964 年选择 NL 作为行终止符(或分隔符)到 Multics;不幸的是,这篇文章很少引用来源,但没有理由怀疑这是正确的。与 CR-LF 相比,这种选择有两个明显的好处:节省空间和设备独立性。 主要替代方案 CR-LF 源自用于在电传打字机上物理移动纸架的控制代码,其中 CR 将使纸架返回其初始位置,LF 将旋转纸辊以将打印位置向下移动一个线。这两个控制字符出现在可追溯到 1924 年且显然仍在使用的 ITA2 代码中(参见 Wikipedia);显然,ITA2 将它们从可追溯到 1901 年的 Baudot 代码的 Murray 变体中提取出来。 对于年轻读者来说,值得注意的是,在大型机传统中,没有换行符;相反,文件是一系列记录,这些记录要么是固定长度(通常是 80 个字符,基于穿孔卡片),要么是可变长度;可变长度记录通常在每条记录的开头存储一个字符数。如果您的大型机文件由一系列可变长度记录组成,每个记录都包含任意二进制内容,那么将其无损转换为 UNIX 样式文件可能是一个棘手的转换。 当然,Linux 只是对 Unix 的重新实现,而 Unix 的许多设计决策都来自 Multics,所以看起来关键决策是在 1964 年做出的。 Walter Mitty 2017-12-22T10:48:09+08:002017-12-22T10:48:09+08:00 其他答案将继承链追溯到 1960 年代和电传打字机。但这是他们没有涵盖的一个方面。 在电传打字机时代,有时需要做一些称为过度罢工的事情。Overstriking 有时被用来掩盖密码,因为删除密码是不可行的。其他时候,为了得到一个不在字体中的符号,会进行过度加粗。例如,字母 O 和斜线产生一个新符号。 尽管有时会使用退格键,但通过在没有换行的情况下输入回车来实现过度打击。出于这个原因,unix 人决定不使用回车作为行分隔符,而是选择换行。这对于阅读使用 CRLF 约定生成的文本也很有效。CR 被吞下,LF 成为分隔符。 R.. GitHub STOP HELPING ICE 2017-12-20T20:43:20+08:002017-12-20T20:43:20+08:00 虽然您可以将历史问题翻译成关于 C 语言的问题,但 Linux 和所有符合 POSIX 或 POSIX 的系统必须使用LF(或至少无论 C'\n'字符是什么)作为换行符的原因是交集的结果C 和 POSIX 的要求。虽然 C 允许“文本文件”和“二进制文件”有所不同(事实上,文本文件可以是基于记录的,由一系列行记录组成,除了在 DOS/Windows 上'\n'翻译到/从CR/之类的不那么奇特的东西LF),POSIX 要求文本模式和二进制模式的行为相同。这很大程度上是命令行工具喜欢的原因cat功能强大/有用;如果他们只使用二进制文件,或者只使用文本,但不能同时使用两者,它们的效果会小得多。
Windows 使用CRLF它是因为它从 MS-DOS 继承了它。
MS-DOS 使用CRLF它是因为它受到 CP/M 的启发,而 CP/M 已经在使用CRLF.
CP/M 和 80 年代及更早的许多操作系统都使用CRLF它,因为它是结束在电传打字机上打印的一行的方式(返回到行首并跳到下一行,就像普通打字机一样)。这简化了文件的打印,因为不需要或不需要预处理。还有一些机械要求使单个字符无法使用。可能需要一些时间才能让托架返回并使压板旋转。
Gnu/Linux 使用LF,因为它是 Unix克隆。1
Unix 从一开始就使用单个字符 ,LF以节省空间并标准化为规范的行尾,使用两个字符效率低下且模棱两可。这种选择是从早在 1964 年就使用它的 Multics 继承而来的。内存、存储、CPU 功率和带宽非常稀少,因此每行节省一个字节是值得的。打印文件时,驱动程序将换行(换行)转换为目标设备所需的控制字符。
LF首选,CR因为后者仍然有特定的用法。通过将打印的字符重新定位到同一行的开头,它允许覆盖已经键入的字符。
Apple 最初决定也使用单个字符,但出于某种原因选择了另一个字符:CR. 当它切换到 BSD 界面时,它移动到LF.
这些选择与操作系统是否商业化无关。
1这是你的问题的答案。
关于“换行符”的维基百科文章追溯了 1964 年选择 NL 作为行终止符(或分隔符)到 Multics;不幸的是,这篇文章很少引用来源,但没有理由怀疑这是正确的。与 CR-LF 相比,这种选择有两个明显的好处:节省空间和设备独立性。
主要替代方案 CR-LF 源自用于在电传打字机上物理移动纸架的控制代码,其中 CR 将使纸架返回其初始位置,LF 将旋转纸辊以将打印位置向下移动一个线。这两个控制字符出现在可追溯到 1924 年且显然仍在使用的 ITA2 代码中(参见 Wikipedia);显然,ITA2 将它们从可追溯到 1901 年的 Baudot 代码的 Murray 变体中提取出来。
对于年轻读者来说,值得注意的是,在大型机传统中,没有换行符;相反,文件是一系列记录,这些记录要么是固定长度(通常是 80 个字符,基于穿孔卡片),要么是可变长度;可变长度记录通常在每条记录的开头存储一个字符数。如果您的大型机文件由一系列可变长度记录组成,每个记录都包含任意二进制内容,那么将其无损转换为 UNIX 样式文件可能是一个棘手的转换。
当然,Linux 只是对 Unix 的重新实现,而 Unix 的许多设计决策都来自 Multics,所以看起来关键决策是在 1964 年做出的。
其他答案将继承链追溯到 1960 年代和电传打字机。但这是他们没有涵盖的一个方面。
在电传打字机时代,有时需要做一些称为过度罢工的事情。Overstriking 有时被用来掩盖密码,因为删除密码是不可行的。其他时候,为了得到一个不在字体中的符号,会进行过度加粗。例如,字母 O 和斜线产生一个新符号。
尽管有时会使用退格键,但通过在没有换行的情况下输入回车来实现过度打击。出于这个原因,unix 人决定不使用回车作为行分隔符,而是选择换行。这对于阅读使用 CRLF 约定生成的文本也很有效。CR 被吞下,LF 成为分隔符。
虽然您可以将历史问题翻译成关于 C 语言的问题,但 Linux 和所有符合 POSIX 或 POSIX 的系统必须使用
LF
(或至少无论 C'\n'
字符是什么)作为换行符的原因是交集的结果C 和 POSIX 的要求。虽然 C 允许“文本文件”和“二进制文件”有所不同(事实上,文本文件可以是基于记录的,由一系列行记录组成,除了在 DOS/Windows 上'\n'
翻译到/从CR
/之类的不那么奇特的东西LF
),POSIX 要求文本模式和二进制模式的行为相同。这很大程度上是命令行工具喜欢的原因cat
功能强大/有用;如果他们只使用二进制文件,或者只使用文本,但不能同时使用两者,它们的效果会小得多。