我有一个 python 程序,它正在慢慢地生成一些输出。
我想将其捕获到一个文件中,但我也认为我可以用 tail 实时观看它。
所以在一个终端我正在做:
python myprog.py > output.txt
在另一个终端:
tail -f output.txt
但在 python 程序运行时,尾巴似乎没有向我显示任何内容。
如果我按 ctrl-c 来终止 python 脚本,突然尾部output.txt
开始填满。但不是在 python 运行时。
我究竟做错了什么?
您可能还需要显式刷新缓冲区,以便在生成时通过管道传输。这是因为输出通常仅在管道的缓冲区填满(我相信以千字节为单位)以及标准输入消息结束时打印。这可能是为了节省读/写。您可以在每次打印后执行此操作,或者如果您正在循环,则在循环中最后一次打印后执行此操作。
使用无缓冲标志运行 python:
然后将实时打印输出。
与其尝试跟踪实时文件,不如使用
tee
。它被用来做你想做的事情。来自男士 T 恤:
所以在你的情况下你会运行:
编辑:正如其他人指出的那样,这个答案将遇到 OP 最初遇到的相同问题,除非
sys.stdout.flush()
如 Davey 接受的答案中所述在 python 程序中使用。我在发布此答案之前所做的测试并未准确反映 OP 的用例。tee
仍然可以用作显示输出同时写入文件的替代方法——尽管不是最佳方法,但 Davey 的答案显然是正确且最佳的答案。术语:在这种情况下,任何地方都没有管道。(我编辑了问题来解决这个问题)。管道是一种不同类型的文件(内核中的缓冲区)。
这是到常规文件的重定向。
C stdio 和 Python 在连接到 TTY 时默认使 stdout 行缓冲,否则它是全缓冲的。行缓冲意味着缓冲区在换行后被刷新。全缓冲意味着它只有在满时才被刷新以对操作系统可见(即通过
write()
系统调用)。您最终会看到输出,一次可能是 4kiB 的块。(我不知道默认的缓冲区大小。)这通常更有效,意味着对实际磁盘的写入更少。但对于交互式监控来说不是很好,因为输出隐藏在写入进程的内存中,直到它被刷新。
在 Stack Overflow 上,有一个Disable output buffering Python Q&A,其中列出了许多在 Python 中将无缓冲(或行缓冲?)输出输出到 stdout 的方法。问题本身总结了答案。
选项包括运行
python -u
(或者我想放在#!/usr/bin/python -u
脚本的顶部),或使用该PYTHONUNBUFFERED
程序的环境变量。或在某些/所有print
功能之后显式刷新,如@Davey 的回答所建议的那样。其他一些程序也有类似的选项,例如 GNU grep 有
--line-buffered
,而 GNUsed
有-u
/--unbuffered
,用于这样的用例,或者例如管道 python 程序的输出。例如./slowly-output-stuff | grep --line-buffered 'foo.*bar'
。当我使用 tail 时,它几乎总是跟踪日志文件,例如(电子邮件)消息。
这可能有点离谱,但为什么不在 Python 代码中使用 // 而不是使用日志记录模块
print
?(来自 PSL)注意,日志格式器可以配置为不输出与传统日志相关的所有时间和 ID 代码。print()
write()
输出可以配置为转到(数据)文件,并且由于没有缓冲延迟或重定向,tail 可以愉快且即时地工作。
问候