IttayD Asked: 2013-10-25 04:11:30 +0800 CST2013-10-25 04:11:30 +0800 CST 2013-10-25 04:11:30 +0800 CST 在 linux 命令行中进行统计的工具 772 假设我运行一个命令,该命令在行上输出空格分隔的值。其中一些是数字。有没有可以用来计算这些数字的平均值、中位数、标准差的实用程序?类似'cut'的东西,但输出这些统计数据。 linux 3 个回答 Voted Best Answer Ion 2013-10-25T05:33:43+08:002013-10-25T05:33:43+08:00 查看 st:https ://github.com/nferraz/st或 sta(推荐):https ://github.com/simonccarter/sta 来自 GitHub: 站长 来自命令行界面 (CLI) 的简单统计,快速。描述 这是一个轻量级、快速的工具,用于从命令行计算基本描述性统计信息。受 https://github.com/nferraz/st的启发,这个项目的不同之处在于它是用 C++ 编写的,允许在给定更大的非平凡数据集的情况下更快地计算统计数据。 增加的内容包括有偏与无偏估计器的选择以及使用补偿变体算法的选项。 给定一个包含 1,000,000 个升序数字的文件,使用 Bash 时间在 2.5GHz 双核 MacBook 上进行的简单测试显示 sta 只需不到一秒即可完成,而使用 st 则需要 14 秒。 dpmcmlxxvi 2014-07-16T18:24:34+08:002014-07-16T18:24:34+08:00 您也可以考虑使用clistats。它是一个高度可配置的命令行界面工具,用于计算分隔输入数字流的统计信息。 输入/输出选项 输入数据可以来自文件、标准输入或管道 输出可以写入文件、标准输出或管道 输出使用以“#”开头的标头来启用到 gnuplot 的管道 解析选项 信号、文件结尾或基于空行的检测以停止处理 可以设置注释和分隔符 列可以从处理中过滤掉 可以根据数值约束从处理中过滤掉行 可以根据字符串约束从处理中过滤掉行 可以跳过初始标题行 可处理固定行数 可以忽略重复的分隔符 行可以重新整形为列 严格强制只处理相同大小的行 包含列标题的行可用于标题输出统计信息 统计选项 汇总统计(计数、最小值、平均值、最大值、标准差) 协方差 相关性 最小二乘偏移 最小二乘斜率 直方图 过滤后的原始数据 注意:我是作者。 user357896 2016-06-04T15:53:13+08:002016-06-04T15:53:13+08:00 R语言将是完美的。它在终端中运行,它是免费的并且可能是最流行的统计语言。因此,它有大量关于如何做整洁事情的文档,包括您要求的文档。
查看 st:https ://github.com/nferraz/st或 sta(推荐):https ://github.com/simonccarter/sta
来自 GitHub:
您也可以考虑使用clistats。它是一个高度可配置的命令行界面工具,用于计算分隔输入数字流的统计信息。
输入/输出选项
解析选项
统计选项
注意:我是作者。
R语言将是完美的。它在终端中运行,它是免费的并且可能是最流行的统计语言。因此,它有大量关于如何做整洁事情的文档,包括您要求的文档。