我将每个月测量的零件数据收集到全年的单个文件中。使用“从文件夹查询”时,我能够将所有数据汇总、格式化和排序,但有一个例外。每个零件都有“A”和“B”版本。不幸的是,由于生产顺序,有时“B”零件在“A”零件之前测量。在这种情况下,我不想按时间排序,因为顺序会是这样的,例如,A、B、A、B、B、A、A、B、A、B。我希望它总是将“A”零件放在“B”零件之前。零件每天测量两次,所以我不能先按天排序,然后再按零件字母排序,因为这样就会是这样的,例如,A、A、B、B、A、A、B、B。我该如何对数据进行排序,使其按天排序,然后按时间排序,然后覆盖时间以保持 A、B、A、B 模式?
更复杂的是,有时数据收集器会弄乱并错误标记某个部分。在这种情况下,它会排序为,例如,A、B、A、B、A、A、A、B、A、B。在将合并数据粘贴到表中之前,我如何才能找到这个错误并自动更正它。
(出于保密原因,数据已过度简化)
您可以看到 5 月 2 日上午 A/B 被颠倒了,因为 B 数据是在 A 数据之前获取的。按时间对数据进行排序会打乱顺序。
您可以看到,4 月 2 日上午(下午 1 点是早班),有两个 A 部分,但其中一个应该是 B 部分(对于这个错误,我们可以假设它们是按照“A”在“B”之前的顺序拍摄的,因此数据收集时间适用)。
我是查询新手,老实说,我在这方面遇到了很大困难。请帮助我不仅解决这个问题,而且理解它。
以下是数据的文本版本:
四月
日期 | 时间 | 信 | 数据 |
---|---|---|---|
2024 年 4 月 1 日 | 上午 7:25:08 | 一个 | 0.7 |
2024 年 4 月 1 日 | 上午 7:30:56 | 乙 | 0.5 |
2024 年 4 月 1 日 | 晚上 8:32:51 | 一个 | 0.6 |
2024 年 4 月 1 日 | 晚上 8:36:44 | 乙 | 0.5 |
2024 年 4 月 2 日 | 下午 1:32:59 | 一个 | 1 |
2024 年 4 月 2 日 | 下午 1:38:36 | 一个 | 0.5 |
2024 年 4 月 2 日 | 晚上 8:46:11 | 一个 | 0.7 |
2024 年 4 月 2 日 | 晚上 8:51:31 | 乙 | 0.7 |
可能
日期 | 时间 | 信 | 数据 |
---|---|---|---|
2024 年 5 月 1 日 | 下午 1:35:12 | 一个 | 0.6 |
2024 年 5 月 1 日 | 下午 1:39:05 | 乙 | 0.4 |
2024 年 5 月 1 日 | 下午 6:07:11 | 一个 | 0.8 |
2024 年 5 月 1 日 | 下午 6:10:43 | 乙 | 0.5 |
2024 年 5 月 2 日 | 上午 10:59:32 | 一个 | 0.8 |
2024 年 5 月 2 日 | 上午 8:42:16 | 乙 | 0.1 |
2024 年 5 月 2 日 | 下午 6:15:07 | 一个 | 0.4 |
2024 年 5 月 2 日 | 下午 6:18:40 | 乙 | 0.2 |
年初至今(当前产量)
日期 | 时间 | 信 | 数据 |
---|---|---|---|
2024 年 4 月 1 日 | 上午 7:25:08 | 一个 | 0.7 |
2024 年 4 月 1 日 | 上午 7:30:56 | 乙 | 0.5 |
2024 年 4 月 1 日 | 晚上 8:32:51 | 一个 | 0.6 |
2024 年 4 月 1 日 | 晚上 8:36:44 | 乙 | 0.5 |
2024 年 4 月 2 日 | 下午 1:32:59 | 一个 | 1 |
2024 年 4 月 2 日 | 下午 1:38:36 | 一个 | 0.5 |
2024 年 4 月 2 日 | 晚上 8:46:11 | 一个 | 0.7 |
2024 年 4 月 2 日 | 晚上 8:51:31 | 乙 | 0.7 |
2024 年 5 月 1 日 | 下午 1:35:12 | 一个 | 0.6 |
2024 年 5 月 1 日 | 下午 1:39:05 | 乙 | 0.4 |
2024 年 5 月 1 日 | 下午 6:07:11 | 一个 | 0.8 |
2024 年 5 月 1 日 | 下午 6:10:43 | 乙 | 0.5 |
2024 年 5 月 2 日 | 上午 8:42:16 | 乙 | 0.1 |
2024 年 5 月 2 日 | 上午 10:59:32 | 一个 | 0.8 |
2024 年 5 月 2 日 | 下午 6:15:07 | 一个 | 0.4 |
2024 年 5 月 2 日 | 下午 6:18:40 | 乙 | 0.2 |
年初至今(预期产量)
日期 | 时间 | 信 | 数据 |
---|---|---|---|
2024 年 4 月 1 日 | 上午 7:25:08 | 一个 | 0.7 |
2024 年 4 月 1 日 | 上午 7:30:56 | 乙 | 0.5 |
2024 年 4 月 1 日 | 晚上 8:32:51 | 一个 | 0.6 |
2024 年 4 月 1 日 | 晚上 8:36:44 | 乙 | 0.5 |
2024 年 4 月 2 日 | 下午 1:32:59 | 一个 | 1 |
2024 年 4 月 2 日 | 下午 1:38:36 | 乙 | 0.5 |
2024 年 4 月 2 日 | 晚上 8:46:11 | 一个 | 0.7 |
2024 年 4 月 2 日 | 晚上 8:51:31 | 乙 | 0.7 |
2024 年 5 月 1 日 | 下午 1:35:12 | 一个 | 0.6 |
2024 年 5 月 1 日 | 下午 1:39:05 | 乙 | 0.4 |
2024 年 5 月 1 日 | 下午 6:07:11 | 一个 | 0.8 |
2024 年 5 月 1 日 | 下午 6:10:43 | 乙 | 0.5 |
2024 年 5 月 2 日 | 上午 10:59:32 | 一个 | 0.8 |
2024 年 5 月 2 日 | 上午 8:42:16 | 乙 | 0.1 |
2024 年 5 月 2 日 | 下午 6:15:07 | 一个 | 0.4 |
2024 年 5 月 2 日 | 下午 6:18:40 | 乙 | 0.2 |
我使用了一个简单的电源查询,如图所示,另外,按顺序将所有数据类型更改为正确的类型,按日期排序,按时间排序,删除源名称,并删除重复项。
我无法依靠文件名对数据进行排序并将其保留在文件中,原因是我从具有相同名称但位于各自月份文件夹中的工作表中提取数据。文件夹按字母顺序排序,因此如果我不手动排序,月份的顺序就会错误。
根据您在评论中提到的这些假设:
你可以用这样的方法解决:
从附加的数据集开始:
添加索引列:
添加一个自定义列,为每一对连续的行分配一个 PaidID:
按 PairID 分组,将名为“Rows”的单列设置为“All Rows”:
然后编辑 Table.Group 定义,如查询所示:
展开表格列(单击列顶部的双箭头),并确保公式栏如下所示:
最后删除 PairID 列:
Flex 有答案,但我的 Excel 不喜欢它,所以这是对我有用的修改版本