AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / computer / 问题 / 1687331
Accepted
user1553584
user1553584
Asked: 2021-11-14 12:45:34 +0800 CST2021-11-14 12:45:34 +0800 CST 2021-11-14 12:45:34 +0800 CST

在 MS Excel 中对重叠时间进行分组

  • 772

我有一个电子表格,其中包含多个条目,每个条目都有一个开始和结束时间。我希望能够识别重叠时间条目,然后能够通过可能将重叠组 ID 分配给重叠条目对来对重叠条目进行分组。开始和结束时间可以是一天中的任何时间。我想对它们进行分组的原因是我能够识别大数据集中的重叠时间,“分组”每个重叠时间,以便我可以从数据集中提取每个“组”并对每个重叠进行进一步计算“团体”。

请在下图中查看一些示例条目以及我想要获得的内容: 在此处输入图像描述

我已经设法使用以下功能锻炼了“重叠存在”

=IF(SUMPRODUCT((startTime<=endTime)*(endTime>=startTime)),TRUE,FALSE)

但是,我正在努力确定如何对两个重叠条目进行分组,如上面的示例所示。

任何帮助将不胜感激!

microsoft-excel date-time
  • 1 1 个回答
  • 274 Views

1 个回答

  • Voted
  1. Best Answer
    FlexYourData
    2021-11-14T14:33:48+08:002021-11-14T14:33:48+08:00

    这是 PowerQuery 的一种方法。

    首先,将光标放在数据中的任意位置,然后按 Ctrl+T 创建表。它应该看起来像这样:

    在此处输入图像描述

    使用数据>获取和转换数据>从表/范围。当您在对话框中单击确定时,您将在 PowerQuery 编辑器中看到您的数据。它应该如下所示:

    在此处输入图像描述

    为了在每一行和每一行之间进行比较,我们将把这个数据集连接到它自己。为此,首先我们将创建此数据集的副本。展开窗口左侧的“查询”窗格,然后右键单击“表 1”查询并选择“参考”。

    在此处输入图像描述

    这将创建 Table1 查询的副本。为清楚起见,将第一个查询重命名为 A,将第二个查询重命名为 B。您可以通过右键单击查询并选择“重命名”来重命名查询。所以,现在你有两个查询:

    在此处输入图像描述

    选择查询 B,然后转到添加列>自定义列并像这样配置对话框:

    在此处输入图像描述

    单击确定时,您将看到以下内容:

    在此处输入图像描述

    单击 QueryA 列右上角的双箭头:

    在此处输入图像描述

    单击确定。这将创建新行。此查询中的每一行现在表示查询 B 中的每一行与查询 A 中的每一行的比较。

    在此处输入图像描述

    首先,我们可以过滤掉任何将员工 ID 与其自身进行比较的行(如上面的第一行)。首先单击 QueryA.Employee ID 列上的过滤器,然后选择 Number>Does not equal。像这样配置它,然后按 OK:

    在此处输入图像描述

    现在转到主页>高级编辑器并编辑以下行:

    #"Filtered Rows" = Table.SelectRows(#"Expanded QueryA", each [QueryA.Employee ID] <> 1)
    

    对此:

    #"Filtered Rows" = Table.SelectRows(#"Expanded QueryA", each [QueryA.Employee ID] <> [Employee ID])
    

    在此处输入图像描述

    单击“确定”后,您将看到不再有行将员工 ID 与其自身进行比较。

    现在我们可以创建一个列来标记重叠的位置。使用 Add column>Custom Column 并像这样配置它:

    在此处输入图像描述

    您可以看到,对于有重叠的行,该列正确显示 TRUE。

    在此处输入图像描述

    您现在可以选择重命名列,过滤 TRUE 的重叠列,然后右键单击重叠列并选择“删除”以从结果中隐藏该列。

    当您单击 Home>Close & Load 时,数据将放回工作簿中。您现在可以继续分析(或者使用 PowerQuery 编辑器向查询添加步骤)。请务必将所有时间列的数据类型更改为时间(单击四列中每一列的列标题中的图标)

    在此处输入图像描述

    我很欣赏这似乎冗长,但这种方法的好处是:

    1. 没有容易出错且会减慢工作簿速度的笨重和复杂的公式
    2. 当源数据更新时,您只需刷新查询即可查看结果
    3. 这种方法将每位员工与其他所有员工进行比较

    编辑:要删除明显的“重复”(我不建议这样做,因为它会使以后的分析不太灵活),您可以执行以下操作:

    首先,我们需要确定两行正在比较两边相同的两名员工。为此,我们将添加两个自定义列来计算最小员工 ID:

    在此处输入图像描述

    和最大员工 ID:

    在此处输入图像描述

    我们要做的是选择每对 Min/Max 员工 ID 的一次出现。为此,我们可以为每对分配一个组索引,然后在 Index=1 上过滤结果。

    要分配组索引,请使用 Home>Group By 并进行如下配置:

    在此处输入图像描述

    你会看到这个:

    在此处输入图像描述

    转到主页>高级编辑器并将此行添加到查询中:

    Indexed = Table.TransformColumns(#"Grouped Rows", {{"Rows", each Table.AddIndexColumn(_,"GroupIndex", 1, 1)}})
    

    我从这个页面获取了这个代码和技术

    您需要确保在上一行的末尾添加一个逗号,并将“in”部分更改为 #"Indexed" 而不是 #"Grouped Rows":

    在此处输入图像描述

    按“完成”后,单击行列顶部的双箭头并选择除 Min Employee ID 和 Max Employee ID 之外的所有列(您已经有了这些列)。取消选中“使用原始列名作为前缀”:

    在此处输入图像描述

    这是结果:

    在此处输入图像描述

    现在,在 1 上过滤“GroupIndex”,然后删除 Min Employee ID、Max Employee ID 和 GroupIndex(右键单击该列,然后选择 Remove):

    在此处输入图像描述

    这是这些附加步骤之后的完整查询:

    let
        Source = A,
        #"Added Custom" = Table.AddColumn(Source, "QueryA", each A),
        #"Expanded QueryA" = Table.ExpandTableColumn(#"Added Custom", "QueryA", {"Employee ID", "Start time", "End time"}, {"QueryA.Employee ID", "QueryA.Start time", "QueryA.End time"}),
        #"Filtered Rows" = Table.SelectRows(#"Expanded QueryA", each [QueryA.Employee ID] <> [Employee ID]),
        #"Added Custom1" = Table.AddColumn(#"Filtered Rows", "overlaps", each [QueryA.Start time] < [End time] and [QueryA.End time] > [Start time]),
        #"Renamed Columns" = Table.RenameColumns(#"Added Custom1",{{"QueryA.Employee ID", "Compare with Employee ID"}, {"QueryA.Start time", "Compared Start Time"}, {"QueryA.End time", "Compared End Time"}}),
        #"Filtered Rows1" = Table.SelectRows(#"Renamed Columns", each ([overlaps] = true)),
        #"Removed Columns" = Table.RemoveColumns(#"Filtered Rows1",{"overlaps"}),
        #"Changed Type" = Table.TransformColumnTypes(#"Removed Columns",{{"Compared Start Time", type time}, {"Compared End Time", type time}}),
        #"Added Custom2" = Table.AddColumn(#"Changed Type", "Min Employee ID", each if [Employee ID] < [Compare with Employee ID] then [Employee ID] else [Compare with Employee ID]),
        #"Added Custom3" = Table.AddColumn(#"Added Custom2", "Max Employee ID", each if [Employee ID] > [Compare with Employee ID] then [Employee ID] else [Compare with Employee ID]),
        #"Changed Type1" = Table.TransformColumnTypes(#"Added Custom3",{{"Min Employee ID", Int64.Type}, {"Max Employee ID", Int64.Type}}),
        #"Grouped Rows" = Table.Group(#"Changed Type1", {"Min Employee ID", "Max Employee ID"}, {{"Rows", each _, type table [Employee ID=nullable number, Start time=nullable time, End time=nullable time, Compare with Employee ID=number, Compared Start Time=nullable time, Compared End Time=nullable time, Min Employee ID=nullable number, Max Employee ID=nullable number]}}),
        Indexed = Table.TransformColumns(#"Grouped Rows", {{"Rows", each Table.AddIndexColumn(_,"GroupIndex", 1, 1)}}),
        #"Expanded Rows" = Table.ExpandTableColumn(Indexed, "Rows", {"Employee ID", "Start time", "End time", "Compare with Employee ID", "Compared Start Time", "Compared End Time", "GroupIndex"}, {"Employee ID", "Start time", "End time", "Compare with Employee ID", "Compared Start Time", "Compared End Time", "GroupIndex"}),
        #"Filtered Rows2" = Table.SelectRows(#"Expanded Rows", each ([GroupIndex] = 1)),
        #"Removed Columns1" = Table.RemoveColumns(#"Filtered Rows2",{"Min Employee ID", "Max Employee ID", "GroupIndex"})
    in
        #"Removed Columns1"
    
    • 1

相关问题

  • 带有“和”运算符的 Excel 数据透视表

  • 如何对整列使用 Excel 的 LENGTH 函数?

  • Excel 数组(2 个变量)

  • 如何从 WSL 打开 office 文件

  • VBA根据文件名重命名工作表

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何减少“vmmem”进程的消耗?

    • 11 个回答
  • Marko Smith

    从 Microsoft Stream 下载视频

    • 4 个回答
  • Marko Smith

    Google Chrome DevTools 无法解析 SourceMap:chrome-extension

    • 6 个回答
  • Marko Smith

    Windows 照片查看器因为内存不足而无法运行?

    • 5 个回答
  • Marko Smith

    支持结束后如何激活 WindowsXP?

    • 6 个回答
  • Marko Smith

    远程桌面间歇性冻结

    • 7 个回答
  • Marko Smith

    子网掩码 /32 是什么意思?

    • 6 个回答
  • Marko Smith

    鼠标指针在 Windows 中按下的箭头键上移动?

    • 1 个回答
  • Marko Smith

    VirtualBox 无法以 VERR_NEM_VM_CREATE_FAILED 启动

    • 8 个回答
  • Marko Smith

    应用程序不会出现在 MacBook 的摄像头和麦克风隐私设置中

    • 5 个回答
  • Martin Hope
    Saaru Lindestøkke 为什么使用 Python 的 tar 库时 tar.xz 文件比 macOS tar 小 15 倍? 2021-03-14 09:37:48 +0800 CST
  • Martin Hope
    CiaranWelsh 如何减少“vmmem”进程的消耗? 2020-06-10 02:06:58 +0800 CST
  • Martin Hope
    Jim Windows 10 搜索未加载,显示空白窗口 2020-02-06 03:28:26 +0800 CST
  • Martin Hope
    v15 为什么通过电缆(同轴电缆)的千兆位/秒 Internet 连接不能像光纤一样提供对称速度? 2020-01-25 08:53:31 +0800 CST
  • Martin Hope
    andre_ss6 远程桌面间歇性冻结 2019-09-11 12:56:40 +0800 CST
  • Martin Hope
    Riley Carney 为什么在 URL 后面加一个点会删除登录信息? 2019-08-06 10:59:24 +0800 CST
  • Martin Hope
    zdimension 鼠标指针在 Windows 中按下的箭头键上移动? 2019-08-04 06:39:57 +0800 CST
  • Martin Hope
    jonsca 我所有的 Firefox 附加组件突然被禁用了,我该如何重新启用它们? 2019-05-04 17:58:52 +0800 CST
  • Martin Hope
    MCK 是否可以使用文本创建二维码? 2019-04-02 06:32:14 +0800 CST
  • Martin Hope
    SoniEx2 更改 git init 默认分支名称 2019-04-01 06:16:56 +0800 CST

热门标签

windows-10 linux windows microsoft-excel networking ubuntu worksheet-function bash command-line hard-drive

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve