如果我只知道这种操作被称为什么,这是很容易找到教程的事情之一!
我有一个看起来像这样的 CSV
Fruit,color
Apple,red
Apple,green
Apple,yellow
Banana,yellow
Pear,brown
Pear,green
我想要一个看起来像这样的 CSV(为方便读者,呈现为降价表):
水果 | 棕色的 | 绿色 | 黄色 | 红色的 |
---|---|---|---|---|
苹果 | ñ | 是 | 是 | 是 |
香蕉 | ñ | ñ | 是 | ñ |
梨 | 是 | 是 | ñ | ñ |
IOW,在这个测试用例中,CSV 的第二列是一个枚举,我希望该列中的值“传播”到结果的列中,成为“列掩码”。
输出表中枚举列的顺序无关紧要。输出表中的字段值无关紧要(可以是 Y/N 或 Y/blank 或任何区分存在与不存在的内容。标题不需要存在(只要我能弄清楚哪一列在输出表)。
我在考虑 Excel,但我对其他常用工具持开放态度。我想我可以编写一个 Awk 脚本,但我确信在 Excel 中单击几下就可以通过某种 UI 方式执行此操作,...
要是我知道它叫什么就好了!!!(它必须是某种分组/汇总操作......)
步骤 1. 使用文本到列(数据选项卡 > 数据工具组)将数据拆分为 2 列。
步骤 2。请将它们复制到其他单元格,并为每列使用删除重复项(数据选项卡 > 数据工具组)。
选择一列 > 单击删除重复项 > 继续当前选择 > 删除重复项以获取唯一值。
步骤 3. 请复制颜色列,转到主页选项卡 > 剪贴板组 > 展开粘贴选项 >转置(T)。
这一步可以获取到表的行名和列名。
Step 4. 以图片样本为例,在单元格G2中输入下面的公式,然后向右,向下填充。
=IF(SUMPRODUCT(($A$2:$A$7=$F2)*($B$2:$B$7=G$1))=1,"Y","N")