将复制活动的序列号添加到 Blob

Question

deschen

Asked: 2024-10-18 16:52:05 +0800 CST2024-10-18 16:52:05 +0800 CST 2024-10-18 16:52:05 +0800 CST

从列表列中动态提取元素

772

我有以下数据：

df <- structure(list(id = c("1358792", "1358792", "333482", "333482", "747475", "747475"),
                     x = c("123", "123", "456", "456", NA, NA),
                     all_x = list("123", "123",
                                  c("456", "789"),
                                  c("456", "789"),
                                  list(),
                                  list())),
                row.names = c(NA, -6L),
                class = "data.frame")
    
       id    x    all_x
1 1358792  123      123
2 1358792  123      123
3  333482  456 456, 789
4  333482  456 456, 789
5  747475 <NA>     NULL
6  747475 <NA>     NULL

all_x 列是一个包含 EMPTY/NULL 值、单个字符或字符向量的列表。

我想创建一个新列（tidyverse 样式），其逻辑如下：当列all_x有一个值或没有值时，只需从中取值x。如果它有两个值（即字符向量），我们希望按id行号分组并取对应的元素，即对于第一个 id 值，取字符向量的第一个元素，对于第二个 id 元素，取第二个字符值，依此类推。

所需的输出将是一个带有相应值的附加字符列，即

       id    x    all_x   x2
1 1358792  123      123  123
2 1358792  123      123  123
3  333482  456 456, 789  456
4  333482  456 456, 789  789
5  747475 <NA>     NULL <NA>
6  747475 <NA>     NULL <NA>

我已尝试过多种变体，包括if_else，ifelse以及取消列出和索引，但由于all_x列的混合结构，仍然总是会出现错误。

以下是我得到的最接近的答案：

library(tidyverse)
df |>
  mutate(x2 = if_else(lengths(all_x) > 1, all_x[[1]][row_number()], x), .by = id)

但是，显然，我没有成功。

3 个回答

Voted

SamR · Answer 1 · 2024-10-18T17:19:43+08:00

SamR

2024-10-18T17:19:43+08:002024-10-18T17:19:43+08:00

x这是一个函数，当有一个值或没有值时将返回all_x，否则从all_x对应于行号的元素中获取：

get_x2 <- function(x, all_x, row_num) {
    if (length(all_x) <= 1) {
        return(x)
    }
    all_x[[row_num]]
}

然后这只是创建并使用的row_number()一个id案例Map()：

df |>
    mutate(row_num = row_number(), .by = id) |>
    mutate(
        x2 = Map(get_x2, x, all_x, row_num)
    )
#        id    x    all_x row_num  x2
# 1 1358792  123      123       1 123
# 2 1358792  123      123       2 123
# 3  333482  456 456, 789       1 456
# 4  333482  456 456, 789       2 789
# 5  747475 <NA>     NULL       1  NA
# 6  747475 <NA>     NULL       2  NA

2

ThomasIsCoding · Answer 2 · 2024-10-18T17:41:20+08:00

Best Answer

ThomasIsCoding

2024-10-18T17:41:20+08:002024-10-18T17:41:20+08:00

我认为你应该使用ifelse（而不是if_else），用最小的努力让它飞起来

> df |>
+     mutate(x2 = ifelse(lengths(all_x) > 1, all_x[[1]][row_number()], x), .by = id)
       id    x    all_x   x2
1 1358792  123      123  123
2 1358792  123      123  123
3  333482  456 456, 789  456
4  333482  456 456, 789  789
5  747475 <NA>     NULL <NA>
6  747475 <NA>     NULL <NA>

if_else注意：和之间的区别ifelse

2

Andre Wildberg · Answer 3 · 2024-10-19T02:11:12+08:00

Andre Wildberg

2024-10-19T02:11:12+08:002024-10-19T02:11:12+08:00

使用NULL总是有点笨拙，而且大多只在列表上下文中起作用。你可以NULL用替换NA，这样NULL在非列表上下文中就不会出现任何问题

df %>% 
  mutate(x2 = replace(all_x, lengths(all_x) == 0, NA), 
         x2 = unlist(x2)[row_number()], .by = id)
       id    x    all_x   x2
1 1358792  123      123  123
2 1358792  123      123  123
3  333482  456 456, 789  456
4  333482  456 456, 789  789
5  747475 <NA>     NULL <NA>
6  747475 <NA>     NULL <NA>

2

从列表列中动态提取元素

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

为什么这个简单而小的 Java 代码在所有 Graal JVM 上的运行速度都快 30 倍，但在任何 Oracle JVM 上却不行？

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

何时应使用 std::inplace_vector 而不是 std::vector？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

从列表列中动态提取元素

3 个回答

相关问题