将复制活动的序列号添加到 Blob

Question

Mary Rachel

Asked: 2025-01-08 05:11:14 +0800 CST2025-01-08 05:11:14 +0800 CST 2025-01-08 05:11:14 +0800 CST

使用 summary_all() 获取多列中的值的数量

772

我想创建一个表来统计数据集中每列非 NA 值的数量。我正在使用summarize_all()，但我很难获得非 NA 值的数量。

我参考了这个 StackOverflow 线程来获得一些见解，但它似乎没有帮助我获得计数：summarize_all with "n()" function。如果我通过，我将获得不同值的计数，或者如果我通过或如线程所引用，summarize_all(n_distinct)我将获得行数。summarize_all(list(n=~n()))summarize_all(list(n="length")

我的期望输出：

ID Female  Male Non_Binary
 5      5     4          3

我哪里做错了？

# Sample Code

test<-as_tibble(data.frame(`ID` = c("1","2","3","4","5"),
                           `Female` = c("Female","Female","Female","Female","Female"),
                           `Male` = c(NA,"Male","Male","Male","Male"),
                           `Non_Binary`=c("Non-Binary","Non-Binary","Non-Binary",NA,NA)))

## Attempt 1

summary<-test%>%
  summarize_all(list(n=~n()))

# A tibble: 1 × 4
   ID_n Female_n Male_n Non_Binary_n
  <int>    <int>  <int>        <int>
1     5        5      5            5

## Attempt 2

summary<-test%>%
  summarize_all(list(n="length"))

# A tibble: 1 × 4
   ID_n Female_n Male_n Non_Binary_n
  <int>    <int>  <int>        <int>
1     5        5      5            5

## Attempt 3

summary<-test%>%
  summarize_all(n_distinct)

# A tibble: 1 × 4
     ID Female  Male Non_Binary
  <int>  <int> <int>      <int>
1     5      1     2          2

### Desired Output

ID Female  Male Non_Binary
 5      5     4          3

1 个回答

Voted

Gregor Thomas · Answer 1 · 2025-01-08T05:22:16+08:00

Best Answer

Gregor Thomas

2025-01-08T05:22:16+08:002025-01-08T05:22:16+08:00

n()和length()是这种情况下糟糕的选择 - 它们不会忽略NA它们所计算的值。计算满足条件（例如“非 NA”）的值的经典方法是满足sum条件。

summarize_all()也已经弃用了几年。现在更倾向于使用across()。

test |>
  summarize(across(everything(), \(x) sum(!is.na(x))))

# # A tibble: 1 × 4
#      ID Female  Male Non_Binary
#   <int>  <int> <int>      <int>
# 1     5      5     4          3

1

使用 summary_all() 获取多列中的值的数量

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

为什么这个简单而小的 Java 代码在所有 Graal JVM 上的运行速度都快 30 倍，但在任何 Oracle JVM 上却不行？

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

何时应使用 std::inplace_vector 而不是 std::vector？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

使用 summary_all() 获取多列中的值的数量

1 个回答

相关问题