有没有办法打印拟合分布的 Proc 单变量输出？

Question

NewUsr_stat

Asked: 2024-12-20 23:34:58 +0800 CST2024-12-20 23:34:58 +0800 CST 2024-12-20 23:34:58 +0800 CST

仅当变量取特定值时，才用另一个数据集中的值替换数据集中的值

772

假设有以下数据集：

data have;
  input ID :$20. Admission :date09. Discharge :date09. Index Variable1 Variable2; 
  format Admission date9. Discharge date9.;
cards;
0001 13JAN2015 20JAN2015 1  2  4  
0001 21FEB2015 31DEC2015 0  .  2
0001 21FEB2015 31DEC2015 0  3  .
0001 01JAN2019 31DEC2019 0  6  9
0002 01JAN2015 31DEC2015 0  2  .
0002 01JAN2019 31OCT2019 1  .  2
0002 01JAN2019 31OCT2019 0  .  2
;

然后，我还有另一个看起来像这样的数据集，来自其他计算：


data have1;
  input ID :$20. Admission :date09. Discharge :date09. Index Variable1 Variable2; 
  format Admission date9. Discharge date9.;
cards;
0001 13JAN2015 20JAN2015 1  6  8
0002 01JAN2019 31OCT2019 1  4  2
;

有没有办法获得以下内容？

data have2;
  input ID :$20. Admission :date09. Discharge :date09. Index Variable1 Variable2; 
  format Admission date9. Discharge date9.;
cards;
0001 13JAN2015 20JAN2015 1  6  8 
0001 21FEB2015 31DEC2015 0  .  .
0001 21FEB2015 31DEC2015 0  .  .
0001 01JAN2019 31DEC2019 0  .  .
0002 01JAN2015 31DEC2015 0  .  .
0002 01JAN2019 31OCT2019 1  4  2
0002 01JAN2019 31OCT2019 0  .  .
;

换句话说，我想用 have1（其中 Index = 1）中的值替换 have 中的值。have 中的其余部分应设置为“.”，以表示 have3。变量总数：为 50。为简单起见，这里仅显示 2 个。

先感谢您

1 个回答

Voted

Stu Sztukowski · Answer 1 · 2024-12-20T23:55:15+08:00

您可以通过两种方式执行此操作：

简单合并
哈希连接

让我们看一下这两者。

简单合并

我们希望通过键（即的组合）进行合并ID Admission Discharge Index。首先，我们将对两个数据集进行排序，然后通过此键合并它们。如果键组合匹配，我们将Variable1和设置Variable2为缺失。

proc sort data=have;
    by id admission discharge index;
run;

proc sort data=have1;
    by id admission discharge index;
run;

data want;
    merge have(in=h)
          have1(in=h1)
    ;
    by id admission discharge index;

    if(h NE h1) then call missing(of variable:);
run;

哈希连接

这与简单的合并非常相似，但不需要排序，并且性能最高。我们将把它当作have1一个查找表，并从中为每个匹配项提取值。如果我们没有找到匹配项，我们将把Variable1和的值设置Variable2为缺失。

data want;
    set have;

    if(_N_ = 1) then do;
        dcl hash h1(dataset:'have1');
            h1.defineKey('id', 'admission', 'discharge', 'index');
            h1.defineData('variable1', 'variable2');
        h1.defineDone();
    end;

    if(h1.Find() NE 0) then call missing(of variable:);
run;

ID      Admission   Discharge   Index   Variable1   Variable2
0001    13JAN2015   20JAN2015   1       6           8
0001    21FEB2015   31DEC2015   0       .           .
0001    21FEB2015   31DEC2015   0       .           .
0001    01JAN2019   31DEC2019   0       .           .
0002    01JAN2015   31DEC2015   0       .           .
0002    01JAN2019   31OCT2019   1       4           2
0002    01JAN2019   31OCT2019   0       .           .

仅当变量取特定值时，才用另一个数据集中的值替换数据集中的值

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

为什么这个简单而小的 Java 代码在所有 Graal JVM 上的运行速度都快 30 倍，但在任何 Oracle JVM 上却不行？

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

何时应使用 std::inplace_vector 而不是 std::vector？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

仅当变量取特定值时，才用另一个数据集中的值替换数据集中的值

1 个回答

相关问题