我有按年龄、州和年份划分的比率数据集。每个州和年份都有多个观测值,每个观测值只有一个比率。我需要帮助合并观测值,以便每个州/年份的所有比率都包含在一个观测值中。数据集如下所示:
data test_00;
input State$ year rt_15_30 rt_31_60 rt_61plus;
datalines;
AL 2010 15 . .
AL 2010 . 18 .
AL 2010 . . 20
AL 2011 18 . .
AL 2011 . 17 .
AL 2011 . . 22
MA 2010 10 . .
MA 2010 . 11 .
MA 2010 . . 12
MA 2011 11 . .
MA 2011 . 13 .
MA 2011 . . 15
;
run;
我正在尝试将我的数据集设置为如下所示:
data test_01;
input State$ year rt_15_30 rt_31_60 rt_61plus;
datalines;
AL 2010 15 18 20
AL 2011 18 17 22
MA 2010 10 11 12
MA 2011 11 13 15
;
run;
如能得到任何指导我将不胜感激!!提前谢谢您!
这是一个完美的结构,可以利用 UPDATE 语句。UPDATE 语句旨在将事务应用于现有数据集。当应用事务时,只有非缺失值才会导致变量值发生变化。
UPDATE 语句需要两个数据集。原始数据集最多可以为每个按组提供一个观察值。交易数据集可以为每个按组提供多个观察值。数据步骤末尾的隐式 OUTPUT 语句将仅针对按组中的最后一个观察值执行,因此结果也每个按组只有一个观察值。
您可以使用 OBS=0 数据集选项,这样您就可以将数据集用于两者:将数据集的空版本作为原始数据,将完整数据集作为要应用的交易的数据集。