我有500万个观测值的数据集,并且感兴趣的三个变量是州代码,县代码和地区代码。现在,当将三个变量合在一起时,我需要找到不同观察值的总数。通常,可以通过以下方法找到特定变量的不同计数:
PROC sql;
SELECT COUNT(DISTINCT(TRACT))
AS COUNT FROM metro1_00;
quit;
但是我需要唯一的计数,例如(地区,县和州)。但是很遗憾,这些选项不可用。我正在使用SAS 9.3。
您只需要利用该group by
语句
proc sql noprint;
create table new_table as
select distinct count(tract) as COUNT_t
from metro1_00
group by tract, county, state
;
quit;
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句