删除SAS中两个值之间的行

debugcn 发表于 Dev

对于以下数据，我正在尝试根据这些条件过滤每个组ID的行：

在每行之后type='B' and value='Y'执行以下操作
- 删除行，直到下一行具有type='F' and value='Y'。
如果没有B ='Y，则全部保留（例如id = 002）

我们可以创建我想要的数据集中显示的flag变量吗？这样我就可以过滤Flag ='Y'？

有

  ID     Type     Date         Value
  001     F       1/2/2018      Y
  001     B       1/3/2018
  001     B       1/4/2018      Y
  001     B       1/5/2018
  001     B       1/6/2018
  001     F       1/6/2018      Y
  001     B       1/6/2018      
  001     B       1/7/2018
  001     B       1/8/2018      Y
  001     B       1/8/2018
  001     B       1/9/2018
  002     F       1/2/2018      Y
  002     B       1/3/2018
  002     B       1/4/2018

想

  ID     Type     Date         Value   Flag
  001     F       1/2/2018      Y       Y
  001     B       1/3/2018              Y
  001     B       1/4/2018      Y       Y 
  001     B       1/5/2018
  001     B       1/6/2018
  001     F       1/6/2018      Y       Y
  001     B       1/6/2018              Y
  001     B       1/7/2018              Y
  001     B       1/8/2018      Y       Y 
  001     B       1/8/2018
  001     B       1/9/2018
  002     F       1/2/2018      Y       Y
  002     B       1/3/2018              Y
  002     B       1/4/2018              Y

我尝试执行以下操作

data F;
set have;
where Type='F';run;

data B;
 set have;
 where Type='B';run;

 proc sql;
  create table all as select
  a.* from B as b
  inner join F as f
  on a.id=b.id
  and b.date >= a.date;
quit;

这包括我有数据集的所有行。任何帮助深表感谢。

理查德

计算作为组内连续子组（称为行的“行”）的一部分的行的状态的标准ID相对简单，但是如果发生一些有趣的数据情况，则可能会发生或指出一种受损的状态：

FY之前两个或更多BY（额外的“运行结束”）
BY之前的两个或多个FY（在一次运行中“运行开始”）
组中的第一行不是FY（“运行开始”不是组中的第一行）

data want(drop=run_:);
  SET have;
  BY id;

  run_first = (type='F' and value='Y');
  run_final = (type='B' and value='Y');

  * set flag state at criteria for start of contiguous sub-group criteria;
  run_flag + run_first;

  if first.id and NOT run_flag then
    put 'WARNING: first row in group ' id= ' is not F Y, this may be incorrect';

  if run_flag > 1 and run_first then 
    put 'WARNING: an additional F Y before a B Y at row ' _n_;

  if run_flag then
    OUTPUT;

  if run_flag = 0 and run_final then 
    put 'WARNING: an additional B Y before a F Y at row ' _n_;

  * reset flag at criteria for contiguous sub-group;
  if last.id or run_final then 
    run_flag = 0;
run;

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。