数据库中的记录可以分为完全重复记录和不完全重复记录,比如下方的表格中,以ID=1为例子,有三条记录,其中第一条和第二条数据不完全重复记录,第二条和第三条属于完全重复记录。
image.png
有时候需要每个ID只保留任意一条记录即可。
image.png
实现代码如下
data c;
set a;
by id;
if first.id;
run;
有时候需要仅仅去除完全重复的记录,对于同一个ID下保留不完全重复的所有记录。image.png
实现代码如下
proc sort data=a out=b nodup;
by id;
run;
DONE~~~