SAS 排序数据集

SAS 中的数据集可以根据其中存在的任何变量进行排序。这有助于数据分析和执行其他选项，如合并等。排序可以发生在任何单个变量上以及多个变量。用于在 SAS 数据集中进行排序的 SAS 过程被命名为 过程排序 .排序后的结果存入一个新的数据集，保留原来的数据集不变。

语法

SAS中数据集排序操作的基本语法是：

PROC SORT DATA = original dataset OUT = Sorted dataset;
    BY variable name;

以下是使用的参数说明：

变量的名称 是发生排序的列名。
原始数据集 是要排序的数据集名称。
排序数据集 是排序后的数据集名称。

例子

让我们考虑以下包含组织员工详细信息的 SAS 数据集。我们可以使用下面给出的代码对薪水数据集进行排序。

DATA Employee; 
    INPUT empid name $ salary DEPT $ ;
DATALINES; 
1 Rick 623.3	IT 		 
2 Dan 515.2 	OPS	
3 Mike 611.5 	IT 	
4 Ryan 729.1    HR 
5 Gary 843.25   FIN 
6 Tusar 578.6   IT 
7 Pranab 632.8  OPS
8 Rasmi 722.5   FIN 
;
RUN;

PROC SORT DATA = Employee OUT = Sorted_sal ;
    BY salary;
RUN ;
 
PROC PRINT DATA = Sorted_sal;
RUN ;

当执行上述代码时，我们得到以下输出。

反向排序

默认排序选项是按升序排列的，这意味着观察值按照排序变量的从低到高排列。但我们也可能希望排序按升序进行。

例子

在下面的代码中，反向排序是通过使用 DESCENDING 语句实现的。

DATA Employee; 
    INPUT empid name $ salary DEPT $ ;
DATALINES; 
1 Rick 623.3	IT 		 
2 Dan 515.2 	OPS	
3 Mike 611.5 	IT 	
4 Ryan 729.1    HR 
5 Gary 843.25   FIN 
6 Tusar 578.6   IT 
7 Pranab 632.8  OPS
8 Rasmi 722.5   FIN 
;
RUN;

PROC SORT DATA = Employee OUT = Sorted_sal_reverse ;
    BY DESCENDING salary;
RUN ;
 
PROC PRINT DATA = Sorted_sal_reverse;
RUN ;

当执行上述代码时，我们得到以下输出。

对多个变量进行排序

通过将它们与 BY 语句一起使用，可以将排序应用于多个变量。变量按从左到右的优先级排序。

例子

在下面的代码中，数据集首先按变量部门名称排序，然后按变量名称薪水排序。

DATA Employee; 
    INPUT empid name $ salary DEPT $ ;
DATALINES; 
1 Rick 623.3	IT 		 
2 Dan 515.2 	OPS	
3 Mike 611.5 	IT 	
4 Ryan 729.1    HR 
5 Gary 843.25   FIN 
6 Tusar 578.6   IT 
7 Pranab 632.8  OPS
8 Rasmi 722.5   FIN 
;
RUN;

PROC SORT DATA = Employee OUT = Sorted_dept_sal ;
    BY salary DEPT;
RUN ;
 
PROC PRINT DATA = Sorted_dept_sal;
RUN ;

当执行上述代码时，我们得到以下输出。

< 上一篇（SAS 子集数据集）

下一篇（SAS 格式数据集） >

SAS 教程

SAS 数据集操作

SAS 数据表示

SAS基本统计程序

SAS 排序数据集

语法

例子

反向排序

例子

对多个变量进行排序

例子