SAS 频率分布


频率分布是显示数据集中数据点的频率的表格。表中的每个条目都包含特定组或区间内值出现的频率或计数,通过这种方式,表总结了样本中值的分布。

SAS 提供了一个称为 处理频率 计算数据集中数据点的频率分布。

语法

SAS中计算频率分布的基本语法是:

PROC FREQ DATA = Dataset ;
TABLES Variable_1 ;
BY Variable_2 ;

以下是使用的参数说明:

  • Dataset 是数据集的名称。

  • 变量_1 是需要计算其频率分布的数据集的变量名。

  • 变量_2 是对频率分布结果进行分类的变量。

单变频分配


我们可以通过使用来确定单个变量的频率分布 处理频率。 在这种情况下,结果将显示变量每个值的频率。结果还显示了百分比分布、累积频率和累积百分比。

例子

在下面的示例中,我们找到名为的数据集的可变马力的频率分布 CARS1 这是从图书馆创建的 SASHELP.CARS。 我们可以看到结果分为两类结果。每个品牌的汽车一个。

PROC SQL;
create table CARS1 as
SELECT make, model, type, invoice, horsepower, length, weight
    FROM
    SASHELP.CARS
    WHERE make in ('Audi','BMW')
;
RUN;

proc FREQ data = CARS1 ;
tables horsepower; 
by make;
run;

当上面的代码执行时,我们得到如下结果:

FREQ_By2

多变频分布


我们可以找到多个变量的频率分布,将它们分组为所有可能的组合。

例子

在下面的示例中,我们计算汽车品牌的频率分布 按车型分组 以及每种车型的频率分布 按每个品牌分组。

proc FREQ data = CARS1 ;
tables make type; 
run;

当上面的代码执行时,我们得到如下结果:

FREQ_tables1

具有权重的频率分布


使用权重选项,我们可以计算与变量权重有关的频率分布。这里变量的值被视为观察次数而不是值的计数。

例子

在下面的示例中,我们计算变量 make 和 type 的频率分布,并将权重分配给马力。

proc FREQ data = CARS1 ;
tables make type; 
weight horsepower;
run;

当上面的代码执行时,我们得到如下结果:

FREQ_tables3