发布网友 发布时间:2022-04-26 10:14
共1个回答
热心网友 时间:2022-06-27 05:58
所谓异常值,设置一个变量的值非常极端或者出现的频次非常的低。 1)数值型变量异常值检测 数值型的变量异常值检测可以通过PROC UNIVARIATE过程来完成 代码如下:PROC UNIVARIATE DATA=IREAD.DA_FIN_200909; VAR _NUMERIC_; RUN;然后查看每个变量的分位数表,分析哪些变量可能存在异常的情况。 2)字符型变量异常值检测 字符型的变量异常值检测可以通过PROC FREQ过程来完成 代码如下:PROC FREQ DATA=IREAD.DA_FIN_200909; TABLE 变量1 变量2.../MISSING; RUN;查看每个字符型变量的频数分布,发现异常的值。