当前位置:首页 » 《随便一记》 » 正文

Matlab异常值处理

23 人参与  2023年05月07日 08:49  分类 : 《随便一记》  评论

点击全文阅读


文章目录

Matlab异常值处理异常值的识别方法数据给定范围数据没有给定范围3sigma原则箱线图识别异常值 去除异常值后咋办

Matlab异常值处理

在对数据进行预处理中,我们经常会遇到异常值和缺失值的情况,下面我们对这两种情况的常用技术进行介绍,希望能帮到大家。

在数据既有异常值又有缺失值时,先处理哪个并没有严格的顺序。我习惯先处理异常值,再处理缺失值

异常值的识别方法

异常值,指的是样本中的一些数值明显偏离其余数值的样本点,所以也称为离群点。常见的异常值判断方法可以分为以下两种情况:

数据给定范围

数据没有给定范围

3sigma原则

前提是要正态分布,才可以用3sigma原则确定异常值。 历史经验:身高统计:正态性检验 如果要缩小一点区间,多去除一些异常值 可以用2sigma
x = [48 51 57 57 49 86 48 53 59 50 48 47 53 56 60];   % 假设x是取自正态分布的样本u = mean(x,'omitnan');  % 忽略数据中的缺失值计算均值sigma = std(x,'omitnan');   % 计算标准差  std(x,0,'omitnan')是总体标准差lb = u - 3*sigma    % 区间下界,low bound的缩写ub = u + 3*sigma   % 区间上界,upper bound的缩写tmp = (x < lb) | (x > ub);ind = find(tmp)

返回6,意味着第6个位置是异常值

通常不知道总体是否是正态分布的时候,我们用箱线图来去除异常值通常来说箱线图比3sigma去除的异常值要多通常k取1.5,当然也可以取其他的

箱线图识别异常值

x = [48 51 57 57 49 86 48 53 59 50 48 47 53 56 60];% 计算分位数的函数需要MATLAB安装了统计机器学习工具箱Q1 = prctile(x,25); % 下四分位数Q3 = prctile(x,75); % 上四分位数IQR = Q3-Q1; % 四分位距lb = Q1 - 1.5*IQR % 下界ub = Q3 + 1.5*IQR % 上界tmp = (x < lb) | (x > ub);ind = find(tmp)

去除异常值后咋办

识别出异常值后,我们通常可以将异常值视为缺失值,然后交给缺失值处理方法来处理。

代码:x(ind) = nan (注意:如果有多列数据都需要处理,可以写一个循环。)

x(ind) = nan % 这里的nan表示非数字Not-a-Number,例如0/0就会返回nan,我们这里可以用nan代表数字中的缺失值
如果数据给定范围,那么很容易找到异常值如果数据没给定范围,那么一般偷懒不做 除非数据很离谱,或者影响了模型的训练效果

点击全文阅读


本文链接:http://m.zhangshiyu.com/post/61268.html

<< 上一篇 下一篇 >>

  • 评论(0)
  • 赞助本站

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

最新文章

  • 不见青山存完结(霍青秦兮霍宴)_不见青山存完结霍青秦兮霍宴
  • 他的干妹妹怀孕后,我闪婚了文集(林诺陆深)全书免费_(林诺陆深)他的干妹妹怀孕后,我闪婚了文集后续(林诺陆深)
  • 江先生,你要听话列表列表_江先生,你要听话列表(许清欢江砚舟)
  • 一抹斜阳相思泪后续+必读夏知微陆远川完本_一抹斜阳相思泪后续+必读(夏知微陆远川)
  • 「不当假少爷后,我娶了首富当老婆」免费试读_萧寒沈凌薇章节多结局预体验‌
  • 全书浏览我死后,数万网友对我进行审判火爆(董天华尹瑶)_我死后,数万网友对我进行审判火爆(董天华尹瑶)全书结局
  • 纨绔恶少抽盲盒选妻子,我换嫁绝嗣总裁后他发疯求原谅+免费+后续列表_纨绔恶少抽盲盒选妻子,我换嫁绝嗣总裁后他发疯求原谅+免费+后续(阮玉绵)
  • 完结文晚云为落日溺亡++后续列表_完结文晚云为落日溺亡++后续(裴念舒)
  • [修仙:我在云疆养仙蚕]章节多结局预体验‌_「林珂」小说无删减版在线阅读
  • 全书浏览我死后,数万网友对我进行审判++番外(董天华尹瑶)_我死后,数万网友对我进行审判++番外(董天华尹瑶)全书结局
  • 被兄弟俩接连当工具人后,我杀疯了后续+(贺云舟)全书免费_(贺云舟)被兄弟俩接连当工具人后,我杀疯了后续+后续(贺云舟)
  • [发现装穷老公的真面目后,我迎来美好人生]反转剧情碎片化试读_傅思瀚方知晓晓晓完结

    关于我们 | 我要投稿 | 免责申明

    Copyright © 2020-2022 ZhangShiYu.com Rights Reserved.豫ICP备2022013469号-1