为提高水文数据质量和数据校核效率,提出了一种基于CART决策树的水位流量序列数据异常值检测方法,以提高异常值自动检测水平。首先构造纳入冗余数据样本,再利用水位流量序列数据特性选择检测特征,然后将样本带入特征,结合测站特性和基尼系数算法计算特征阈值,形成决策树,最后利用决策树进行异常值检测,辅助人工数据校核。经过人工判定后的数据,将形成新的样本用于下一次决策树构建。该方法的检测精度和效率能满足实际应用,目前已在全国水文水资源监测信息系统使用。
为提高水文数据质量和数据校核效率,提出了一种基于CART决策树的水位流量序列数据异常值检测方法,以提高异常值自动检测水平。首先构造纳入冗余数据样本,再利用水位流量序列数据特性选择检测特征,然后将样本带入特征,结合测站特性和基尼系数算法计算特征阈值,形成决策树,最后利用决策树进行异常值检测,辅助人工数据校核。经过人工判定后的数据,将形成新的样本用于下一次决策树构建。该方法的检测精度和效率能满足实际应用,目前已在全国水文水资源监测信息系统使用。
您还没有登录,请登录后查看详情
|