无机化工论文_基于改进SMOTE的制造过程不平衡
发布时间 | 2022-01-29
文章摘要:不平衡数据分析是智能制造的关键技术之一,其分类问题已成为机器学习和数据挖掘的研究热点。针对目前不平衡数据过采样策略中人工合成数据边缘化且需要降噪处理的问题,本文提出一种基于改进SMOTE(Synthetic Minority Over-Sampling Technique)和局部离群因子(Local Outlier Factor,LOF)的过采样算法,首先对整个数据集进行K-means聚类,筛选出高可靠性样本进行改进SMOTE算法过采样,然后采用LOF算法删除误差大的人工合成样本。在4个UCI不平衡数据集上的实验结果表明,该方法对不平衡数据中少数类分类能力更强,有效地克服了数据边缘化问题,将算法应用于磷酸生产中的不平衡数据,实现了该不平衡数据准确分类。
文章关键词: