∝ 02 现在的位置:首页 > 期刊导读 > 2019 > 02 >

基于不平衡数据集的主动学习分类算法

作者: 赵小强 刘梦依

关键词: 数据挖掘 不平衡数据集 分类 少数类样本合成过采样技术

摘要:

针对不平衡数据集在分类过程中易产生噪声数据和分类精度低的问题,提出一种基于改进SMOTE的不平衡数据集主动学习SVM分类算法.该算法对训练样本集利用少数类样本的归属值通过多数票选择法控制合成少数类样本的数量,以距离公式为衡量标准划分超平面,在分类超平面两侧选择最近距离的等量对称的多数类样本,组成平衡采样数据集,利用支持向量机(SVM)进行分类得到优化分类器,再用主动学习对去除了训练样本的不平衡数据集利用优化分类器进行分类循环,直到剩余样本为零.利用UCI数据集中的数据实验表明,该算法有效地减少了噪声数据对分类的影响,并有效改善不 平衡数据集的分类精度.

上一篇: 基于重构误差的连续型DBN 的深度确定方法
下一篇: 基于NSGA-II 的油气管网多目标布局优化

版权所有《控制工程》编辑部 copyright © 2005-2012
地址:沈阳市东北大学310信箱 邮政编码:110004  辽ICP备05001360号