期刊检索

  • 2024年第22卷
  • 2023年第21卷
  • 2022年第20卷
  • 2021年第19卷
  • 2020年第18卷
  • 2019年第17卷
  • 2018年第16卷
  • 2017年第15卷
  • 2016年第14卷
  • 2015年第13卷
  • 2014年第12卷
  • 2013年第11卷
  • 第1期
  • 第2期

主管单位 工业和信息化部 主办单位 哈尔滨工业大学 主编 任南琪 国际刊号ISSN 1672-5565 国内刊号CN 23-1513/Q

期刊网站二维码
微信公众号二维码
引用本文:沈乐阳,孙廷凯.高斯混合模型的上采样分析[J].生物信息学,2017,15(2):84-89.
SHEN Leyang,SUN Tingkai.A new over-sampling algorithm by gaussian mixture model[J].Chinese Journal of Bioinformatics,2017,15(2):84-89.
【打印本页】   【HTML】   【下载PDF全文】   查看/发表评论  下载PDF阅读器  关闭
←前一篇|后一篇→ 过刊浏览    高级检索
本文已被:浏览 2920次   下载 1986 本文二维码信息
码上扫一扫!
分享到: 微信 更多
高斯混合模型的上采样分析
沈乐阳,孙廷凯
(南京理工大学 计算机科学与工程学院, 南京 210094)
摘要:
在机器学习问题中,类别不平衡问题严重影响一些标准分类器的性能。因此,解决类别不平衡问题尤为重要。上采样是解决类不平衡问题的常用方法,其通过合成新的少数类样本来平衡类的分布。在文中,使用一种基于高斯混合模型的上采样方法来解决不平衡学习问题。通过高斯混合模型来模拟少数类的分布,在此基础上使用高斯模型来生成新的少数类样本。在UCI类别不平衡数据集上的实验结果表明,所提出的方法能够缓解类不平衡所带来的负面影响并帮助提升分类性能。
关键词:  不平衡学习  支持向量机  高斯混合模型  上采样
DOI:10.3969/j.issn.1672-5565.20161019001
分类号:TP181
文献标识码:A
基金项目:
A new over-sampling algorithm by gaussian mixture model
SHEN Leyang, SUN Tingkai
(School of Computer Science and Engineering, Nanjing University of Science and Technology, Nanjing 210094, China)
Abstract:
Its significant to solve the class-imbalance problems which have a serious impact on the performance of standard classifiers in machine learning problems. Over-sampling is a popular method in dealing with class-imbalance problems, which attempts to balance the sizes of different classes by generating additional samples for minority class. We propose a new over-sampling algorithm that synthesizes new additional samples for minority classes by the Gaussian mixture model. Comparing with several state-of-art related methods on UCI datasets,the experimental results demonstrate that the proposed over-sampling algorithm can reduce the side effect of the class imbalance and help improve the classification performance.
Key words:  Imbalance learning  Support vector machine  Gaussian mixture model  Over-sample

友情链接LINKS

关闭