期刊检索

  • 2024年第22卷
  • 2023年第21卷
  • 2022年第20卷
  • 2021年第19卷
  • 2020年第18卷
  • 2019年第17卷
  • 2018年第16卷
  • 2017年第15卷
  • 2016年第14卷
  • 2015年第13卷
  • 2014年第12卷
  • 2013年第11卷
  • 第1期
  • 第2期

主管单位 工业和信息化部 主办单位 哈尔滨工业大学 主编 任南琪 国际刊号ISSN 1672-5565 国内刊号CN 23-1513/Q

期刊网站二维码
微信公众号二维码
引用本文:彭显,贺建峰.基于狄利克雷多项式过程模型与K-means 结合的菌群分析[J].生物信息学,2024,22(1):47-57.
PENG Xian,HE Jianfeng.Flora analysis based on Dirichlet polynomial process model and K-means[J].Chinese Journal of Bioinformatics,2024,22(1):47-57.
【打印本页】   【HTML】   【下载PDF全文】   查看/发表评论  下载PDF阅读器  关闭
←前一篇|后一篇→ 过刊浏览    高级检索
本文已被:浏览 546次   下载 487 本文二维码信息
码上扫一扫!
分享到: 微信 更多
基于狄利克雷多项式过程模型与K-means 结合的菌群分析
彭显,贺建峰
(昆明理工大学 信息工程及其自动化学院,昆明 650000)
摘要:
群体分型是一种有助于更好的理解人类身心健康等复杂生物学问题的有效方法,聚类是一种为了对样本分组来降低复杂性的定义肠型的方法,而传统K-means聚类算法的K值选取无法确定,本文在传统K-means聚类算法的基础上进行了改进,并公开数据集上进行了验证,实验表明改进算法能够解决K值选取无法确定的问题,且聚类结果的稳定性、准确性和聚类质量都得到显著提高。将改进后的模型运用于肠道菌群OTUs数据,发现不仅能够有效地区分2-型糖尿病患者样本间的相似性,而且能鉴定出影响菌群结构异质性最大的OTUs菌,为临床解决2-型糖尿病问题提供了一种新的思路。
关键词:  K-means算法  狄利克雷过程混合模型  菌群分析  群体分型  聚类
DOI:10.12113/202202014
分类号:TP181
文献标识码:A
基金项目:
Flora analysis based on Dirichlet polynomial process model and K-means
PENG Xian, HE Jianfeng
(School of Information Engineering and Automation,Kunming University of Technology,Kunming 650000,China)
Abstract:
Population typing is an effective method to better understand complex biological problems such as human physical and mental health. Clustering is a method to define intestinal type in order to reduce complexity by grouping samples. However, the selection of K value of traditional K-means clustering algorithm cannot be determined. This paper improves the traditional K-means clustering algorithm and verifies it on the public dataset, The experimental results show that the improved algorithm can solve the problem of undetermined K value selection, and the stability, accuracy and quality of clustering results are significantly improved. Applying the improved model to the OTUs data of intestinal flora, it is found that it can not only effectively distinguish the similarities between samples of patients with type 2 diabetes, but also identify the OTUs bacteria that have the greatest impact on the heterogeneity of flora structure, providing a new perspective for clinical solutions to the problem of type 2 diabetes.
Key words:  K-means algorithm  Dirichlet process mixed model  Flora analysis  Population typing  Clustering

友情链接LINKS

关闭