基于Hadoop的中医症状群分类应用-计算机应用与软件.PDF
文本预览下载声明
第35卷第7期 计算机应用与软件 Vol35No.7
2018年7月 ComputerApplicationsandSoftware Jul.2018
基于Hadoop的中医症状群分类应用
石艳敏 张守宾 朱习军
(青岛科技大学信息科学技术学院 山东青岛266061)
摘 要 传统单一的KNN算法来挖掘中医病案症状证型规律,存在占用内存空间大、建模时间长、复杂度高、
大数据量无法处理等问题。提出基于Hadoop平台的并行化计算中医症状群分类方法。在Hadoop分布式计算平
台中,利用MapReduce计算框架,并行化实现KNN分类算法。实验结果表明,基于Hadoop的中医症状群预测分
类效率更高,能更有效地指导临床实践。
关键词 Hadoop平台 MapReduce KNN分类算法 哮喘病症状
中图分类号 TP391 文献标识码 A DOI:10.3969/j.issn.1000386x.2018.07.058
CLASSIFICATIONOFTRADITIONALCHINESEMEDICINE
SYNDROMEBASEDONHADOOPPLATFORM
ShiYanmin ZhangShoubin ZhuXijun
(CollegeofInformationScienceandTechnology,QingdaoUniversityofScienceandTechnology,Qingdao266061,Shandong,China)
Abstract WhenthetraditionalsingleKNNalgorithmisusedtoanalysethesyndromepatternofTCM(Traditional
ChineseMedicine),aseriesofproblemthatlargespacebeingoccupied,longmodellingtime,highcalculating
complexityandfailingtodealwithlargedataarises,thereforetheparallelcomputingmethodofTCMsymptom
classificationbasedonHadoopplatformwasproposed.IntheHadoopdistributedcomputingplatform,theKNN
classificationalgorithmwasimplementedinparallelwiththeMapReducecomputingframework.Theexperimentalresults
showthatthepredictionandclassificationofTCMsymptomsbasedonHadoopismoreefficientanditcanguideclinical
practicemoreeffectively.
Keywords Hadoopplatform MapReduce KNNclassificationalgorithm Symptomsofasthma
内在联系,即症状群所属的证型类别,从而分析出症状
0 引 言 与证型之间的密切关系[2]。
通过“四诊”信息中医学可以发现人体生理和病 1 Hadoop平台
理的变化,故采用中医辨证原理来诊断病症,然后对症
[3]
下药,治愈疾病[1]。作为患者的外在表现,症状是识别 Hadoop 是Apache基金会所开发的一个开源的
分布式系统软件框架。该框架具备的高可靠性、高扩
疾病的重要航标,也是诊断证型的重要依据。因此,对
显示全部