首页出版说明中文期刊中文图书环宇英文官网付款页面

埃塞俄比亚育龄妇女破伤风类毒素免疫的数据挖掘

Kedir Abegaz*1, Emiru Atomssa2
1、马德达瓦拉布大学健康科学学院公共卫生系生物统计学和健康信息学
2、吉姆比西沃勒加地区卫生部生物统计学和卫生信息学

摘要


破伤风类毒素(TT)疫苗用于育龄妇女,以预防新生儿破伤风和因破伤风导致的孕产妇死亡。在全球范围内,破伤风
每年造成 5%的产妇死亡和 14%的新生儿死亡。数据挖掘是从大量数据中发现有趣模式和知识的过程。因此,本研究的目的是
识别最佳分类器,并使用数据挖掘算法从 TT 数据集预测模式。本研究的数据是 2011 年埃塞俄比亚人口与健康调查(EDHS)
中的破伤风类毒素数据集,并使用选择、处理、转化、挖掘和解释的知识发现过程进行分析。WEKA 3.6.1 工具用于分类、聚
类、关联和属性选择。分类器在训练数据上的准确率相对高于测试数据,多层感知器是我们的破伤风类毒素数据集中最好的
分类器。在具有 10 倍的交叉验证中,正确分类的最好的是通过天真贝叶斯 63.30%,最不准确的是通过 k 近邻 60.52%。使用
天真贝叶斯的单个数据实例测试是通过创建测试 1、测试 2、测试 3 和测试 4 数据测试实例来完成的,其中三个数据实例预测
正确,但其中一个错误分类。在一般关联中获得的最大置信度为 0.98。但是,在 class 属性中,它是 0.72。母亲的识字状况具
有较高的信息增益,值为 0.046。因此,基于 TT 疫苗接种数据的最佳算法是多层感知器分类器,其准确率为 67.28%,构建模
型所需的总时间为 0.01 秒。与其他分类器相比,多层感知器分类器的平均误差最低,为 32.72%。这些结果表明,在测试的机
器学习算法中,多层感知器分类器有可能显著改进用于破伤风类毒素 EDHS 数据的传统分类方法。

关键词


数据挖掘;韦卡;分类聚类;破伤风类毒素(TT);电子海图

全文:

PDF


参考


[1] Central Statistical Agency (CSA) [Ethiopia] and ICF,

Ethiopia Demographic and Health Survey 2016: Key

Indicators Report.2016: Addis Ababa, Ethiopia, and

Rockville, Maryland, USA, CSA, and ICF. [2] WHO, Maternal immunization against tetanus: Standards for Maternal and Neonatal Care. 2006, Department of making pregnancy safer. [3] Central Statistical Agency (CSA) [Ethiopia] and ICF, Ethiopia Demographic and Health Survey 2011: Key

Indicators Report. 2012: Addis Ababa, Ethiopia, and

Rockville, Maryland, USA, CSA, and ICF. [4] Validation of neonatal tetanus elimination in Andhra Pradesh Weekly Epidemiological Record, 2004. 79: p. 292-297. [5] Fauveau V et al., Maternal tetanus: magnitude, epidemiology, and potential control measures.

International Journal of Gynecology and Obstetrics, 1993. 40: p. 3-12. [6] WHO, Standards for maternal and Neonatal care:

Integrated management of pregnancy and chield birth. 2007, Department of making pregnancy safer. [7] Han, J., M. Kamber, and J. Pei, eds. Data mining

concepts and techniques. Third ed. 2013, Morgan

Kaufmann Publishers: Waltham, Mass. [8] G. Rasitha Banu, A Role of decision Tree

classification data Mining Technique in Diagnosing

Thyroid disease. International Journal of Computer Sciences and Engineering, 2016. 4 (11). [9] Ian H. Witten and Eibe Frank, eds. Data Mining: Practical Machine Learning Tools and Techniques. Second

edition. 2005, Morgan Kaufmann publications. [10] Parvez Ahmad, Saqib Qamar, and Syed Qasim

Afser Rizvi, Techniques of Data Mining In Healthcare: A

Review. International Journal of Computer Applications, 2015. 120 (15). [11] P. L. Geenen, et al., Constructing naive Bayesian

classifiers for veterinary medicine: A case study in the

clinical diagnosis of classical swine fever. Research in Veterinary Science, 2010. 91: p. 64-70. [12] Yi Peng, et al., Application of Clustering

Methods to Health Insurance Fraud Detection. 2006.




DOI: http://dx.doi.org/10.12361/2661-3727-04-11-128728

Refbacks

  • 当前没有refback。