首页出版说明中文期刊中文图书环宇英文官网付款页面

关于数据挖掘过程中数据清洗的研究

张 祥飞
北京圆融科技有限公司

摘要


数据挖掘简单来说,就是将所有的数据整合出来,找到并整合出来,因此,在学习模式识别,我们就要学
习各类学科,例如,统计学、管理学、数据库等,因此,在当代社会数据挖掘技术也发展的越来越迅速,人们也越
来越喜欢用挖掘技术和数据仓库技术来整合数据,一旦数据挖掘过程中发现这些数据有可以利用的价值,数据仓库
技术就会将这些数据整合起来,数据清洗则是将错误的数据或是脏数据进行整理,因此在数据挖掘的过程中必须加
上数据清理才能让数据库中的数据保证其真实性和有效性。因此,我国在发展数据挖掘过程中,还应该有很多学习
和改善的内容,我国应该不断建立健全数据挖掘和数据清洗的各项策略研究。

关键词


数据挖掘;数据清洗;脏数据

全文:

PDF


参考


[1] 赵巧稚.基于模糊神经网络的城市污水处理过程数

据清洗方法的研究及应用[D].北京:北京工业大学,2020.

[2] 邹 同 华, 高 云 鹏, 伊 慧 娟, 等 . 基 于 Thompson

tau- 四分位和多点插值的风电功率异常数据处理 [J]. 电力

系 统 自 动 化,2020,44(15):156-162.DOI:10.7500/

AEPS20191231003.

[3] 刘振鹏,苏楠,秦益文,等 .FS-CRF:基于特征

切分与级联随机森林的异常点检测模型 [J]. 计算机科学,

2020,47(8):185-188.DOI:10.11896/jsjkx.190600162.

[4] 杨光,吴明芬,李敬民.数据迁移与清洗的策略研

究及其在政务基础数据的应用[J].五邑大学学报(自然科

学 版 ),2021,35(1):55-61.DOI:10.3969/j.issn.1006-

7302.2021.01.011.

[5 罗琨 .ETL 技术在提高统一社会信用代码数据质量

中 的 应 用 研 究 [J]. 标 准 科 学,2020(6):103-108.DOI:

10.3969/j.issn.1674-5698.2020.06.018.

[6] 陈新月 . 基于并行计算的水质时间序列数据清洗

平台的研究与实现 [D]. 北京:北京工业大学,2020.




DOI: http://dx.doi.org/10.12361/2661-3727-04-03-94612

Refbacks

  • 当前没有refback。