关于数据挖掘过程中数据清洗的研究
摘要
数据挖掘简单来说,就是将所有的数据整合出来,找到并整合出来,因此,在学习模式识别,我们就要学
习各类学科,例如,统计学、管理学、数据库等,因此,在当代社会数据挖掘技术也发展的越来越迅速,人们也越
来越喜欢用挖掘技术和数据仓库技术来整合数据,一旦数据挖掘过程中发现这些数据有可以利用的价值,数据仓库
技术就会将这些数据整合起来,数据清洗则是将错误的数据或是脏数据进行整理,因此在数据挖掘的过程中必须加
上数据清理才能让数据库中的数据保证其真实性和有效性。因此,我国在发展数据挖掘过程中,还应该有很多学习
和改善的内容,我国应该不断建立健全数据挖掘和数据清洗的各项策略研究。
习各类学科,例如,统计学、管理学、数据库等,因此,在当代社会数据挖掘技术也发展的越来越迅速,人们也越
来越喜欢用挖掘技术和数据仓库技术来整合数据,一旦数据挖掘过程中发现这些数据有可以利用的价值,数据仓库
技术就会将这些数据整合起来,数据清洗则是将错误的数据或是脏数据进行整理,因此在数据挖掘的过程中必须加
上数据清理才能让数据库中的数据保证其真实性和有效性。因此,我国在发展数据挖掘过程中,还应该有很多学习
和改善的内容,我国应该不断建立健全数据挖掘和数据清洗的各项策略研究。
关键词
数据挖掘;数据清洗;脏数据
全文:
PDF参考
[1] 赵巧稚.基于模糊神经网络的城市污水处理过程数
据清洗方法的研究及应用[D].北京:北京工业大学,2020.
[2] 邹 同 华, 高 云 鹏, 伊 慧 娟, 等 . 基 于 Thompson
tau- 四分位和多点插值的风电功率异常数据处理 [J]. 电力
系 统 自 动 化,2020,44(15):156-162.DOI:10.7500/
AEPS20191231003.
[3] 刘振鹏,苏楠,秦益文,等 .FS-CRF:基于特征
切分与级联随机森林的异常点检测模型 [J]. 计算机科学,
2020,47(8):185-188.DOI:10.11896/jsjkx.190600162.
[4] 杨光,吴明芬,李敬民.数据迁移与清洗的策略研
究及其在政务基础数据的应用[J].五邑大学学报(自然科
学 版 ),2021,35(1):55-61.DOI:10.3969/j.issn.1006-
7302.2021.01.011.
[5 罗琨 .ETL 技术在提高统一社会信用代码数据质量
中 的 应 用 研 究 [J]. 标 准 科 学,2020(6):103-108.DOI:
10.3969/j.issn.1674-5698.2020.06.018.
[6] 陈新月 . 基于并行计算的水质时间序列数据清洗
平台的研究与实现 [D]. 北京:北京工业大学,2020.
DOI: http://dx.doi.org/10.12361/2661-3727-04-03-94612
Refbacks
- 当前没有refback。