扫一扫二维码
进群一起备考
查看更多
当前 - 选择题 - 数据库理论简单
单选题
2015年5月第19题
简单
单选题
2015年5月第19题
#第二版教材
#必须掌握
采用数据仓库技术进行数据收集时,有时会遇到一些略微不一致但可以纠正的数据,纠正这些数据的过程称为(__)。
问题(1)
正确答案
C
本题考察的是数据仓库ETL流程中的数据清洗概念。
题干中的“略微不一致但可以纠正的数据”正对应清洗环节对脏数据的识别与修正。
A选项 数据转换:是将抽取的数据按目标模型进行格式、编码、口径的转换与汇总,不以“发现并纠正错误”为核心,故不符合题意。
B选项 数据抽取:从源系统把数据取出到暂存区或ETL流水线的起点,不涉及对不一致数据的纠错,故不正确。
C选项 数据清洗:发现并纠正可识别错误与不一致,包括缺失值处理、异常值修正、标准化、去重与一致性校验,正是题干描述,正确。
D选项 数据装载:将处理后的数据写入数据仓库或数据集市,是ETL的末端环节,不承担纠错职责,故不正确。
选择选项 C。
