扫一扫二维码
进群一起备考
查看更多
当前 - 选择题 - 数据库理论中等
单选题
2015年5月第35题
中等
单选题
2015年5月第35题
#第二版教材
#了解即可
数据挖掘的分析方法可以划分为关联分析、序列模式分析、分类分析和聚类分析四种。如果某方法需要一个示例库(该库中的每个元组都有一个给定的类标识)做训练集时,这种分析方法属于(分类分析)。
问题(1)
浓缩知识点
数据挖掘常见分析方法可按是否依赖标注数据分为有监督与无监督两类。其中分类分析属于有监督学习方法,必须依托带有明确类标识的示例训练集构建模型,核心用于对未知数据的类别预测;关联分析聚焦挖掘数据集中项与项间的关联规则,典型应用如购物篮分析,无需类标识;序列模式分析专门针对带时间或顺序属性的数据,挖掘行为或事件的时序规律,不依赖预先标注的类标识;聚类分析则属于无监督学习,无需已标注的训练数据,仅依据数据间的相似性自动将数据集划分为若干类别,适用于探索数据内在结构。
正确答案
C
本题考察的是数据挖掘的主要分析方法及其特征。
分类分析(Classification)属于有监督学习方法,需要一个已标注类别的训练集,通过学习得到分类模型,并将该模型用于未知数据的类别预测。
A选项 关联分析:主要用于发现数据集中项与项之间的关联规则,不依赖类标识,错误。
B选项 序列模式分析:用于分析时间或顺序相关的数据模式,如顾客购买行为的时间序列,不涉及类标识,错误。
C选项 分类分析:需要一个已标注类标识的示例库(训练集),通过学习构建分类器,对未知数据进行预测,符合题干描述,正确。
D选项 聚类分析:属于无监督学习,不依赖已知的类标识,而是通过相似性自动将数据分为若干类,错误。
因此,本题答案为 C。
