关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则。

题目

关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则。

参考答案和解析
正确答案:错误
如果没有搜索结果或未解决您的问题,请直接 联系老师 获取答案。
相似问题和答案

第1题:

评价关联规则的有效指标有规则的支持度和( )。

A. 重复度

B. 新颖度

C. 复杂度

D. 可信度


正确答案是:D

第2题:

数据挖掘是数据库知识发现过程的一个步骤,常用的数据挖掘方法有:关联规则挖掘、特征描述、分类分析和 ______。


正确答案:聚类分析
聚类分析 解析:数据挖掘是从大型数据库或数据仓库中发现并提取隐藏在内的信息的一种新技术,目的是寻找数据间潜在的关联,为预测趋势和决策行为提供有用的信息。常用的数据挖掘方法有:关联规则挖掘、特征描述、分类分析和聚类分析。

第3题:

( 60 )下列关于数据挖掘的叙述中,哪一条是不正确的?

A )数据挖掘被认为是知识发现过程中的一个特定步骤

B )数据挖掘是使用专门的算法从数据中抽取有用的模式

C )关联规则的发现是数据挖掘的目标之一

D ) “ 可信度 ” 表示规则所代表的事例(元组)占全部事例(元组)的百分比


正确答案:D

第4题:

大型数据库中的关联规则挖掘包含两个过程()和()


正确答案:找出所有频繁项集;由频繁项集产生强关联规则

第5题:

数据挖掘是从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程,主要任务有(24)。

A.聚类分析、联机分析、信息检索等

B.信息检索、聚类分析、分类分析等

C.聚类分析、分类分析、关联规则挖掘等

D.分类分析、联机分析、关联规则挖掘等


正确答案:C
数据挖掘(英语:Datamining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-DiscoveryinDatabases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集;规律寻找是用某种方法将数据集所含的规律找出来;规律表示是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析,等等。

第6题:

下列关于数据挖掘的叙述中,哪一条是不正确的?

A.数据挖掘被认为是知识发现过程中的一个特定步骤

B.数据挖掘是使用专门的算法从数据中抽取有用的模式

C.关联规则的发现是数据挖掘的目标之一

D.“可信度”表示规则所代表的事例(元组)占全部事例(元组)的百分比


正确答案:D
解析:数据挖掘它用专门算法从数据中抽取有用的模式。当已有A时,B发生的概率即条件概率,在数据挖掘中也称为可信度,计算方法是求百分比:(A与B同时出现的频率)/(A出现的频率)。

第7题:

设有如下所示的某商场购物记录集合,每个购物篮中包含若干商品:

购物篮编号

商品

1

面包,牛奶

2

面包,啤酒,鸡蛋,尿布

3

牛奶,啤酒,尿布,可乐

4

面包,牛奶,啤酒,尿布

5

面包,牛奶,尿布,可乐

现在要基于该数据集进行关联规则挖掘。如果设置最小支持度为60%,最小置信度为80%,则如下关联规则中,符合条件的是( )。

A.啤酒→尿布

B.(面包,尿布)→牛奶

C.面包→牛奶

D.(面包,啤酒)→尿布


正确答案:A
关联规则是形如X->Y的蕴涵表达式。关联规则的强度可以用它的支持度(s)和置信度(e)度量。支持度确定规则可以用于给定数据集的频繁程度,而置信度确定Y在包含x的事务中出现的频繁程度。两者可以用公式表示:从题目中可以看到事务总数是5,A的{啤酒、尿布}支持度计数是3,{啤酒}支持计数是3,所以s=0.6。e=1。同理可得B{面包、尿布}支持计数为3,{面包、尿布、牛奶}支持计数是2,所以S=0.4,C=2/3。C中,{面包、牛奶}支持计数为3,{面包}支持计数为4,所以S=0.6,C=0.75。D中,{面包、啤酒}支持计数为2,{面包、啤酒、尿布}支持计数为2,所以S=0.4,e=1。综上所述,结果选A。

第8题:

比较常用的数据挖掘方法有三种:关联规则挖掘、分类分析及【 】。


正确答案:聚类分析
聚类分析 解析:聚类分析是将数据集分割为若干个有意义的聚簇的过程。聚类分析也称作无制导的学习。因为聚类分析与分类分析不同,它不依赖于没有事先确定的类,也没有带类标识的训练集。

第9题:

在多维关联规则挖掘中,我们搜索的不是频繁项集,而是()


正确答案:频繁谓词集

第10题:

简述在多层关联规则挖掘中,在不同的层使用一致的支持度的优缺点。


正确答案:优点:搜索是容易采用优化策略,即一个项如果不满足最小支持度,它的所有子项都可以不用搜索。缺点:最小支持度设置困难,太高则将丢掉出现在较低抽象层中有意义的关联规则;太低则会在较高层产生太多的无兴趣的规则。

更多相关问题