K-means算法叙述正确的是()

题目
多选题
K-means算法叙述正确的是()
A

在K-means算法中K是事先给定的,这个K值的选定是非常难以估计的

B

在K-means算法中,首先需要根据初始聚类中心来确定一个初始划分,然后对初始划分进行优化

C

对于一个类中的每个对象,在其给定半径的领域中包含的对象不能少于某一给定的最小数目

D

从K-means算法框架可以看出,该算法需要不断地进行样本分类调整,不断地计算调整后的新的聚类中心,因此当数据量非常大时,算法的时间开销是非常大的

如果没有搜索结果或未解决您的问题,请直接 联系老师 获取答案。
相似问题和答案

第1题:

以下叙述中错误的是( )。

A.算法正确的程序最终一定会结束

B.算法正确的程序可以有零个输出

C.算法正确的程序可以有零个输入

D.算法正确的程序对于相同的输入一定有相同的结果


正确答案:B
解析:一个有效的算法程序必须有一个或一个以上的输出。

第2题:

K-means算法采用贪心策略,通过迭代优化来近似求解。()

此题为判断题(对,错)。


参考答案:正确

第3题:

K-means聚类是发现给定数据集的K个簇的算法。()

此题为判断题(对,错)。


正确答案:正确

第4题:

关于聚类算法K-Means和DBSCAN的叙述中,不正确的是( )。

A.K-Means和DBSCAN的聚类结果与输入参数有很大的关系
B.K-Means基于距离的概念而DBSCAN基于密度的概念进行聚类分析
C.K-Means很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇
D.当簇的密度变化较大时,DBSCAN不能很好的处理,而K-Means则可以

答案:D
解析:
本题考查数据挖掘的基础知识。K-Means和DBSCAN是两个经典的聚类算法,将相似的数据对象归类一组,不相似的数据对象分开。K-means算法基于对象之间的聚类进行聚类,需要输入聚类的个数。DBSCAN算法基于密度进行聚类,需要确定阈值,两者的聚类结果均与输入参数关系很大。DBSCAN可以处理不同大小和不同形状的簇,而K-means算法则不适合。若数据分布密度变化大,则这两种算法都不适用。

第5题:

以下哪种算法不是监督学习()

A、决策树

B、随机森林

C、神经网络

D、k-means


答案:D

第6题:

下面关于算法的叙述中,正确的是( )。

A)算法的执行效率与数据的存储结构无关

B)算法的有穷性是指算法必须能在执行有限个步骤之后终止

C)算法的空间复杂度是指算法程序中指令(或语句)的条数

D)以上三种描述都正确


正确答案:B

第7题:

K均值K-Means算法是密度聚类。()

此题为判断题(对,错)。


正确答案:错误

第8题:

以下叙述中错误的是

A) 算法正确的程序最终一定会结束

B) 算法正确的程序可以有零个输出

C) 算法正确的程序可以有零个输入

D) 算法正确的程序对于相同的输入一定有相同的结果


正确答案:B
(45)B) 解析 : 算法应该具有下列五个特性 :
① 有穷性 : 一个算法必须在执行有穷步之后结束。
② 确定性 : 算法中的每一步 , 必须有确切的含义 , 在他人理解时不会产生二义性。
③ 动态性 : 算法中描述的每一步操作都可以通过已有的基本操作执行有限次实现。
④ 输入 : 一个算法应该有零个或多个输入。
⑤ 输出 : 一个算法应该有一个或多个输出。这里所说的输出是指与输入有某种特定关系的量。

第9题:

下列叙述中正确的是( )。A.算法就是程序B.设计算法时只需要考虑数据结构的设计

下列叙述中正确的是( )。

A.算法就是程序

B.设计算法时只需要考虑数据结构的设计

C.设计算法时只需要考虑结果的可靠性

D.以上三种说法都不对


正确答案:D
D。【解析】程序(program)是为实现特定目标或解决特定问题而用计算机语言编写的命令序列的集合。设计算法时是要考虑到数据结构的设计,但是不仅仅是要考虑到数据结构的设计,还要考虑到其他的程序结构的问题。设计算法时不能只考虑结果的正确性和可靠性,还需要考虑到程序的时间冗余度等方面。所以答案选择D。

第10题:

简述k-means算法,层次聚类算法的优缺点。


正确答案:(1)k-means算法:
优点:算法描述容易,实现简单快速
不足:
簇的个数要预先给定
对初始值的依赖极大
不适合大量数据的处理
对噪声点和离群点很敏感
很难检测到“自然的”簇
(2)层次聚类算法:
BIRCH算法:
优点:利用聚类特征树概括了聚类的有用信息,节省内存空间;具有对象数目呈线性关系,可伸缩性和较好的聚类质量。
不足:每个节点只能包含有限数目的条目,工作效率受簇的形状的影响大。
C.URE算法:
优点:对孤立点的处理能力强;适用于大规模数据处理,伸缩性好,没有牺牲聚类质量。
缺点:算法在处理大量数据时必须基于抽样,划分等技术。
R.OCK算法:
优点:分类恰当,可采用随机抽样处理数据。
缺点:最坏的情况下时间复杂度级数大。
基于密度的聚类算法:可识别具有任意形状不同大小的簇,自动确定簇的数目,分离簇和环境噪声,一次扫描即可完成聚类,使用空间索引时间复杂度为O(NlbN)。

更多相关问题