K-Means聚类法要求自变量之间不存在共线性,是因为()

题目
单选题
K-Means聚类法要求自变量之间不存在共线性,是因为()
A

变量存在多重共线性时无法得到聚类结果

B

变量存在多重共线性时无法解释聚类结果

C

变量存在多重共线性时,相关变量会在距离计算中占据很高的权重,从而对聚类结果有负面的影响

D

变量存在多重共线性时,得到的聚类结果是完全错误的

如果没有搜索结果或未解决您的问题,请直接 联系老师 获取答案。
相似问题和答案

第1题:

下列情况中,可能存在多重共线性的有( )。A.模型中各对自变量之间显著相关B.模型中各对自变量之间显著不相关 C.模型中存在自变量的滞后项D.模型中存在因变量的滞后项


正确答案:AC
当回归模型中两个或者两个以上的自变量彼此相关时,则称回归模型中存在多重共线性。多元线性回归模型涉及多个经济变量时,由于这些变量受相同经济环境的影响,存在共同的变化趋势,他们之间大多存在一定的相关性,这种相 
关因素是造成多重共线性的主要根源。另外,当模型中存在自变量的滞后项时也容易引起多重共线性。 

第2题:

K均值K-Means算法是密度聚类。()

此题为判断题(对,错)。


正确答案:错误

第3题:

K-means聚类是发现给定数据集的K个簇的算法。()

此题为判断题(对,错)。


正确答案:正确

第4题:

简述k-means算法,层次聚类算法的优缺点。


正确答案:(1)k-means算法:
优点:算法描述容易,实现简单快速
不足:
簇的个数要预先给定
对初始值的依赖极大
不适合大量数据的处理
对噪声点和离群点很敏感
很难检测到“自然的”簇
(2)层次聚类算法:
BIRCH算法:
优点:利用聚类特征树概括了聚类的有用信息,节省内存空间;具有对象数目呈线性关系,可伸缩性和较好的聚类质量。
不足:每个节点只能包含有限数目的条目,工作效率受簇的形状的影响大。
C.URE算法:
优点:对孤立点的处理能力强;适用于大规模数据处理,伸缩性好,没有牺牲聚类质量。
缺点:算法在处理大量数据时必须基于抽样,划分等技术。
R.OCK算法:
优点:分类恰当,可采用随机抽样处理数据。
缺点:最坏的情况下时间复杂度级数大。
基于密度的聚类算法:可识别具有任意形状不同大小的簇,自动确定簇的数目,分离簇和环境噪声,一次扫描即可完成聚类,使用空间索引时间复杂度为O(NlbN)。

第5题:

下列情况中,可能存在多重共线性的有( )
Ⅰ.模型中各对自变量之间显著相关
Ⅱ.模型中各对自变量之间显著不相关
Ⅲ.同模型中存在自变量的滞后项
Ⅳ.模型中存在因变量的滞后项

A.Ⅰ.Ⅱ
B.Ⅰ.Ⅲ
C.Ⅲ.Ⅳ
D.Ⅱ.Ⅲ

答案:B
解析:
当回归模型中两个或者两个以上的自变量彼此相关时,则称回归模型中存在多重共线性。多元线性回归模型涉及多个经济变量时,由于这些变量受相同经济环境的影响,存在共同的变化趋势,他们之间大多存在一定的相关性,这种相关因素是造成多重共线性的主要根源。另外,当模型中存在自变量的滞后项时也容易引起多重共线性。

第6题:

K-means聚类适用的数据类型是()。

A.语音数据

B.数值型数据

C.所有数据

D.字符型数据


正确答案:B

第7题:

多重共线性产生的原因复杂,以下哪一项不属于多重共线性产生的原因?(  )

A.自变量之间有相同或者相反的变化趋势
B.从总体中取样受到限制
C.自变量之间具有某种类型的近似线性关系
D.模型中自变量过多

答案:D
解析:
如果解释变量之间存在严格或者近似的线性关系,这就产生了多重共线性问题。产生多重共线性的原因包括:①经济变量之间有相同或者相反的变化趋势;②模型中包含有滞后变量;③从总体中取样受到限制等。

第8题:

K-means聚类中K值选取的方法是()。

A、密度分类法

B、手肘法

C、大腿法

D、随机选取


正确答案:A,B

第9题:

多重共线性产生的原因复杂,以下哪一项不属于多重共线性产生的原因,( )

A: 自变量之间有相同或者相应的变化趋势
B: 所有的自变量对田变量的影响都不显著
C: 自变量之间具有某种娄型的近似线性关系
D: 模型巾自变量过多

答案:D
解析:
如果解释变量之间存在严格或者近似的线性关系,这就是多重共线性,本质为解释变量之间高度相关。产生多重共线性的原因复杂,一般常见原田有:①自变量之间有相同或者相反的变化趋势:②数据取样过少,导致所有自变量对因变量的影响部不显著,③自变量之问具有某种类型的近似线性关系等。

第10题:

若数据量较大,下面哪种方式比较适合()

  • A、系统聚类
  • B、快速聚类(k-means)
  • C、A和B都可以
  • D、A和B都不可以

正确答案:B

更多相关问题