ID3算法以()作为测试属性的选择标准。

题目
单选题
ID3算法以()作为测试属性的选择标准。
A

所划分的类个数

B

分类的速度

C

信息熵

D

信息增益

如果没有搜索结果或未解决您的问题,请直接 联系老师 获取答案。
相似问题和答案

第1题:

矢量距离算法以跳数作为距离的度量标准有什么缺陷?


参考答案:跳数体现了经过网络或路由器的个数,但是不能反映网络带宽的情况,更不能反映网络当前的状态。因此无法为路由器根据网络当前的流量情况合理调整路由提供参考的依据。

第2题:

简述ID3算法的基本思想及其主算法和建树算法的基本步骤。


正确答案: 首先找出最有判别力的因素,然后把数据分成多个子集,每个子集又选择最有判别力的因素进一步划分,一直进行到所有子集仅包含同一类型的数据为止。最后得到一棵决策树,可以用它来对新的样例进行分类。
主算法包括如下几步:
①从训练集中随机选择一个既含正例又含反例的子集(称为窗口);
②用“建树算法”对当前窗口形成一棵决策树;
③对训练集(窗口除外)中例子用所得决策树进行类别判定,找出错判的例子;
④若存在错判的例子,把它们插入窗口,重复步骤②,否则结束。
建树算法的具体步骤如下:
①对当前例子集合,计算各特征的互信息;
②选择互信息最大的特征Ak
③把在Ak处取值相同的例子归于同一子集,Ak取几个值就得几个子集;
④对既含正例又含反例的子集,递归调用建树算法;
⑤若子集仅含正例或反例,对应分枝标上P或N,返回调用处。

第3题:

下面关于ID3算法中说法错误的是()

A.ID3算法要求特征必须离散化

B.信息增益可以用熵,而不是GINI系数来计算

C.选取信息增益最大的特征,作为树的根节点

D.ID3算法是一个二叉树模型


正确答案:D

第4题:

ID3算法主要存在的缺点是什么?


正确答案:(1)ID3算法在选择根结点和各内部结点中的分枝属性时,使用信息增益作为评价标准。信息增益的缺点是倾向于选择取值较多的属性,在有些情况下这类属性可能不会提供太多有价值的信息。
(2)ID3算法只能对描述属性为离散型属性的数据集构造决策树。

第5题:

VQ测试采用得标准算法是()


正确答案:PESQ

第6题:

ID3算法的核心是在决策树叶结点上应用信息增益准则选择特征,递归地构建决策树。()

此题为判断题(对,错)。


正确答案:错误

第7题:

在ID3算法中信息增益是指()

  • A、信息的溢出程度
  • B、信息的增加效益
  • C、熵增加的程度最大
  • D、熵减少的程度最大

正确答案:D

第8题:

下列对决策树ID3算法的描述不正确的选项是?()

A.样本集的划分依据测试属性的取值进行

B.利用卡方检验来选择对因变量最有影响的自变量

C.基于信息熵来选择最佳测试属性

D.根据信息论理论,采用划分后样本集的不确定性作为衡量划分好坏的标准,用信息增益值度量不确定性


正确答案:B

第9题:

ID3算法是一种贪心算法,它以自顶向下递归各个击破方式构造决策树()


正确答案:正确

第10题:

下列对ID3算法的描述,正确的是()

  • A、每个节点的分支度都不相同
  • B、使用Information Gain作为节点分割的依据
  • C、可以处理数值型态的字段
  • D、无法处理空值的字段

正确答案:A,B,D