ID3算法以()作为测试属性的选择标准。
第1题:
机器学习中做特征选择时,可能用到的方法有()
A.卡方
B.信息增益
C.平均互信息
D.期望交叉熵
E.以上都有
第2题:
与统计信息分类属性的归类和划分无关的是( )。
A.关于管理规定标准
B.信息分类编码标准
C.关于数据录入和数据审核流程
D.产品[商品、物资]目录
第3题:
此题为判断题(对,错)。
第4题:
此题为判断题(对,错)。
第5题:
下列哪个不属于常用的文本分类的特征选择算法()
A.卡方检验值
B.互信息
C.信息增益
D.主成分分析
第6题:
对于信息增益,决策树分裂节点,下面说法正确的是()
1.纯度高的节点需要更多的信息去区分
2.信息增益可以用”1比特-熵”获得
3.如果选择一个属性具有许多归类值,那么这个信息增益是有偏差的
A.1
B.2
C.2和3
D.所有以上
第7题:
下面关于ID3算法中说法错误的是()
A.ID3算法要求特征必须离散化
B.信息增益可以用熵,而不是GINI系数来计算
C.选取信息增益最大的特征,作为树的根节点
D.ID3算法是一个二叉树模型
第8题:
按照建设工程项目信息的分类,下列不属于按信息的内容属性分类的信息是( )。
A.招投标信息
B.管理类信息
C.组织类信息
D.法规类信息
第9题:
A.样本集的划分依据测试属性的取值进行
B.利用卡方检验来选择对因变量最有影响的自变量
C.基于信息熵来选择最佳测试属性
D.根据信息论理论,采用划分后样本集的不确定性作为衡量划分好坏的标准,用信息增益值度量不确定性
第10题:
A.经验熵
B.经验条件熵
C.信息增益
D.互信息