问题:一个好的聚类分析方法会产生高质量的聚类,具有两个特征:()和()
查看答案
问题:请简述几种典型的多维数据的OLAP操作
问题:对于SVM分类算法,待分样本集中的大部分样本不是支持向量,移去或者减少这些样本对分类结果没有影响。
问题:噪声和伪像是数据错误这一相同表述的两种叫法。
问题:依据类信息可利用的程度,离群点挖掘可分为哪三种基本方法?
问题:关联知识
问题:广义知识
问题:什么是关于数据仓库映射的元数据?
问题:在图集合中发现一组公共子结构,这样的任务称为()。A、频繁子集挖掘B、频繁子图挖掘C、频繁数据项挖掘D、频繁模式挖掘
问题:如下哪些不是基于规则分类器的特点,()。A、规则集的表达能力远不如决策树好B、基于规则的分类器都对属性空间进行直线划分,并将类指派到每个划分C、无法被用来产生更易于解释的描述性模型D、非常适合处理类分布不平衡的数据集
问题:简述分类器设计阶段包含的3个过程。
问题:关于OLAP的特性,下面正确的是() (1)快速性(2)可分析性(3)多维性(4)信息性(5)共享性A、(1)(2)(3)B、(2)(3)(4)C、(1)(2)(3)(4)D、(1)(2)(3)(4)(5)
问题:什么是聚类?简单描述如下的聚类方法:划分方法,层次方法,基于密度的方法,基于模型的方法。为每类方法给出例子。
问题:请列出3种数据仓库产品,并说明其优缺点。
问题:如果允许一条记录触发多条分类规则,把每条被触发规则的后件看作是对相应类的一次投票,然后计票确定测试记录的类标号,称为()。A、无序规则B、穷举规则C、互斥规则D、有序规则
问题:常见的分箱方法有哪些?数据平滑处理的方法有哪些?
问题:数据变换的内容是什么?
问题:维度表一般又主键、分类层次和描述属性组成。对于主键可以选择两种方式:一种是采用自然键,另一种是采用()
问题:数据挖掘应用和一些常见的数据统计分析系统的最主要区别在于()。A、所涉及的算法的复杂性B、所涉及的数据量C、计算结果的表现形式D、是否使用了人工智能技术
问题:分类问题中常用的评价准则有精确度、查全率和查准率和()