数据仓库索引技术包括哪些内容?

题目
问答题
数据仓库索引技术包括哪些内容?
参考答案和解析
正确答案: 1、位索引技术(Bit-wise)
位索引技术在存储数据的方式上与传统的关系数据库有所不同:它不是以"行纪录"而是以"列"为单位存储数据,即对数据进行垂直分割。对于每一个记录的字段满足查询条件的真假值用1或0的方式表示,或者用多位二进制表示。
2、标识技术
使用标准的数据库技术来存储数据仓库是十分昂贵的。较好的替代方法是用基于标识的技术来存储数据仓库。利用关系数据库技术,当加入一个记录到系统中时,会追加此数据的一个物理代表块到磁盘上。而标识技术则是将某一属性中可能会重复出现的几个值,分别用不同的标识(例如数字)替代,这样数据仓库中存储的将不是具体的文字,而是体积较小的标识。使用这种方法可以减少每一条目的大小,从而大大减少数据量。当然,这种技术需要一一记录每一个标识所对应的意义,因此,数据越多,表示数据就越比标准的、基于记录的数据有利。
3、广义索引
即根据用户需求,在从数据库导入数据时预先为查询频率可能较高的数据建立索引。广义索引在处理最大值和最小值的问题时,效果是十分明显的,也较易于实现。在从数据库环境抽取数据,并向数据仓库中装载的同时,就可以根据用户的需要建立许多这样的索引,这样就不用为了这些内容而搜索数据仓库。在引入新的数据库内容时需要更新广义索引。
4、R-树索引
R-树索引支持多维数据建立索引,是一种面向多维空间对象的索引结构,是一种利用β-树的某些本质特征来处理多维数据的索引结构。我们可以将被β树索引的关系看作一维向量,一个记录是向量中某一点上的值。R-树索引中存储的信息与β-树索引不同。R-树内部结点中的键值则是多维空间中的一个区域,因此不仅要存储行标识信息,同时要存储被索引对象的边界信息。R-树的每棵子树覆盖的区域都在该结点的区域内,叶子结点中的记录指向它的键值所覆盖的空间对象,如点、块等。
由于OLAP的多维性质,用R树为它建立索引成为了自然的选择。多维数组的组织方式之一——方体树就是R树在多位数据中的一个应用。
虽然直观上可以将OLAP数据看做是多维的,但是这种多维数据与多维空间对象有较大的差别。例如我们需要按各种维的组合、度量和维的组合查询多维数据,而考察空间对象时则常从所有的维出发而根据部分维进行查询的情况不多。因此根据所有的维建立的R-树索引可以较好地满足多维空间对象查询需要,而利用它为多维数据建立索引仍有较大的不足。
解析: 暂无解析
如果没有搜索结果或未解决您的问题,请直接 联系老师 获取答案。
相似问题和答案

第1题:

何谓搜索引擎营销,搜索引擎营销的方法有哪些?何谓搜索引擎优化,搜索引擎优化的内容包括哪些方面?


正确答案:搜索引擎营销指利用搜索引擎来进行营销的过程.方法有直接利用搜索引擎进行营销,或利用中间商搜索引擎进行营销.搜索引擎优化是用搜索引擎以最快的速度把自己的产品推广出去.内容包括最快搜索,产品注册,推广产品,产品销售.售后反馈.电子商务的类型:企业与消费者之间的电子商务;企业与企业之间电子商务;企业与政府间电子商务;消费者与政府之间的电子商务

第2题:

数据仓库技术是决策支持系统的另一技术,下列列出的哪些是数据仓库的基本特征?

Ⅰ.数据仓库的数据是面向主题的

Ⅱ.数据仓库的数据是集成的

Ⅲ.数据仓库的数据是相对稳定的

Ⅳ.数据仓库的数据是体现历史变化的

A.Ⅰ,Ⅲ和Ⅳ

B.全部

C.Ⅰ、Ⅱ和Ⅲ

D.Ⅱ,Ⅲ和Ⅳ


正确答案:B
解析:数据仓库技术是决策支持系统的另一技术,它的特征可以归纳为四点:数据仓库中的数据是面向主题进行组织的;数据仓库的数据是集成的,数据仓库中的数据是从原有的分散的数据库中抽取来的;数据仓库的数据是相对稳定的,主要是供企业决策分析之用,所涉及的数据操作主要是数据查询,一般情况下并不进行修改操作;数据仓库的数据是体现历史变化的,数据的相对稳定是针对应用来说的,也就是说,数据仓库的用户进行分析处理时是不进行数据更新操作的。考点链接:数据仓库的基本概念。

第3题:

信息资料索引包括( )

A、要点索引

B、指示索引

C、内容索引

D、编目索引


正确答案:CD

第4题:

简述CA的化学物质索引包括哪些内容?


正确答案:化学物质索引中的化学物质都有化学物质登记号。这些物质都符合3个条件a.组成原子数已知;b.价键清楚;c.立体化学结构明确。

第5题:

在调查报告的序言部分,通常包括哪些内容?()

  • A、扉页
  • B、目录或索引
  • C、摘要
  • D、引言

正确答案:A,B

第6题:

什么是索引语言?索引词表的规范化内容包括哪些方面?


参考答案:文献存贮时,文献标识按照一定的语言加以描述,而进行检索时,情报提问也按照相应的语言予以表达.这种把标引与检索联系起来,对概念进行规范化处理.使检索得以有效进行的语言就索引语言。
  其规范化的范围主要有以下三种:
  第一,同义规范,是指对自然语言中的同义词.准同义词的规范。
  第二,词义规范,指对自然语言中多义词,同形异义词的规范.这种规范主要是对主题词的概念作进一步说明,以确保在标引和检索时正确运用.词义规范主要有以下三种形式:(1)范围注释.(2)含义注释.(3)观点注释。
  第三,词类规范,是指对主题词选词范围的一种控制.在自然语言中,词的种类主要有二种:一种是实词,主要包括名词.动词.形容词.代词.数词.和量词等.一种是虚词,主要包括介词.联词.副词.助词等.作为文献检索用的语言词汇,必须具有实际意义,并能反映事物本质属性.因此,主题词的选词范围,一般应控制在实词之中,即名词或动名词.其它词,如形容词.数词.量词等应控制使用,而动词,代词和虚词应完全避免。

第7题:

数据仓库后端工具和程序包括哪些?


正确答案: 1,数据提取:从多个外部的异构数据源收集数据;
2,数据清理:检测数据中的粗偶并作可能的订正;
3,数据变换:将数据由历史或主机的格式转化为数据仓库的格式;
4,装载:排序、汇总、合并、计算视图、检查完整性,并建立索引和分区;
5,刷新:将数据源的更新传播到数据仓库中。

第8题:

信息资料索引包括( )。

A.要点索引

B.指示索引

C.内容索引

D.篇目索引


正确答案:CD

第9题:

简述CA累积索引包括哪些索引?


正确答案:化学物质索引;普通主题索引;分子式索引;专利索引;著者索引。

第10题:

搜索引擎技术包括哪些?()

  • A、目录式搜索引擎
  • B、通用搜索引擎
  • C、元搜索引擎
  • D、Google搜索引擎

正确答案:A,B,C