DB中的数据真正要存储到DW中,还必须经过ETL过程,即()()和()的过程。

题目

DB中的数据真正要存储到DW中,还必须经过ETL过程,即()()和()的过程。

参考答案和解析
正确答案:抽取;转换;装载
如果没有搜索结果或未解决您的问题,请直接 联系老师 获取答案。
相似问题和答案

第1题:

What are the four basic Data Flow steps of an ETL process?

在ETL过程中四个基本的过程分别是什么?


正确答案:
答:
Kimball数据仓库构建方法中,ETL的过程和传统的实现方法有一些不同,主要分为四个阶段,分别是抽取(extract)、清洗(clean)、一致性处理(comform)和交付(delivery),简称为ECCD。
1.抽取阶段的主要任务是:
读取源系统的数据模型。
连接并访问源系统的数据。
变化数据捕获。
抽取数据到数据准备区。
2.清洗阶段的主要任务是:
清洗并增补列的属性。
清洗并增补数据结构。
清洗并增补数据规则。
增补复杂的业务规则。
建立元数据库描述数据质量。
将清洗后的数据保存到数据准备区。
3.一致性处理阶段的主要任务是:
一致性处理业务标签,即维度表中的描述属性。
一致性处理业务度量及性能指标,通常是事实表中的事实。
去除重复数据。
国际化处理。
将一致性处理后的数据保存到数据准备区。
4.交付阶段的主要任务是:
加载星型的和经过雪花处理的维度表数据。
产生日期维度。
加载退化维度。
加载子维度。
加载1、2、3型的缓慢变化维度。
处理迟到的维度和迟到的事实。
加载多值维度。
加载有复杂层级结构的维度。
加载文本事实到维度表。
处理事实表的代理键。
加载三个基本类型的事实表数据。
加载和更新聚集。
将处理好的数据加载到数据仓库。
从这个任务列表中可以看出,ETL的过程和数据仓库建模的过程结合的非常紧密。换句话说,ETL系统的设计应该和目标表的设计同时开始。通常来说,数据仓库架构师和ETL系统设计师是同一个人。

第2题:

Describe the different types of ETL metadata and provide examples of each.

举例说明各种ETL过程中的元数据。


正确答案:
答:元数据是ETL项目组面对的一个非常重要的主题,对于整个数据仓库项目也是非常重要的一部分。对于元数据的分类和使用没有很确定的定义。
通常来说,我们可以把元数据分为三类,分别为业务元数据(Business Metadata),技术元数据(Technical Metadata)和过程处理元数据(Process Execution Metadata)。
业务元数据,是从业务的角度对数据的描述。通常是用来给报表工具和前端用户对数据进行分析和使用提供帮助。
技术元数据,是从技术的角度对数据的描述。通常包括数据的一些属性,如数据类型、长度、或者数据概况分析后一些结果。
过程处理元数据,是ETL处理过程中的一些统计数据,通常包括有多少条记录被加载,多少条记录被拒绝接受等数据

第3题:

DB中的数据属于①数据,DW中的数据属于②数据;DB属于③驱动方式,DW属于④驱动方式。

A.历史型

B.操作型

C.更新型

D.分析型


正确答案:B

第4题:

DB中的数据属于__(1)__数据,DW中的数据属于__(2)__数据;DB属于__(3)__驱动方式,DW属于__(4)__驱动方式。空白(3)处应选择()

  • A、事务
  • B、用户
  • C、分析
  • D、系统

正确答案:A

第5题:

在大数据的关键技术中,数据抽取工作ETL是( )过程主要使用的技术

A:数据采集
B:数据存储
C:数据清洗
D:数据分析

答案:A
解析:
大数据从数据源经过分析挖掘到最终获得价值一般需要经过5个主要环节,包括数据采集、
数据存储与管理、计算处理、数据分析和知识展现。在数据采集阶段主要使用的技术是数据抽取工具ETL。在数据存储环节主要有结构化数据、非结构化数据和半结构化数据的存储与访问。

第6题:

When should data be set to disk for safekeeping during the ETL?

简述ETL过程中哪个步骤应该出于安全的考虑将数据写到磁盘上?


正确答案:
答:
Staging的意思就是将数据写到磁盘上。出于安全及ETL能方便重新开始,在数据准备区(Staging Area)中的每个步骤中都应该将数据写到磁盘上,即生成文本文件或者将建立关系表保存数据,而不应该以数据不落地方式直接进行ETL。
例如,在数据抽取阶段,我们需要连接到源系统,为了对源系统的影响尽量小,我们需要将抽取的数据保存成文本文件或者放入数据准备区的表中,这样,当ETL过程出现错误而失败时,我们就可以从这些文本文件开始ETL,而不需要再次影响源系统。

第7题:

数据仓库的数据ETL过程中,ETL软件的主要功能包括:

A.数据抽取

B.数据转换

C.数据加载

D.数据稽核


参考答案:A,B,C

第8题:

有工程师建议在数据仓库的模型中,采用DB(源数据库)-ODS(操作数据存储) -DW(数据仓库)的模式,以替代DB(源数据库)—DW(数据仓库)的模式,请用150字以内文字简要描述ODS(操作数据存储)与DW(数据仓库)的最大差别。


正确答案:最大差别是两者存放的数据内容不同ODS存储了当前或最近的数据而DW存储了历史数据;ODS存储了细节数据而DW存储了细节数据和综合数据:ODS可联机更新数据而DW中数据一般为不可变的快照。
最大差别是两者存放的数据内容不同,ODS存储了当前或最近的数据,而DW存储了历史数据;ODS存储了细节数据,而DW存储了细节数据和综合数据:ODS可联机更新数据,而DW中数据一般为不可变的快照。

第9题:

在大数据的关键技术中,数据抽取工作ETL是( )过程主要使用的技术。

A.数据采集
B.数据存储
C.数据清洗
D.数据分析

答案:A
解析:
在数据采集阶段主要使用的技术是数据抽取工具ETL。

第10题:

DB中的数据属于__(1)__数据,DW中的数据属于__(2)__数据;DB属于__(3)__驱动方式,DW属于__(4)__驱动方式。空白(2)处应选择()

  • A、历史型
  • B、操作型
  • C、更新型
  • D、分析型

正确答案:D

更多相关问题