上海海得控制系统股份有限公司11月招聘面试题127道2020113

DB物理数据结构管理的原则中,不正确的是()

A.数据量大的表分放在不同磁盘上

B.将I/O访问分布在尽可能多的磁盘上

C.将访问量最大的几个不同的表，分放在不同磁盘上

D.数据表和索引放在一起存储

参考答案：D

______是数据库技术与并行处理技术相结合的产物，是为了处理大型复杂数据库管理应用领域中的海量数据而提出的，该DBS的硬件平台是并行计算机系统．使用多个CPU和多个磁盘进行并行数据处理和磁盘访问操作，以提高数据库系统的数据处理和I/O速度。

A．集中式数据库系统

B．并行数据库系统

C．分布式数据库系统

D．客户/服务器数据库系统

正确答案：B
解析：并行DBS是数据库技术与并行处理技术相结合的产物，是为了处理大型复杂数据库管理应用领域中的海量数据而提出的，该DBS的硬件平台是并行计算机系统，使用多个CPU和多个磁盘进行并行数据处理和磁盘访问操作，以提高数据库系统的数据处理和I/O速度。

当前有数据库表“学生”表，要使该数据库表从数据库中移出并将其从磁盘上删除，应使用的语句为：REMOVE TABLE学生______

正确答案：DELETE
DELETE 解析：可以用REMOVE TABLE命令将一个表从数据库中移出，命令格式是：
REMOVE TABLE TableName|?[DELETE]
其中，参数TableName给出了要从当前数据库中移去的表的表名，如果使用问号“?”则显示“移去”对话框，从中选择要移去的表；如果使用参数DELETE，则在把所选表从数据库中移出之外，还将其从磁盘上删除。

优化数据库数据的存储结构和存取方法有利于提高数据的查询效率。下列不利于提高系统查询效率的优化方案是

A．为经常出现在查询条件中的列建立索引

B．为频繁进行排序的列建立索引

C．将数据文件和日志文件分别放置在不同磁盘上

D．将表的数据和索引放置在同一磁盘上

正确答案：D

文件管理方式本质上是把数据组织成( )的形式存储在磁盘上。

A. 文件

B. 表

C. 记录

D. 数据库

正确答案：A

上海海得控制系统股份有限公司11月招聘面试题面试题面试官常问到的一些题目整理如下：问题 Q1：python提供的内置类型是什么？可用的回答：可变类型的内置类型: List Sets Dictionaries 不可变的内置类型: Strings Tuples Numbers 问题 Q2：数据库的优化？可用的回答： 1. 优化索引、SQL 语句、分析慢查询； 2. 设计表的时候严格根据数据库的设计范式来设计数据库； 3. 使用缓存，把经常访问到的数据而且不需要经常变化的数据放在缓存中，能节约磁盘IO； 4. 优化硬件；采用SSD，使用磁盘队列技术(RAID0,RAID1,RDID5)等； 5. 采用MySQL 内部自带的表分区技术，把数据分层不同的文件，能够提高磁盘的读取效率； 6. 垂直分表；把一些不经常读的数据放在一张表里，节约磁盘I/O； 7. 主从分离读写；采用主从复制把数据库的读操作和写入操作分离开来； 8. 分库分表分机器（数据量特别大），主要的的原理就是数据路由； 9. 选择合适的表引擎，参数上的优化； 10. 进行架构级别的缓存，静态化和分布式； 11. 不采用全文索引； 12. 采用更快的存储方式，例如 NoSQL存储经常访问的数据问题 Q3：Python是如何进行内存管理的？可用的回答：从三个方面来说,一对象的引用计数机制,二垃圾回收机制,三内存池机制一、对象的引用计数机制 Python内部使用引用计数，来保持追踪内存中的对象，所有对象都有引用计数。引用计数增加的情况： 1，一个对象分配一个新名称 2，将其放入一个容器中（如列表、元组或字典）,引用计数减少的情况： 1，使用del语句对对象别名显示的销毁 2，引用超出作用域或被重新赋值 sys.getrefcount( )函数可以获得对象的当前引用计数多数情况下，引用计数比你猜测得要大得多。对于不可变数据（如数字和字符串），解释器会在程序的不同部分共享内存，以便节约内存。二、垃圾回收 1，当一个对象的引用计数归零时，它将被垃圾收集机制处理掉。 2，当两个对象a和b相互引用时，del语句可以减少a和b的引用计数，并销毁用于引用底层对象的名称。然而由于每个对象都包含一个对其他对象的应用，因此引用计数不会归零，对象也不会销毁。（从而导致内存泄露）。为解决这一问题，解释器会定期执行一个循环检测器，搜索不可访问对象的循环并删除它们。三、内存池机制 Python提供了对内存的垃圾收集机制，但是它将不用的内存放到内存池而不是返回给操作系统。 1，Pymalloc机制。为了加速Python的执行效率，Python引入了一个内存池机制，用于管理对小块内存的申请和释放。 2，Python中所有小于256个字节的对象都使用pymalloc实现的分配器，而大的对象则使用系统的malloc。 3，对于Python对象，如整数，浮点数和List，都有其独立的私有内存池，对象间不共享他们的内存池。也就是说如果你分配又释放了大量的整数，用于缓存这些整数的内存就不能再分配给浮点数。问题 Q4：如何在Python中删除文件？可用的回答：使用命令os.remove(filename) 删除文件或 os.unlink(filename) 删除快捷方式问题 Q5：迭代器和生成器的区别？可用的回答： 1）迭代器是一个更抽象的概念，任何对象，如果它的类有next方法和iter方法返回自己本身。对于 string、list、dict、tuple等这类容器对象，使用for循环遍历是很方便的。在后台for语句对容器对象调用iter()函数，iter()是python的内置函数。iter()会返回一个定义了next()方法的迭代器对象，它在容器中逐个访问容器内元素，next()也是python的内置函数。在没有后续元素时，next()会抛出一个 StopIteration异常 2）生成器（Generator）是创建迭代器的简单而强大的工具。它们写起来就像是正规的函数，只是在需要返回数据的时候使用yield语句。每次next()被调用时，生成器会返回它脱离的位置（它记忆语句最后一次执行的位置和所有的数据值）区别：生成器能做到迭代器能做的所有事,而且因为自动创建了iter()和next()方法,生成器显得特别简洁, 而且生成器也是高效的，使用生成器表达式取代列表解析可以同时节省内存。除了创建和保存程序状态的自动方法,当发生器终结时,还会自动抛出StopIteration异常问题 Q6：django对数据查询结果排序怎么做，降序怎么做，查询大于某个字段怎么做？可用的回答：排序使用order_by() 降序需要在排序字段名前加- 查询字段大于某个值：使用filter(字段名_gt=值) 问题 Q7：跨域请求问题django怎么解决的（原理）？可用的回答： 1. 启用中间件 2. post请求 3. 验证码 4. 表单中添加%csrf_token%标签问题 Q8：什么是猴子补丁？可用的回答：在运行时动态修改类和模块问题 Q9：什么是正则的贪婪匹配？可用的回答：如： str=abcaxc; p=ab.*c; 贪婪匹配:正则表达式一般趋向于最大长度匹配，也就是所谓的贪婪匹配。如上面使用模式p匹配字符串 str，结果就是匹配到：abcaxc(ab.*c)。非贪婪匹配：就是匹配到结果就好，就少的匹配字符。如上面使用模式p匹配字符串str，结果就是匹配到：abc(ab.*c) 问题 Q10：创建一个简单tcp服务器需要的流程？可用的回答： 1.socket创建一个套接字 2.bind绑定ip和port

试题（58）

对于提升磁盘I/O性能问题，以下表述正确的是（58）。

（58）

A．数据库对象在物理设备上的合理分布能改善系统读写性能

B．磁盘镜像可以提高磁盘读写的速度

C．建议把数据库、回滚段、日志放在同一块设备上，以提高数据读写的性能

D．将磁盘升级到更大容量可提高磁盘I/O速度

正确答案：A

试题（58）分析
本题考查提升磁盘I/O的方法。
正确的概念是：
数据库对象在物理设备上的合理分布能改善系统读写性能。
不是所有的磁盘镜像都可以提高磁盘读写的速度。建议把数据库、回滚段、日志不要放在同一块设备上，以提高数据读写的性能。
将磁盘升级到更大容量并不能提高磁盘I/O速度。
参考答案
（58）A

磁盘技术是指()

A、磁头磁盘技术

B、接口技术

C、电机技术

D、数据缓存及保护技术

参考答案：ABCD

ADO.NET数据库访问中,为了减少数据库调用的次数,把数据缓存在内存中,采用()实现。

A、DataSet

B、SqlConnection

C、SqlDataReader

D、SqlDataAdapter

正确答案:D

请详细阅读有关Web应用架构设计方面的说明，在答题纸上回答问题1至问题3。

【说明】

某软件公司开发运维了一个社交网站系统，该系统基于开源软件平台LAMP(Linux+Apache+MySQL+PHP)构建，运行一段时间以来，随着用户数量及访问量的增加，系统在Web服务器负载、磁盘I/O等方面出现了明显瓶颈，已不能满足大量客户端并发访问的要求，因此公司成立了专门的项目组，拟对系统架构进行调整以提高系统并发处理能力。目前系统采用了传统的三层结构，系统架构如图5-1所示。

图5-1 某社交网站系统架构

【问题1】(10分)

针对目前出现的Web服务器负载过大问题，项目组决定在客户端与中间层Web服务器之间引入负载均衡器，通过中间层Web服务器集群来提高Web请求的并发处理能力。在讨论拟采用的负载均衡机制时，王工提出采用基于DNS的负载均衡机制，而李工则认为应采用基于反向代理的负载均衡机制，项目组经过讨论，最终确定采用李工提出的方案。请用200字以内的文字，分别简要说明两个机制的基本原理;并从系统执行效率、安全性及简易性等方面将两种机制进行对比，将对比结果填入表5-1中。

【问题2】(7分)

针对并发数据库访问所带来的磁盘I/O瓶颈问题，项目组决定在数据层引入数据库扩展机制。经过调研得知系统数据库中存储的主要数据为以用户标识为索引的社交网络数据，且系统运行时发生的大部分数据库操作为查询操作。经过讨论，项目组决定引入数据库分区和MySQL主从复制两种扩展机制。数据库分区可采用水平分区和垂直分区两种方式，请用350字以内的文字说明在本系统中应采用哪种方式及其原因，并分析引入主从复制机制给系统带来的好处。

【问题3】(8分)

为进一步提高数据库访问效率，项目组决定在中间层与数据层之间引入缓存机制。赵工开始提出可直接使用MySQL的查询缓存(query cache)机制，但项目组经过分析好友动态显示等典型业务的操作需求，同时考虑已引入的数据库扩展机制，认为查询缓存尚不能很好地提升系统的查询操作效率，项目组最终决定在中间层与数据层之间引入Memcached分布式缓存机制。

(a)请补充下述关于引入Memcached后系统访问数据库的基本过程：系统需要读取后台数据时，先检查数据是否存在于(1)中，若存在则直接从其中读取，若不存在则从(2)中读取并保存在(3)中;当(4)中数据发生更新时，需要将更新后的内容同步到(5)实例中。(备选答案：数据库、Memcacbed 缓存)

(b)请结合已知信息从缓存架构、缓存有效性及缓存数据类型等方面分析使用Memcached代替数据库查询缓存的原因。

正确答案：
【问题1】(10分)
基于DNS的负载均衡是在DNS服务器中为同一个主机名配置多个IP地址，在应答DNS查询时，DNS服务器对每个查询将以DNS文件中主机记录的IP地址按顺序返回不同的解析结果，将客户端的访问引导到不同的节点上去，使得不同的客户端访问不同的节点，从而达到负载均衡的目的。
反向代理负载均衡。反向代理负载均衡是将来自Internet上的连接请求以反向代理的方式动态地转发给内部网络上的多个节点进行处理，从而达到负载均衡的目的。
(1)否
(2)是
(3)否
(4)是
(5)否
(6)是
(7)是
(8)否
【问题2】(7分)
本系统应采用水平分区，因为社交网络数据库的数据表记录数量非常庞大，而且记录的访问，大多集中于本地区域，所以水平分区能极大提高处理效率。
主从复制机制使得同样的数据，存在多个副本，这样让用户查询数据时，可以选择该数据最近的副本进行访问，提高效率，降低资源使用时的冲突。
【问题3】(8分)
(1)Memcached
(2)数据库
(3)Memcached
(4)数据库
(5)Memcached
Memcached相比数据库查询缓存：
缓存架构：数据库缓存只是将查询结果进行缓存，适用面很窄，而Memcached是将数据库中的表进行缓存，对于在这些表之上的操作均可适用。
缓存有效性：Memcached缓存时效较长，只要未更新，就属于有效状态，而数据查询缓存时效较短(具体时效与配置有关)，所以在此方面Memcached有优势。
缓存数据类型：Memcached缓存数据为表级，而数据库查询缓存为元组级。

以下有关FusionStorage相关内容描述正确的有?( )

A、FusionStorage OSD在收到VBS发送的IO操作时，会将IO缓存在SSD Cache后完成节点操作，无需等待写入标本磁盘

B、FusionStorage支持将服务器内存用作读缓存，NVDIMM和SSD用作写缓存

C、FusionStorage的读缓存采用分层机制，第一层为内存Cache，内存Cache采用LRU机制缓存数据;第二层为SSD Cache，SSD Cache采用热点读机制，系统会自动缓存数据到SSD中，同时会将长时间未被访问的数据移除SSD

D、FusionStorage集群内各服务器节点和带宽都均匀分布到各个节点服务器上，不存在独立服务系统中大量磁盘共享计算设备及存储设备之间有限的带宽问题

答案：ABCD

上海海得控制系统股份有限公司11月招聘面试题127道2020113

更多 “上海海得控制系统股份有限公司11月招聘面试题127道2020113” 相关考题

相关内容

最新试卷

热门试卷