佳都新太科技股份有限公司11月招聘面试题108道20201127

在Scrapy的目录下,哪个文件负责数据抓取以后的处理工作 ()

A.spiders文件夹

B.item.py

C.pipeline.py

D.settings.py


正确答案:C


---Ring off engine! ---Ring off engine! _________________

A.Finished with engine!

B.Engine rung off!

C.Engine stand by!

D.Got it.


正确答案:B


---Finished with engine! ---Reply: Finished with engine! ---Report: __________.

A.Finished with engine

B.Engine finished

C.\

D.Well


正确答案:B


从使用者的角度看,搜索引擎(Search Engine)系统提供了一个网页界面,让其通过浏览器提交一个词语(或短语),然后很快返回一个可能和用户输入内容相关的信息列表。该列表中的每一条目至少包括标题、摘要和

A.关键词 B.URL C.页面等级 D.相关度评价


正确答案:B
搜索引擎即信息查找的发动机,一般将其定义为帮助Internet用户查询信息的软件系统。从使用者的角度看,搜索引擎提供了一个网页界面,让其通过浏览器提交一个词语或短语,然后很快返回一个可能和用户输入内容相关的信息列表。在信息列表中每一条代表一篇网页,每个条目至少有标题、URL、摘要等3个元素。


"Stand by an engine" means

A."prepare to stop the engine"

B."assemble an engine on its bedplate"

C."make an engine ready for starting"

D."dismantle an engine"


正确答案:C


佳都新太科技股份有限公司11月招聘面试题面试题面试官常问到的一些题目整理如下:问题 Q1: scrapy分为几个组成部分?分别有什么作用?可用的回答 : 分为5个部分; 1. Spiders(爬虫类) 2. Scrapy Engine(引擎) 3. Scheduler(调度器) 4. Downloader(下载器) 5. Item Pipeline(处理管道) 具体来说: Spiders:开发者自定义的一个类,用来解析网页并抓取指定url返回的内容。 Scrapy Engine:控制整个系统的数据处理流程,并进行事务处理的触发。 Scheduler:接收Engine发出的requests,并将这些requests放入到处理列队中,以便之后engine需要时再提供。 Download:抓取网页信息提供给engine,进而转发至Spiders。 Item Pipeline:负责处理Spiders类提取之后的数据。 比如清理HTML数据、验证爬取的数据(检查item包含某些字段)、查重(并丢弃)、将爬取结果保存到数据库中 问题 Q2:迭代器和生成器的区别?可用的回答 : 1)迭代器是一个更抽象的概念,任何对象,如果它的类有next方法和iter方法返回自己本身。对于 string、list、dict、tuple等这类容器对象,使用for循环遍历是很方便的。在后台for语句对容器对象调 用iter()函数,iter()是python的内置函数。iter()会返回一个定义了next()方法的迭代器对象,它在容器中 逐个访问容器内元素,next()也是python的内置函数。在没有后续元素时,next()会抛出一个 StopIteration异常 2)生成器(Generator)是创建迭代器的简单而强大的工具。它们写起来就像是正规的函数,只是在需 要返回数据的时候使用yield语句。每次next()被调用时,生成器会返回它脱离的位置(它记忆语句最后 一次执行的位置和所有的数据值) 区别:生成器能做到迭代器能做的所有事,而且因为自动创建了iter()和next()方法,生成器显得特别简洁, 而且生成器也是高效的,使用生成器表达式取代列表解析可以同时节省内存。除了创建和保存程序状态 的自动方法,当发生器终结时,还会自动抛出StopIteration异常 问题 Q3:为何基于tcp协议的通信比基于udp协议的通信更可靠?可用的回答 : TCP的可靠保证,是它的三次握手双向机制,这一机制保证校验了数据,保证了他的可靠性。 而UDP就没有了,udp信息发出后,不验证是否到达对方,所以不可靠。 不过UDP的发送速度是TCP比不了的,而且UDP的反应速度更快。 问题 Q4:什么是PYTHONPATH?可用的回答 :它是导入模块时使用的环境变量。每当导入模块时,也会查找PYTHONPATH以检查各个目录中是否存在导入的模块。解释器使用它来确定要加载的模块。问题 Q5:什么是局域网和广域网?可用的回答 : 局域网:(Local Area Network,LAN), 局域网是一个局部范围的计算计组, 比如家庭网络就是一个小型的局域网,里面包含电脑、手机和平板等,他们共同连接到你家的路由器上。 又比如学校的机房就是一个局域网,里面有几百几千台电脑, 当机房无法上外网时,但是电脑之间仍可以通信,你们可以通过这个局域网来打CS 、玩红警。 理论上,局域网是封闭的,并不可以上外网,可以只有两台电脑,也可以有上万台。 广域网:(WAN,Wide Area Network),广域网的范围就比较大了, 可以把你家和别人家、各个省、各个国家连接起来相互通信。 广域网和局域网都是从范围的角度来划分的, 广域网也可以看成是很多个局域网通过路由器等相互连接起来。 问题 Q6:列举面向对象中带双下划线的魔术方法可用的回答 : _doc_ 表示类的描述信息 _module_ 表示当前操作的对象在哪个模块 _class_ 表示当前操作的对象的类是什么 _init_ 构造方法,通过类创建对象时,自动触发执行 _new_负责创建一个类的对象 _del_ 析构方法,当对象在内存中被释放时,自动触发执行 _call_ 对象后面加括号,触发执行 _dict_ 类或对象中的所有成员 _str_如果一个类中定义了_str_方法,那么在打印 对象 时,默认输出该方法的返回 问题 Q7:Python中的docstring是什么?可用的回答 :Python文档字符串称为docstring,它是一种记录Python函数,模块和类的方法。可以通过内置方法_doc_获取问题 Q8:什么是socket?简述基于tcp协议的套接字通信流程?可用的回答 : 套接字: 也称为BSD套接字,是支持TCP/IP的网络通信的基本操作单元, 可以看做是不同主机之间的进程进行双向通信的端点, 简单的说就是通信的两方的一种约定,用套接字中的相关函数来完成通信过程。 应用层通过传输层进行数据通信时,TCP和UDP会遇到同时为多个应用程序进程提供并发服务的问题 通信流程: 1. 服务器先用 socket 函数来建立一个套接字,用这个套接字完成通信的监听。 2. 用 bind 函数来绑定一个端口号和 IP 地址。 因为本地计算机可能有多个网址和 IP,每一个 IP 和端口有多个端口。需要指定一个 IP和端口进行监听。 3. 服务器调用 listen 函数,使服务器的这个端口和 IP 处于监听状态,等待客户机的连接。 4. 客户机用 socket 函数建立一个套接字,设定远程 IP 和端口。 5. 客户机调用 connect 函数连接远程计算机指定的端口。 6. 服务器用 accept 函数来接受远程计算机的连接,建立起与客户机之间的通信。 7. 建立连接以后,客户机用 write 函数向 socket 中写入数据。也可以用 read 函数读取服务器发送来的数据。 8. 服务器用 read 函数读取客户机发送来的数据,也可以用 wr

网页抓取策略中,( )从起始网页开始选取其中一个URL 进入该网页,分析完该网页中的URL 后再选择其中一个URL 再进入,如此深入地抓取下去,直到处理完一条路线之后再处理下一条路线。

A.深度优先搜索策略
B.广度优先搜索策略
C.最佳优先搜索策略
D.复合优先搜索策略

答案:A
解析:
这是一个阅读理解题,实际上题干就是解释深度优先的概念。


---()! ---Engine dead slow astern!

  • A、Dead slow astern
  • B、Engine slow astern
  • C、Engine half astern
  • D、Ready

正确答案:A


---Stand by engine! ---Stand by engine!()

  • A、Engine stand by!
  • B、Finished with engine!
  • C、Engine by stand!
  • D、OK.

正确答案:A


---Ring off engine! ---Ring off engine! ()

  • A、Finished with engine!
  • B、Engine rung off!
  • C、Engine stand by!
  • D、Got it.

正确答案:B


---Finished with engine! ---Reply: Finished with engine! ---Report: ().

  • A、Finished with engine
  • B、Engine finished
  • C、\
  • D、Well

正确答案:B

更多 “佳都新太科技股份有限公司11月招聘面试题108道20201127” 相关考题
考题 单选题Maximum horsepower of a diesel engine is attained ().A when the engine RPM is pulled down by overloadB at rated engine RPMC at 95 % of rated engine RPMD at 95 % of a properly adjusted governor RPM with the engine under full load正确答案:B解析:暂无解析

考题 单选题Fuel oil injected into the cylinder of a diesel engine just after the piston passes top dead center, will()A increase engine powerB increase engine loadC decrease engine powerD improve fuel economy正确答案:C解析:暂无解析

考题 单选题The diesel engine exhaust gas bypass, as fitted with some waste heat boilers, is installed to ()A prevent engine back pressure at heavy loadsB increase total engine efficiency at low loadsC prevent boiler corrosion at low engine loadsD improve engine fuel consumption at any load正确答案:C解析:暂无解析

考题 单选题Before using a fixed CO2 system to fight an engine room fire,you must().A secure the engine room ventilationB secure the machinery in the engine roomC evacuate all engine room personnelD All of the above正确答案:C解析:暂无解析

考题 单选题In a four-stroke engines the camshaft rotates at ().A half the engine rotational speedB twice the engine rotational speedC the engine rotational speedD four times the engine rotational speed正确答案:C解析:暂无解析

考题 Which statement about the DVS engine is true?()A、the DVS engine can useWebroot and McAfee scanning in parallelB、the DVS engine generates the WBRSC、the DVS engine never inspects the client HTTP requestD、the DVS engine is only used for Layer 4 traffic monitoring正确答案:A

考题 单选题Stand by engine. ()A Get the engine ready.B Ring off engine.C Stop engine.D Stand on it.正确答案:D解析:暂无解析

考题 单选题My ship’s engine responds well to telegraph orders and takes about 80 seconds to reverse from full speed ahead to full speed astern. This sentence().A indicates the engine's particularsB tells the engine's functionC shows the engine's typeD refers to the engine's information正确答案:B解析:暂无解析

考题 单选题“Stand by engine” means ().A prepare to stop the engineB assemble an engine on its bedplateC make an engine ready for startingD make an engine run steadily正确答案:C解析:暂无解析

考题 单选题Why a gearbox is needed in a ship driven by a medium-speed diesel engine?()A To reduce the main engine speedB To increase the main engine speedC To govern the main engine speedD To fix the propeller shaft正确答案:A解析:暂无解析