在网络爬虫的爬行策略中,应用最为基础的是()

题目
多选题
在网络爬虫的爬行策略中,应用最为基础的是()
A

深度优先遍历策略

B

广度优先遍历策略

C

高度优先遍历策略

D

反向链接策略

E

大站优先策略

如果没有搜索结果或未解决您的问题,请直接 联系老师 获取答案。
相似问题和答案

第1题:

按照()爬取的网页内容根据目录层次深浅来爬行页面,处于较浅目录层次的页面首先被爬行,当同一层次中的页面爬行完毕后,爬虫再深入下一层继续爬行。

A、深度优先策略

B、广度优先策略

C、PageRank优先策略

D、随机爬行策略


参考答案:B

第2题:

()采集的目标是那些大部分内容不能通过静态链接获取的、隐藏在搜索表单后的,只有用户提交一些关键词才能获得的Web页面。

A、聚焦网络爬虫

B、增量式网络爬虫

C、通用网络爬虫

D、深层网络爬虫


参考答案:D

第3题:

TCP/IP网络中应用最为广泛的网络管理协议是()。

A、RIP

B、SNMP

C、SMTP

D、IGMP


参考答案:B

第4题:

聚焦网络爬虫常用的爬行策略有深度优先策略、广度优先策略。()

此题为判断题(对,错)。


参考答案:错误

第5题:

以下关于网络爬虫的说法,不正确的是()。

A、网络爬虫还可以对网页建立索引

B、有些网络爬虫能够从网站抓取内容聚合起来

C、有些网络爬虫甚至能发动DDos攻击、发送垃圾邮件等

D、隐藏在表单后的信息无法被网络爬虫发现


参考答案:D

第6题:

()爬行过程中最重要部分就是表单填写及处理。

A、聚焦网络爬虫

B、增量式网络爬虫

C、通用网络爬虫

D、深层网络爬虫


参考答案:D

第7题:

()实现的两个主要目标为保持本地页面集中存储的页面为最新页面和提高本地页面集中页面的质量。

A、聚焦网络爬虫

B、增量式网络爬虫

C、通用网络爬虫

D、深层网络爬虫


参考答案:B

第8题:

以下对于爬行策略的说法,不正确的是()。

A、深度优先策略比较适合垂直搜索或站内搜索,但爬行页面内容层次较深的站点时会造成资源的巨大浪费。

B、广度优先策略能够有效控制页面的爬行深度,避免遇到一个无穷深层分支时无法结束爬行的问题

C、通用网络爬虫常用的爬行策略有:深度优先策略、广度优先策略

D、深度优先策略不足之处在于需较长时间才能爬行到目录层次较深的页面。


参考答案:D

第9题:

如果要采集指定的数据,则需要使用到(),又称主题网络爬虫,是指选择性地爬行那些与预先定义好的主题相关页面的网络爬虫。

A、增量式网络爬虫

B、聚焦网络爬虫

C、DeepWeb爬虫

D、全网爬虫


参考答案:B

第10题:

聚焦爬虫爬行策略实现的关键是评价()的重要性,不同的方法计算出的重要性不同,由此导致链接的访问顺序也不同。

A、页面内容

B、页面内容和链接

C、链接

D、表单信息


参考答案:B

更多相关问题