深度优先遍历策略
广度优先遍历策略
高度优先遍历策略
反向链接策略
大站优先策略
第1题:
A、深度优先策略
B、广度优先策略
C、PageRank优先策略
D、随机爬行策略
第2题:
A、聚焦网络爬虫
B、增量式网络爬虫
C、通用网络爬虫
D、深层网络爬虫
第3题:
A、RIP
B、SNMP
C、SMTP
D、IGMP
第4题:
此题为判断题(对,错)。
第5题:
A、网络爬虫还可以对网页建立索引
B、有些网络爬虫能够从网站抓取内容聚合起来
C、有些网络爬虫甚至能发动DDos攻击、发送垃圾邮件等
D、隐藏在表单后的信息无法被网络爬虫发现
第6题:
A、聚焦网络爬虫
B、增量式网络爬虫
C、通用网络爬虫
D、深层网络爬虫
第7题:
A、聚焦网络爬虫
B、增量式网络爬虫
C、通用网络爬虫
D、深层网络爬虫
第8题:
A、深度优先策略比较适合垂直搜索或站内搜索,但爬行页面内容层次较深的站点时会造成资源的巨大浪费。
B、广度优先策略能够有效控制页面的爬行深度,避免遇到一个无穷深层分支时无法结束爬行的问题
C、通用网络爬虫常用的爬行策略有:深度优先策略、广度优先策略
D、深度优先策略不足之处在于需较长时间才能爬行到目录层次较深的页面。
第9题:
A、增量式网络爬虫
B、聚焦网络爬虫
C、DeepWeb爬虫
D、全网爬虫
第10题:
A、页面内容
B、页面内容和链接
C、链接
D、表单信息