解析Python网络爬虫_课后习题答案.docx
文本预览下载声明
第1章:初识爬虫
填空题
网络机器人
规则
通用爬虫,聚焦爬虫
公开
判断题
错
错
对
对
错
简答题
网络爬虫,又称为网页蜘蛛,网络机器人,是一种按照一定的规则,自动请求万维网网站并提取网络数据的程序或脚本。
(1)通用爬虫又称全网爬虫,主要用于将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。聚焦网络爬虫又称主题网络爬虫,用于选择性地爬取那些与预先定义好的主题相关的页面。(2)通用爬虫的爬行范围和数量巨大,对于爬行速度和存储空间要求较高,对于爬行页面的顺序要求相对较低。聚焦爬虫只需要爬行与主题相关的页面,极大地节省了硬件和网络资源,保存的页面也由于数量少而更新快,还可以很好地满足
显示全部