文档详情

解析Python网络爬虫_课后习题答案.docx

发布:2020-06-10约2.11万字共34页下载文档
文本预览下载声明
第1章:初识爬虫 填空题 网络机器人 规则 通用爬虫,聚焦爬虫 公开 判断题 错 错 对 对 错 简答题 网络爬虫,又称为网页蜘蛛,网络机器人,是一种按照一定的规则,自动请求万维网网站并提取网络数据的程序或脚本。 (1)通用爬虫又称全网爬虫,主要用于将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。聚焦网络爬虫又称主题网络爬虫,用于选择性地爬取那些与预先定义好的主题相关的页面。(2)通用爬虫的爬行范围和数量巨大,对于爬行速度和存储空间要求较高,对于爬行页面的顺序要求相对较低。聚焦爬虫只需要爬行与主题相关的页面,极大地节省了硬件和网络资源,保存的页面也由于数量少而更新快,还可以很好地满足
显示全部
相似文档