技术资料-Scrapy 中文指南 - v1.1.pdf
文本预览下载声明
前言前言
Scrapy 是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 可以应用在包括数据挖掘,信息处理或
存储历史数据等一系列的程序中。本指南是 Scrapy 目前最新的版本,内容涉及安装,使用,开发,API 调试等
全部知识点,帮助读者学习使用 Scrapy 框架开发网络爬虫。
适用人群适用人群
本指南适用于网络爬虫初学者学习,能够通过本指南了解到爬虫框架的原理和实现过程。
学习前提学习前提
学习本教程前,你需要了解 Python 这门编程语言。
版本信息版本信息
书中演示代码基于以下版本:
语言/框架语言/框架 版本信息版本信息
Python Python2.7
鸣谢:/zh_CN/latest/intro/overview.html
目录目录
前言前言 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
第 1 章第 1 章 初窥 Scrapy初窥 Scrapy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1010
选择一个网站 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
定义您想抓取的数据 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
编写提取数据的 Spider . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
执行 spider,获取数据 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
查看提取到的数据 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
还有什么? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
接下来 . . . . . . . . . . . . . . . . . .
显示全部