文档详情

技术资料-Scrapy 中文指南 - v1.1.pdf

发布:2018-09-15约27.31万字共页下载文档
文本预览下载声明
前言前言 Scrapy 是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 可以应用在包括数据挖掘,信息处理或 存储历史数据等一系列的程序中。本指南是 Scrapy 目前最新的版本,内容涉及安装,使用,开发,API 调试等 全部知识点,帮助读者学习使用 Scrapy 框架开发网络爬虫。 适用人群适用人群 本指南适用于网络爬虫初学者学习,能够通过本指南了解到爬虫框架的原理和实现过程。 学习前提学习前提 学习本教程前,你需要了解 Python 这门编程语言。 版本信息版本信息 书中演示代码基于以下版本: 语言/框架语言/框架 版本信息版本信息 Python Python2.7 鸣谢:/zh_CN/latest/intro/overview.html 目录目录 前言前言 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 第 1 章第 1 章 初窥 Scrapy初窥 Scrapy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1010 选择一个网站 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 定义您想抓取的数据 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 编写提取数据的 Spider . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 执行 spider,获取数据 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 查看提取到的数据 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 还有什么? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 接下来 . . . . . . . . . . . . . . . . . .
显示全部
相似文档