基于Python的新浪新闻网络爬虫系统的设计与实现.doc
文本预览下载声明
中文摘要
基于Python的新浪新闻网络爬虫系统
的设计与实现
Design and Implementation of Sina News Web Crawler
System Based on Python
中 文 摘 要
在网络信息爆炸、繁杂、需求量非常大的今天,如何快速、有效地获取自己想要的信息,已成为必须面对的课题之一。在互联网中已经有百度、搜狗等优秀的搜索引擎,为什么网络爬虫仍有如此强大的生命力?因为这些搜索引擎中存在着大量的广告,以及大量无用的信息。在使用这些搜索引擎时,遇到的大量无用的信息,会浪费掉很多时间,而使用爬虫不但可以滤掉广告,而且能自动筛选我们想要的信息并整理,使工作
显示全部