文档详情

基于Python的新浪新闻网络爬虫系统的设计与实现.doc

发布:2023-11-23约2.35万字共31页下载文档
文本预览下载声明
中文摘要 基于Python的新浪新闻网络爬虫系统 的设计与实现 Design and Implementation of Sina News Web Crawler System Based on Python 中 文 摘 要 在网络信息爆炸、繁杂、需求量非常大的今天,如何快速、有效地获取自己想要的信息,已成为必须面对的课题之一。在互联网中已经有百度、搜狗等优秀的搜索引擎,为什么网络爬虫仍有如此强大的生命力?因为这些搜索引擎中存在着大量的广告,以及大量无用的信息。在使用这些搜索引擎时,遇到的大量无用的信息,会浪费掉很多时间,而使用爬虫不但可以滤掉广告,而且能自动筛选我们想要的信息并整理,使工作
显示全部
相似文档