文档详情

中国政府采购网.doc

发布:2016-11-24约2.67千字共6页下载文档
文本预览下载声明
中国政府采购网 网络信息雷达与管理系统 需求与规划文档 现状与问题 政府采购网概述 “中国政府采购网”是财政部开发设计和主办的用于全国政府采购信息统一管理的专业网站。中国政府采购网与财政部正在开发、建设中的基于政府采购业务的内部信息管理系统和包括在线招投标在内的电子商务系统共同组成中国政府采购信息网络系统。 目前系统存在问题 在目前的政府采购网信息网络体系中,由于各地方采购网基本是分级、自主地进行网站管理,各地采购的网站内容管理平台也没有完全地统一,因此中央主网站要将各地方网站的相关信息进行整合,提供统一的分析处理和相关服务时,就显得尤其困难。具体体现在中央在收集地方新闻、标讯等信息时,大部分只能通过手工搜索、邮件报送等方式进行,不仅需要花费很大的人力来进行搜集整理,而且很难收集全面和及时。需要建立一个自动的监控采集渠道,由系统及时地将各地方网站相关的信息资源收集到中央系统中。 信息采集与管理系统业务及技术需求 业务需求 标讯信息的采集 标讯信息是政府采购中非常重要的一类信息,目前在全国各省有36个左右包含标讯信息的省级采购网站。省级采购网站通过数据接口、邮件/传真、手工录入等方式将信息直报到中央CMS系统。但存在着大量的漏报、不报、少报的情况,为此建立一套系统对地方标讯信息进行采集、监控和处理。 要求系统能够对各地方政府采购网站的标讯信息采集和监测。采集时能够准确地识别标讯信息栏目,从而针对性地采集到标讯类信息,摒除其他无关的或垃圾的信息。当网站的标讯信息有增加或更新时,系统能够及时地监测到信息变动,从而进行及时采集更新。采集到的信息集中存储,通过发布系统作静态发布,与网站形成一个整体风格。同时要求系统能够形成统计报表,便于对地方分网站与中央主网信息互联的质量、数量进行评估。 综合类信息的采集 系统需要对各省级采购网和其它重要网站的一些重要新闻进行全面地监控采集,在中国政府采购网站上提供集中的新闻发布服务以及检索服务。采集时要求去除原页面中的垃圾信息、广告信息。 对于所有采集的信息进行管理与发布,管理与发布要能实现栏目管理、采编管理、标讯元数据管理、模板管理、静态发布管理、可视化自定义工作流、工作量统计、系统审计、用户及权限管理等,并支持广告管理、调查管理、数据迁移等。 功能要求 在平台的信息采集与管理发布模块中,要求系统能够提供对政府采购网各类新闻资讯、标讯信息以及其他互联网相关信息的监控、配置和采集、发布的功能。 信息资源采集与管理发布的主要功能包括: (1)采集维护 用户可以根据不同的需求,增删采集的目标网站和相关栏目。当目标网站发生重大变化时,系统能自动提示和告警。采集目标源包括政府采购网各地方网站、其他互联网网站等。 (2)采集任务设置 制定一个具体的采集任务时,可以对目标网站进行合适的分类和组合,并能便捷地设置采集触发时间。 (3)内容采集 支持静态网页、部分动态网页等内容的采集,支持图片、Word、PDF等格式文档的采集,支持URL去重。可采集网站网页中的有效的文本、图片和表格,自动提取标题、正文、图片和表格信息。 支持手工采集入库与管理发布。手工采集时要方便维护与管理,提供可视化的所见即所得的采集编辑器,并要作到便于信息的增加、修改、删除、撤稿、插入图片和文档,信息引用与复制、一稿多发几个栏目等。 要求能够智能提取文章关键词,并对对相似性的文章进行排重处理。 (4)主题过滤 能够对采集的网页内容进行主题过滤,过滤规则可以根据不同的需求进行维护。 (5)网页内容去噪 具备对网络噪声,如:导航栏、广告、无效链接等的过滤能力。 技术与性能要求 采集与管理发布的技术要求如下: 支持中文、英文、日文等多语种网站信息的采集。 支持内容模板、脚本模板、链接模板等高级采集功能,使采集更加精准。 支持多线程并发搜索技术,保证采集过程高效准确。 支持分布式部署,可多台机器同时采集。 漏采率不高于5%,准确率不低于95%。 管理与发布要能实现栏目管理、采编管理、标讯元数据管理、模板管理、静态发布管理、可视化自定义工作流、工作量统计、系统审计、用户及权限管理等,并支持广告管理、调查管理、数据迁移等。 数据接口要求:系统应该提供良好的导入接口,使得采集的各类资源能够通过相应的配置管理和接口开发,将信息导入到某业务系统中。导入时,需要有良好的机制保证数据的协同一致性,能够进行增量的更新。 信息采集与管理系统实施要求 投标文件中需要有完整的项目实施方案。 系统开发应严格遵照国家软件工程规范,系统遵循SOA架构开发,各种接口必须以服务的方式提供。 投标人必须在开发过程中提出合理的开发计划及详细的进度安排计划,在项目实施过程中进行追踪和控制,定时总结并提交开发进度月报。 为使系统工程按质、按量、按时及有序实施,投标人对
显示全部
相似文档