基于内容的网络监视和信息分类系统-计算机应用技术专业论文.docx
文本预览下载声明
基于内容的网络监视和信息分类系统摘要
基于内容的网络监视和信息分类系统
摘要
随着Internet的飞速发展,电子信息的数量不断增加。如何监视这些信息内 容,以及如何在这些内容中迅速准确地发现某一特征的信息,对于方便互联网用 户的使用和互联网本身的健康发展都具有重要意义。
传统的网络监视手段受到网络接口速度和计算机处理能力等方面的限制, 无法与不断增长的网络速度相适应。分布式的网络监视方法可以在很大程度上解 决这一问题,充分利用网络的计算资源,可以有效地对应用层协议的内容进行跟 踪监视。本文依据分布式网络监视思想,结合实际的应用情况,提出了一套在氽 业、学校和政府机关的网络环境巾可以得到有效应用的网络监视解决方案,并对 实现的方法进行了详细的描述。在这个网络监视系统的实现中,论文还探讨了利 用Linux下ip_queue机制来获取网络信息内容的方法,并对这一方法的利弊加以 分析。
文本分类是近年来发展较快的一个研究领域。本文在研究网络监视方法的 基础上,设计出。套易于扩展的信息内容处理机制,可以将文本分类技术的研究 成果迅速有效地应用到网络信息监视中。论文中提出了一套简洁严谨的文本分类 器接口定义,在实现中采用动态链接机制对文本分类器进行管理和调用。这一方 法不仅有利于系统的扩展,也为进一步研究文本分类算法奠定了基础。
在分类系统的实现中采用了将多关键宇匹配分类器与归纳学习分类器级联 的方法。系统中使用了决策树方法实现多关键字匹配分类器,使用k最近邻居法 实现归纳学习分类器。
关键字:网络监视文本分类协议分析k最近邻算法ip_queue
Content-Based
Content-Based Ne ork l nformation
Monitoring and Categorizing System
Abstract
With the rapid growing of the Intemet,the amount of electronic information increases continually.For convenience ofthe Imemet users and the sound development ofthe Interact itself,
it’s important to study how to monitor the content of the information and bow to find tile
information with specific characteristics.
Traditional network monitoring methods have some limitations,such as the ability of NIC and the computer itself,and so cannot meet the growing network speed.Distributed network monitoring,which can make full use of the l-CSOUrCes in network and monitor the content of
application layer protocol,can solve this problem.In this paper,we design and implement such a distributed network monitoring system.It can be used in local networks of company,college and government off2ce.We also discuss the use of ip_queue in network monitoring,and analyse the advantage and disadvantage of ip_queue.
Text categorization technology is one of the most successful fields in Computer Science This system also designs a flexible mechanism for information handling.It make easy for the newly achievements oftext categorization technology to be used in a network monitoring system This paper defines a terse,strict text classifier
显示全部