文档详情

一种基于文本聚类的网页排序方法.pdf

发布：2018-06-03约1.47万字共4页下载文档

文本预览下载声明

计算机与现代化 2008年第 1O期 JISUANJIYUXIANDAIHUA 总第 158期文章编号：1006-2475(2008)10-0018-03 一种基于文本聚类的网页排序方法曹杰，王直杰 (东华大学信息科学与技术学院，浙江上海201620) 摘要：提出一种新的网页排序方法一ClusterRank方法。该方法先对检索结果进行文本挖掘，然后利用Web网页的链接信息以及用户点击率对网页重要性的影响对挖掘结果进行排序。该算法可以引导用户进一步明确其检索需求。关键词：ClusterRank；K-means算法；网页点击率；PageRnak算法；网页排序中图分类号：TP301．6 文献标识码：A A New Algorithm forPageRankingBasedonTextClustering-dusterWebPageRanking CAOJie，WANGZhi-jie (ColegeofInformationScienceandTechnology，DonghHaUniversity，Shnaghai201620，China) Abstract：Thispaperproposesanew algorithm forpageranking．Th eclusteringtechniquesareemployedtonaalyzethosesearch 一 results．thenitranksallhteclusteredtextsconsideringthelinkstructurebetweenWebpages，鹊 wellasitsclickratio．Itfacili_ ratesu．ser8tonaildowntheirrequirements throughskimmingoverresultslist． Keywords：ClusterRank；K-menasalgorithm；pageclickratio；PageRankalgorithm；Webpageranking (MaximalMarginalRelevance)标准。该标准根据语 1 概述义相关性对检索到的文档集进行再排序，修正内容上为了从网上海量的数据中找到用户需要的信息，相近的文档的显示次序，从而保证再排序后的检索结搜索引擎允许用户通过关键字查询Web上的信息。果既与查询项相关，同时文档内容问的冗余j受较低。搜索引擎把搜索结果按照检索的相关性和资源的重 ChenXiangZhai等人提出子主题检索技术 J，它采用要性进行降序排列，并将排序结果提交给用户。然统计语言模型计算文档的相关性，结合了MMR排序而，包含 Web关键字的页面数目通常相当多，要让用策略实现子主体检索，以此来减少检索结果的信息冗户浏览全部甚至大部分的网页已经不大可能。实际余度。BenyuZhnag他们提出采用 AR (Affinity 上，据统计81％的用户只会浏览搜索结果的前 3页 Ranking)算法对搜索结果进行再排序，该方法类比网 (约30项)。常用的解决办法是：使用排序算法对搜页结构挖掘，视检索结果集为一个网，网络的节点是索结果进行排序，找出和关键字最相关的网页。查准文档，文档的语义关系构成网络的边，针对每一个节率较高的搜索引擎可以较好地满足那些对其检索需

显示全部

相似文档

一种基于语义相似度的群智能文本聚类的新方法.pdf 29 2 Vol. 29 No. 2 第卷第期计算机应用研究 2012 2 Application Research of Computers Feb. 2012 年月 一种基于语义相似度的群智能
2015-09-25 约4.01万字 4页立即下载
一种基于预训练语言模型的长文本聚类方法及装置.pdf (19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 112836043 A (43)申请公布日 2021.05.25 (21)申请号 202011093000.2 (22)申请日 2020.10.13 (71)申请人讯飞智元信息科技有限公司
2023-06-03 约1.65万字 11页立即下载
基于文本分类的网页排序算法.pdf 您的论文得到两院院士关注微计算机信息管控一体化年第卷第期中文核心期刊! ( )2005 21 11- 3 基于文本分
2015-08-07 约2.84万字 3页立即下载
基于概念词的文本聚类方法.pdf (19)中华人民共和国国家知识产权局 (12)发明专利 (10)授权公告号 CN 112990388 B (45)授权公告日 2021.08.24 (21)申请号 202110536699.3 (56)对比文件
2023-06-07 约9.59千字 7页立即下载
一种基于谱聚类的半监督聚类方法.pdf 第 25卷第 6期计算机应用 Vol_25 No．6 2005年 6月 Computer Applications June2005 文章编号：1001—9081(2005)06—1347—03 一种基于谱聚类
2017-04-17 约1.76万字 3页立即下载
一种文本聚类处理方法及系统.pdf (19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113407712 A (43)申请公布日 2021.09.17 (21)申请号 20201
2023-06-18 约1.72万字 15页立即下载
一种基于卷积神经网络的社交网络文本聚类方法.pdf （19）中华人民共和国国家知识产权局（12）发明专利申请（10）申请公布号 CN106776740A （43）申请公布日2017.05.31 （21）申请号CN201611027489.7 （22
2024-11-29 约1.28千字 4页立即下载
一种基于人工智能的文本聚类方法、相关设备及存储介质.pdf (19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113392209 A (43)申请公布日 2021.09.14 (21)申请号 202011159510.5 (22)申请日 2020.10.26 (71)申请人腾讯科技（深圳）有限公司
2023-06-17 约2.28万字 19页立即下载
一种基于数据连续性的聚类方法.pdf
2018-08-06 约小于1千字 8页立即下载
一种基于KD树子样的自动聚类方法.pdf
2018-08-06 约小于1千字 9页立即下载
一种基于谱聚类的共指消解方法的开题报告.docx 一种基于谱聚类的共指消解方法的开题报告一、选题背景共指消解是自然语言处理领域的一个核心任务，它涉及到对一句话中的人称代词、名词短语等词汇的指代关系进行准确的识别和消解。在实际处理场景中，共指消解是一项十分重要的任务，它可以支持问答系统的实现、文本挖掘的工作以及机器翻译的效果提升等应用。传统的机器学习方法通常采用特征工程技术，需要对每一个句子进行人工指定的特征提取，这种方法不适用多语言共指消解，且对于不同领域或语义场景下的语言大规模特征工程显得格外困难。谱聚类算法不需要特征工程，它通过将连通同向的点划分为一个簇的方法来做聚类问题。因此，基于谱聚类的共指消解方法具有广泛的适用性和较高的准确性
2024-04-11 约1.2千字 3页立即下载
一种基于模糊聚类的模糊辨识方法.pdf
2018-08-05 约小于1千字 7页立即下载
一种基于双光谱角的波段聚类选择方法.pdf (19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114580488 A (43)申请公布日 2022.06.03 (21)申请号 202011390102.0 (22)申请日 2020.12.02 (71)申请人北京航天计量测试技术研究所地址
2023-05-09 约8.5千字 8页立即下载
一种基于图卷积的人脸聚类优化方法.pdf (19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114882547 A (43)申请公布日 2022.08.09 (21)申请号 202210364466.4 G06N 3/04 (2006.01)
2023-05-17 约1.4万字 11页立即下载
一种基于聚类算法的车辆检测方法.pdf (19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114463570 A (43)申请公布日 2022.05.10 (21)申请号 202111542446.3 G06T 7/60 (2017.01)
2023-05-04 约1.63万字 15页立即下载