Word排版素材长文档草稿.doc
文本预览下载声明
目录2016林鑫1504080064
目录
2016
林鑫
1504080064
2016/5/15
北京师范大学珠海分校
封 面
引言
本课题源于国家863高技术研究发展计划:“面向教育的海量知识资源组织、管理与服务系统”,该项目旨在研究一套区别于搜索引擎和现有数字文献管理系统的,支持用户多层次、多粒度知识获取,能够体现知识资源内在关联的导航与互动学习,并支持用户个性化查询和结果呈现的知识资源管理与服务系统。系统的体系结构包括:1、知识资源的组织与管理;2、知识资源的处理;3、个性化多模式三个层次。
相似性度量算法的关键技术是词汇、句子间语义相似度计算算法。语义相似度计算的准确性直接影响到主题图最后融合的效果,因此语义相似性度量的研究在主题图融合过程有着很重要的作用。
扩展主题图的数据格式用于描述信息资源组织、管理的结构,具有独立性和通用性,展示形式为“主题--知识元—资源”。相对于传统的基于元数据的资源组织方式,扩展主题图在物理资源实体上架构了一层语义网,实现了资源实体和抽象概念之间的语义组织和衔接,能提供知识的多层次,多粒度的语义搜索与导航。
现有的语义相似性度量的方法主要有基于词典和基于语料库两种。词典有着丰富的语义信息,但存在着未登录词的严重问题。目前发布的实用的词典:英文的WordNet(词网)、中文的HowNet(知网)[2],均是封闭的系统,在计算未登录词时效果很差。
目录
TOC \o 1-3 \h \z \u HYPERLINK \l _Toc451015831 引言 PAGEREF _Toc451015831 \h 1
HYPERLINK \l _Toc451015832 绪论 PAGEREF _Toc451015832 \h 1
HYPERLINK \l _Toc451015833 第1章 课题的背景和意义 PAGEREF _Toc451015833 \h 1
HYPERLINK \l _Toc451015834 1.1 研究的背景 PAGEREF _Toc451015834 \h 1
HYPERLINK \l _Toc451015835 1.1.1 研究的目的和意义 PAGEREF _Toc451015835 \h 1
HYPERLINK \l _Toc451015836 1.1.2 国内外研究现状 PAGEREF _Toc451015836 \h 2
HYPERLINK \l _Toc451015837 1.2 主题图和主题图融合研究现状 PAGEREF _Toc451015837 \h 2
HYPERLINK \l _Toc451015838 1.1.3 词汇相似性度量研究现状 PAGEREF _Toc451015838 \h 2
HYPERLINK \l _Toc451015839 1.1.4 句子相似性度量研究现状 PAGEREF _Toc451015839 \h 3
HYPERLINK \l _Toc451015840 1.3 网络搜索双检验模型与基于语料库的语义相似度度量 PAGEREF _Toc451015840 \h 4
HYPERLINK \l _Toc451015841 1.1.5 空间数与语义相似性度量 PAGEREF _Toc451015841 \h 5
HYPERLINK \l _Toc451015842 1.1.6 基于页空间数和语料片段的相似度计算 PAGEREF _Toc451015842 \h 6
HYPERLINK \l _Toc451015843 1.4 本章小结 PAGEREF _Toc451015843 \h 8
HYPERLINK \l _Toc451015844 1.1.7 基于全信息理论的句子相似度算法 PAGEREF _Toc451015844 \h 8
HYPERLINK \l _Toc451015845 1.1.8 句子相似度概念 PAGEREF _Toc451015845 \h 8
HYPERLINK \l _Toc451015846 第2章 句子相似度计算的相关方法 PAGEREF _Toc451015846 \h 9
HYPERLINK \l _Toc451015847 1.5 基于相同词汇的句子相似度计算方法 PAGEREF _Toc451015847 \h 10
HYPERLINK \l _Toc451015848 1.1.9 基于语义信息的句子相似度计算方法 PAGEREF _Toc451015848 \h 10
HYPERLINK \l _Toc451015849 1.1.10 基于语义信息的句子相似度计算方法 PAGEREF _Toc451015849
显示全部