信息组织与检索供参习.doc
文本预览下载声明
1、信息组织:即信息序化或信息整序,也就是利用一定的科学规则和方法,通过对信息外在特征和内容特征的描述和序化,实现无序信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用及信息的有效流通和组合。
信息检索:指从信息集合中发现、查出所需信息的活动与过程。
两者关系:信息组织是信息资源开发的关键性环节,也是信息检索利用的基础
2、文献:是用文字、图形、符号、图像、声频、视频信息记录知识的一切载体,或具有独立、完整含义的信息集合。文献由知识内容、信息符号和载体材料三个不可分割的基本要素组成。
3、外在特征:指信息的物质载体所直接反映的特征,构成信息载体的外在的、形式的特征,如信息的物理形态、题名和责任者及信息的类型、信息生产和流通状况等方面的特征
内在特征:信息所包含和承载的具体内容,即通过信息载体传递和交流的具体内容。
4、信息组织的理论基础:
系统论:整体大于部分之和
耗散结构理论:非平衡、开放系统为有序之源
协同论:协同作用机制
信息组织的方法基础:
语言学:有着词汇、语法的符号系统
逻辑学:思维规律
知识分类:知识体系结构
5、信息资源描述:指根据信息组织和检索的需要,对信息资源的内容特征和形式特征进行分析、选择和记录的活动 。
6、标引:是指分析文献的内容属性(特征)及相关外表属性,并用特定语言表达分析出的属性或特征,从而赋予文献检索标识的过程。标引过程一般包括两个环节:主题分析和转换标识 。
标引语言:是表达文献主题概念和文献需求主题概念的简明性、单义性和关联性概念标识系统,是根据标引和检索需要而编制的人工语言。
7、标引语言的特点:
--简明性,即标识的形式简洁、含义明确;
--单义性,即标识与概念唯一对应,排除了同义现象和多义现象;
--关联性,即标识之间建立了联系,以反映概念之间的关系。
8、检索语言:是用来描述文献的内容特征、外表特征和表达检索提问的一种人工语言。它是沟通信息组织和信息检索两个过程的桥梁,是标引者和检索者“对话”的语言。
9、网络环境对传统信息组织方式的冲击:
信息量剧增以及信息传递速度的加快,使得以往的手工处理和加工方式不堪重负,急需采用自动化的信息组织手段
信息种类增多,数据库成分复杂化,过去主要适用于文本信息的信息组织方法已不敷使用。
用户成分发生很大变化,要求信息组织方式的透明化、易用化。
网络信息资源共享要求信息组织标准化、兼容化。
10、网络信息资源的组织方法:
超文本方法;
自由文本方法;
主页方法;
搜索引擎;
主题树。
11、体系分类法的特点:
按学科、专业集中文献;
并从知识分类角度揭示各类文献在内容上的区别和联系;
提供从学科分类检索文献信息的途径。
历史最久、使用最普遍的信息组织语言。
12、组配分类法:
基于概念的可分析性和可综合性。即一个复杂概念可以分析为若干简单概念(或概念因素),若干简单概念可以综合为一个复杂概念。
一个复杂的主题概念可以用若干个简单概念标识的组配来表达。
13、组配分类法与体系分类法的比较:
包罗能力更强;
更高的专指度;
克服了体系分类法的“集中与分散”的基本矛盾,在检全率和检准率方面,都高于体系分类法;
易于修改;
使用者来说更难于掌握;
在图书情报工作中适应性较差。
14、主题法:直接以表达主题内容的语词作检索标识、以字顺为主要排检途径的标引和检索信息资源的方法。
特征: -直接以语词作为检索标识
-以字顺作为主要排检途径
-以特定的事物、问题、现象,即主题为中心集中信息资源
-往往是通过详尽的参照系统等方式揭示主题词之间关系
类型:按照主题法的选词方式可分为:
标题法
单元词法
叙词法
关键词法
15、关键词
指那些出现在文献的标题(篇名、章节名)以至摘要、正文中,对表征文献主题内容具有实质意义的语词,亦即对提示和描述文献主题内容来说是重要的、带关键性的(可以作为检索“入口”的)那些语词。
关键词法
关键词法就是将文献原来所用的,能描述其主题概念的那些具有关键性的词抽出,不加规范或只作极少量的规范化处理,按字顺排列,以提供检索途径的方法。
16、元数据的定义(概述)
元数据是关于数据的数据(data about data)。
元数据是关于数据的结构化的数据(structured data about data)。
元数据是与对象相关的数据,此数据使其潜在的用户不必预先具备对这些对象的存在或特征的完整认识。
元数据是对信息包(Information package)的编码描述 ,其目的在于提供一个中间级别的描述,使得人们据此就可以做出选择而无需检索大量不相关的全文文本。
元数据,即代
显示全部