信息检索专业知识

1.什么是信息检索

信息检索的作用与意义主要体现在以下三方面。

(一)避免重复研究或走弯路 我们知道,科学技术的发展具有连续性和继承性,闭门造车只会重复别人的劳动或者走弯路。比如,我国某研究所用了约十年时间研制成功“以镁代银”新工艺,满怀信心地去申请专利,可是美国某公司早在20世纪20年代末就已经获得了这项工艺的专利,而该专利的说明书就收藏在当地的科技信息所[7]。

科学研究最忌讳重复,因为这是不必要的浪费。在研究工作中,任何一个课题从选题、试验直到出成果,每一个环节都离不开信息。

研究人员在选题开始就必须进行信息检索,了解别人在该项目上已经做了哪些工作,哪些工作目前正在做,谁在做,进展情况如何等。这样,用户就可以在他人研究的基础上进行再创造,从而避免重复研究,少走或不走弯路。

(二)节省研究人员的时间 科学技术的迅猛发展加速了信息的增长,加重了信息用户搜集信息的负担。许多研究人员在承接某个课题之后,也意识到应该查找资料,但是他们以为整天泡在图书馆“普查”一次信息就是信息检索,结果浪费了许多时间,而有价值的信息没有查到几篇,查全率非常低。

信息检索是研究工作的基础和必要环节,成功的信息检索无疑会节省研究人员的大量时间,使其能用更多的时间和精力进行科学研究。 (三)是获取新知识的捷径 在改革开放的今天,传统教育培养的知识型人才已满足不了改革环境下市场经济的需求,新形势要求培养的是能力型和创造型人才,具备这些能力的人才首先需要具备自学能力和独立的研究能力。

大学生在校期间,已经掌握了一定的基础知识和专业知识。但是,“授之以鱼”只能让其享用一时。

如果掌握了信息检索的方法便可以无师自通,找到一条吸收和利用大量新知识的捷径,把大家引导到更广阔的知识领域中去,对未知世界进行探索。是谓“教人以渔”,才能终身受用无穷。

德国柏林图书馆门前有这样一段话:“这里是知识的宝库,你若掌握了它的钥匙,这里的全部知识都是属于你的。”这里所说的“钥匙”即是指信息检索的方法。

参考资料:/。

2.学习信息检索课程的意义是什么

学习信息检索课程的意义主要体现在以下三方面:

(一)避免重复研究或走弯路

科学技术的发展具有连续性和继承性,闭门造车只会重复别人的劳动或者走弯路。研究人员在选题开始就必须进行信息检索,了解别人在该项目上已经做了哪些工作,哪些工作目前正在做,谁在做,进展情况如何等。这样,用户就可以在他人研究的基础上进行再创造,从而避免重复研究,少走或不走弯路。

(二)节省学习者的时间

科学技术的迅猛发展加速了信息的增长,加重了信息用户搜集信息的负担。许多学者在承接某个课题之后,也意识到应该查找资料,但是他们以为整天泡在图书馆“普查”一次信息就是信息检索,结果浪费了许多时间,而有价值的信息没有查到几篇,查全率非常低。信息检索是研究工作的基础和必要环节,成功的信息检索无疑会节省大量时间,使其能用更多的时间和精力进行科学研究。

(三)是获取新知识的捷径

大学生在校期间,已经掌握了一定的基础知识和专业知识。但是,“授之以鱼”只能让其享用一时。如果掌握了信息检索的方法便可以无师自通,找到一条吸收和利用大量新知识的捷径,把大家引导到更广阔的知识领域中去,对未知世界进行探索。是谓“教人以渔”,才能终身受用无穷。

3.信息检索的意义和作用是什么

信息检索的意义和作用表现在三个方面:

1、有利于减少课题的重复研究、提高科研成功率。

任何科学研究都是在继承前人的知识后有所发明、有所创新的。从事某一特定领域的学术活动,都要花费大量的时间,对有关文献进行全面的调查研究,以便借鉴、改进和部署自己的工作。

只有这样方能做到胸中有数,才能有所发现、有所创新、有所前进,否则容易造成重复劳动,导致人力、物力、财力的浪费。

2、有助于节约时间、提高科研效率。

信息检索是研究工作的基础和必要环节,成功的信息检索无疑会节省研究人员的大量时间,使其能用更多的时间和精力进行科学研究。提高科研效率,加快科研速度,可以使相同科研课题在国内外竞争中处于有利位置。

3、掌握获取文献的方法,提高信息意识和信息观念。

学习文献检索,不但要学会查找文献的方法,更重要的是要通过本课程的学习,提高自身的信息意识和信息观念,提高独立分析问题和解决问题的能力,使自己具有更强的社会生存和社会竞争能力。

扩展资料

起源

信息检索起源于图书馆的参考咨询和文摘索引工作,从19世纪下半叶首先开始发展,至20世纪40年代,索引和检索成已为图书馆独立的工具和用户服务项目。

随着1946年世界上第一台电子计算机问世,计算机技术逐步走进信息检索领域,并与信息检索理论紧密结合起来;脱机批量情报检索系统、联机实时情报检索系统相继研制成功并商业化。

20世纪60年代到80年代,在信息处理技术、通讯技术、计算机和数据库技术的推动下,信息检索在教育、军事和商业等各领域高速发展,得到了广泛的应用。

Dialog国际联机情报检索系统是这一时期的信息检索领域的代表,至今仍是世界上最著名的系统之一。

参考资料来源:百度百科–信息检索

4.信息检索重点

问答题 1.简述信息、知识、文献的概念及其三者之间的关系。

1.答:信息:是事物存在方式、运动状态及其特征的反映,是事物发出的信号、消息。 知识:是人类对自然界、人类社会中各种现象、规律的信息反映进行思维分析,加工提炼,经过系统化、理论化的结果。

文献:记录有知识的一切载体 三者从概念范畴上看,信息大于知识大于文献,知识是信息的一部分,是理论化系统化的信息,文献是知识中记载下来的那部分。 2.文献按载体形式不同分为哪几种类型,并举例说明。

2.答:文献按载体形式的不同分为: 手写型文献,如甲骨文、金文 印刷型文献,如图书、期刊 缩微型文献,如缩微胶卷、缩微胶片 视听型文献,如录像带、录音带、科技电影 电子型文献,如数据库文献和网络文献 3.文献的级别及其相互关系。 3.答:文献按照加工程度不同分为零次、一次、二次和三次文献四种。

其中零次文献是指未公开出版的实验记录、原始录音(像)、书信、手稿、口头交流的信息或实物等;零次文献在作者的加工处理后公开出版进入社会流通领域就变成一次文献;根据一次文献的各种特征按照一定的规则和方法对其进行整理、加工、浓缩,后形成的文献就是二次文献;利用二次文献线索对大量的一次文献内容进行综合、分析、加工、提炼后形成的文献就是三次文献。 4.在计算机检索中,如何缩小检索范围? 4.答:在计算机检索中,缩小检索范围的方法包括: (1)增加用and连接的检索词,或用“二次检索” (2)用特定的副主题词进行限定 (3)用字段限定检索,如标题词检索、主题词检索、加权检索等 (4)进行文献类型、语种、重要期刊、临床核心期刊、年份等的限定检索 (5)进入更专指的分类范围内输词检索 5.获取文献全文的方法有哪些? 5.答:获取全文的方法包括: (1)检索网上全文数据库 (2)利用网上出版社、杂志 (3)利用图书馆馆藏目录(馆藏联合目录) (4)利用“网上全文传递服务” (5)向著者索取 6.常用的检索途径有哪些? 6.答:常用的检索途径包括: 自由词检索、主题词检索、分类检索、著者检索、机构检索、引文检索、限定检索等 7.简述信息检索的原理 7.答:信息检索的原理是:将描述特定用户所需信息的提问特征,与信息存储的检索标识进行异同的比较,从中找出与提问特征一致或基本一致的信息。

本质是用户的信息需求与存储在信息集合中的信息进行比较和选择, 即匹配的过程。 8.计算机检索通常包括哪些步骤? 8.答:信息检索的步骤包括: (1)分析检索课题,明确目的和要求 (2)选择合适的检索工具 (3)选择检索途径,确定检索标识。

(4)查找文献线索。 (5)浏览检索结果,获取原始文献。

9. 简述IM主题索引的编排规则。 9.答:主题索引的排列规则如下 (1)整个索引按主题词字顺排 (2)同一主题词下按副主题词字顺排 (3)相关内容的文献题录分别纳入相应的主题词或者主题词/副主题词之下;一般总论性文献直接入主题词下,专指性文献入相应的副主题词下;同一文献题录可入多个主题词之下 (4)同一主题词或副主题词下的文献题录,先排列英文文献,后排列非英文文献,非英文文献的英译标题用”[ ]”括起,以示区别 (5)英文文献按刊名缩写字顺排 (6)非英文文献先按文种缩写字顺排,同一文种下按刊名缩写字顺排。

10.《医学主题词表》(MeSH)字顺表的参照系统有哪几种?举例说明其意义。 10.答:第一组:用代参照,用于处理词与词间的等同关系。

在MeSH词表中,对于多个同义词只采用其中一个比较科学而通用的词作规范化主题词,其它的词作为非主题词(即款目词)。用“款目词see主题词”和“主题词X款目词”表示。

如:Cancer see Neoplasms Neoplasms X Cancer 第二组:属分参照,用于处理词与词之间的等级关系,即整体与部分,上位概念与下位概念之间的关系。如某些范畴较小的主题概念主题词,包含在某些范畴较大的主题词之下,内容范围较广的词是主题词,其下的内容范围较窄的词不作主题词,只作为次要主题词。

用“次要主题词see under 主题词”和“主题词XU 次要主题词”表示。如:Health Priorities see under Health Planning Health Planning XU Health Priorities 从1991年开始取消此种参照关系,所有次要主题词升格为主题词。

第三组:相关参照,用于处理词间的相关关系,达到扩大检索,提高查全率的目的。用“主题词see related 主题词”和“主题词XR主题词”表示。

如:Population Control see related Family Planning Family Planning XR Population Control 为提高查全率和方便检索,MeSH词表于1991年和1992年又先后增设了“还应考虑参照(consider also)”和“主题词/副主题词组配参照”。 11.按照存储内容的不同,数据库通常分为哪些类型? 11.答:书目数据库、事实数据库、数值数据库、全文数据库、图像数据库 12.什么叫主题词的扩展检索,它的优越性何在? 12.答:选择主题词的扩展功能可以同时检索主题词和它的所有下位词,这样就可检出用所选主题词和更专指主题词标引的所有文献,可以更好的提高检索的查全率。

不扩展的情况下只会检出用所选主题词。

5.信息检索的基本原理

信息检索有广义和狭义的之分。广义的信息检索全称为“信息存储与检索”,是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。

狭义的信息检索为“信息存储与检索”的后半部分,通常称为“信息查找”或“信息搜索”,是指从信息集合中找出用户所需要的有关信息的过程。狭义的信息检索包括3个方面的含义:了解用户的信息需求、信息检索的技术或方法、满足信息用户的需求。

扩展资料:

信息检索四要素:

1 信息检索的前提—-信息意识:所谓信息意识,是人们利用信息系统获取所需信息的内在动因,具体表现为对信息的敏感性、选择能力和消化吸收能力,从而判断该信息是否能为自己或某一团体所利用,是否能解决现实生活实践中某一特定问题等一系列的思维过程。

2.信息检索的基础—-信息源:信息源定义:在联合国教科文组织出版的《文献术语中》,将信息源定义为:个人为满足其信息需要而获得信息的来源,称为信息源。

3、信息检索的核心—-信息获取能力:通过熟练使用检索工具来了解各种信息来源的效果。

4.信息检索的关键—-信息利用:获取学术信息的最终目的是通过对所得信息的整理、分析、归纳和总结,根据自己学习、研究过程中的思考和思路,将各种信息进行重组,船造出新的知识和信息,从而达到信息激活和增值的目的。

参考资料来源:搜狗百科-信息检索

6.信息检索

信息检索的作用与意义主要体现在以下三方面。

(一)避免重复研究或走弯路

我们知道,科学技术的发展具有连续性和继承性,闭门造车只会重复别人的劳动或者走弯路。比如,我国某研究所用了约十年时间研制成功“以镁代银”新工艺,满怀信心地去申请专利,可是美国某公司早在20世纪20年代末就已经获得了这项工艺的专利,而该专利的说明书就收藏在当地的科技信息所[7]。科学研究最忌讳重复,因为这是不必要的浪费。在研究工作中,任何一个课题从选题、试验直到出成果,每一个环节都离不开信息。研究人员在选题开始就必须进行信息检索,了解别人在该项目上已经做了哪些工作,哪些工作目前正在做,谁在做,进展情况如何等。这样,用户就可以在他人研究的基础上进行再创造,从而避免重复研究,少走或不走弯路。

(二)节省研究人员的时间

科学技术的迅猛发展加速了信息的增长,加重了信息用户搜集信息的负担。许多研究人员在承接某个课题之后,也意识到应该查找资料,但是他们以为整天泡在图书馆“普查”一次信息就是信息检索,结果浪费了许多时间,而有价值的信息没有查到几篇,查全率非常低。信息检索是研究工作的基础和必要环节,成功的信息检索无疑会节省研究人员的大量时间,使其能用更多的时间和精力进行科学研究。

(三)是获取新知识的捷径

在改革开放的今天,传统教育培养的知识型人才已满足不了改革环境下市场经济的需求,新形势要求培养的是能力型和创造型人才,具备这些能力的人才首先需要具备自学能力和独立的研究能力。大学生在校期间,已经掌握了一定的基础知识和专业知识。但是,“授之以鱼”只能让其享用一时。如果掌握了信息检索的方法便可以无师自通,找到一条吸收和利用大量新知识的捷径,把大家引导到更广阔的知识领域中去,对未知世界进行探索。是谓“教人以渔”,才能终身受用无穷。

7.急求信息检索的知识

1、信息是客观事物状态和运动特征的一种普遍形式,经过一定的加工之后就成了知识。

情报是有用的信息。他们之间的关系,在我个人看来信息包括知识和情报,知识和情报属于同级关系,他们之间存在相同区域。

2、按照检索手段来分:信息检索可以分为手工检索和计算机检索,按照检索内容来分,可以分为事实检索、数据检索、文献检索。3、信息资源的类型,根据不同的划分标准,信息资源的类型也有所不同。

一般认为:信息资源的类型主要有文字信息资源、图像信息资源、音频信息资源、视频信息资源。4、信息检索的基本方法是在进行信息检索时所用到的查找信息的基本方法,主要有分类法和主题法。

5、计算机检索技术是将文献特征标识存储在计算机数据库中。在检索提问和数据库中做匹配运算,找到命中的文献的技术。

检索策略是在分析检索课题的实质内容,确定检索目标的基础上,选择检索工具,确定检索途径、检索用词、检索词之间的逻辑关系与查找步骤、最佳方案的一系列科学安排。6、检索流程:分析检索课题,明确检索目的→选择检索系统和数据库(或者检索工具)→选择检索词,构造检索提问,明确检索策略→分析检索结果。

同时还要注意检索策略,分析检索信息时,确定检索途径方法科学合理安排检索程度,达到检索目标。7、检索效果是指利用检索工具或者系统开展检索服务是所产生的效果,其评价主要从两个技术指标来来评价,同时还要考虑到以下指标(1). 收录范围(2). 查全率(3). 查准率(4). 响应时间(5). 用户负担(6). 输出形式其中,查全率和查准率是最重要的两个评价指标。

8、中外文的文献检索系统主要有:国外:OCLC、Springer电子期刊 、EBSCO全文数据库、化学文摘、工程索引、科学引文索引、美国政府科技报告(PB报告、AD报告、NASA报告、DOE报告)、德温特专利索引、文摘杂志等。国内的:cnki、vip、万方、超星数字图书馆、CALIS等。

9、检索过程如下存储文献:原始文献→分析文献特征→标引文献→存储检索文献:检索提问→检索标识→匹配→输出文献10、Internet 检索工具主要是搜素引擎。主要有以下三种 (1)目录式搜索引擎 是以人工方式或半自动方式搜集网站信息,由编辑员查看信息之后,人工形成信息摘要,并根据站点的内容和性质将信息(包括站点的URL)置于事先确定的分类框架中。

提供目录浏览服务和直接检索服务。 最大的特点就在于可以通过其提供的分类目录体系逐层找到所需要的信息,比较适合于想从总体上了解某一主题的情况。

– 适用范围:适合于查找综合性、概括性的主题概念,或对检索准确度要求较高的课题。 – 代表:YAHOO、Open Directory、搜狐等。

(2)基于Robot的搜索引擎——全文搜索引擎 由大规模机器运行的程序按照某种策略自动的在互联网中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。 服务方式是面向网页的全文检索服务。

优点:信息量大、更新及时、毋需人工干预 。 缺点:返回信息过多,有很多无关信息,用户必须从结果中进行筛选。

– 代表:Google、AltaVista、Infoseek、Ask Jeeves、百度、天网等。 (3)元搜索引擎 一种基于搜索引擎的搜索引擎,用于提供与查询需求相关的信息线索或者全文,这种搜索引擎本身并没有存放网页信息的数据库。

元搜索引擎通过自己定制的检索界面,接收并处理用户的查询提问,在进行实际的查询时调用一个或者多个独立搜索引擎的数据库,搜索结果是来自独立搜索引擎的检索结果或者是这些结果集合的综合, 结果呈现既可以是引用原始的独立搜索引擎的页面,也可以是由元搜索引擎将从各个搜索引擎返回的结果重新按照它的标准进行合并、去重、排序等过程,最后将处理过的结果显示给用户。 特点: • 将一次提问提交多个数据库; • 标明结果记录的来源搜索引擎及其相关度; • 检全率提高,检准率不易控制 ; • 检索功能简单。

– 代表:WebCrawler、Metacrawler、Dogpile、万纬等11、搜索引擎的工作原理搜索引擎利用网页抓取工具如网络蜘蛛在Internet上抓取网页,然后将抓取到的网页进行一系列的加工处理,例如分类、排序、储存、建立索引、除重。用户在输入检索词之后、搜索引擎将用户输入的检索词转化为能被检索系统识别的检索标识,与数据库中相应的检索词匹配,最后将结果反馈给用户。

另外请参考/view/1154.htm12、关于百度和谷歌百度和谷歌都是基于robot的搜索引擎,两者都有简单搜索和高级搜索,支持匹配检索。目前谷歌是英文搜索引擎的龙头、百度是中文搜索引擎的老大。

更多信息请参考和,你可以亲自去体验一下。另外网络上有很多关于这两个搜索引擎的课件。

我就不必再这里废话了。

信息检索专业知识

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注