范文一:信息检索技术的发展与教育应用探讨
[摘要]在当今技术变革和信息爆炸的时代,每个个体都面临着丰富繁杂的信息选择,都有必要知道如何检索、评价和有效利用信息。文章论述了信息检索技术在教育领域的发展与应用并列举了比较流行的几种信息检索技术,重点探讨了信息检索技术对现代教育、高校图书馆及科研工作的影响。 [关键词]现代社会;信息检索技术;发展;教育应用 [中图分类号]G40―057 [文献标识码]A [论文编号]1009―8097(2009)13―0032―03 引言 现代社会,全球信息化的风起云涌席卷着世界的每一个角落。随着计算机、数字技术及网络技术在信息领域的广泛应用,各利,文献信息的电子化、数字化给传统的信息管理带来了巨大的影响,信息检索技术在现代社会尤其是教育领域得到飞速发展与广泛应用。 一 基本概念 1 信息 信息就是经过加工后的数据,它对接受者的决策或行为有现实或潜在的价值。通俗地讲,信息就是有用的消息。广义地说,信息就是消息。 2 信息检索 信息检索是目前热门的一个领域,其历史由来已久。早期,在图书馆领域。就有文献检索,后来,随着计算机的出现,信息技术的飞速发展,便出现了现在的信息检索。信息检索(Information Retrieval,IR)就是对信息项进行表示、存贮、组织和存取的一种技术。现代信息检索是指信息用户在存在信息需求时的主观能动性,表现在信息检索能力上,信息意识强,信息获取的能力就强。 3 信息检索技术 信息检索技术是指利用现代信息检索系统,如联机数据库、光盘数据库或网络数据库检索有关信息而采用的相关技术,主要有布尔检索、词位检索、截词检索和限制检索。信息检索技术能根据用户的查询返回合适的信息,它在一定程度上解决了信息过载的问题。 二 信息检索技术的发展 人类对信息进行有意识的组织活动早在4000年前就开始了,其方式就是图书目录的编制,使特定的信息能够以结构化的形式表现出来。后来发展的索引(Index)则更进一步加速了信息的快速存取,人们通过索引可以从一个概念或一组词出发,找到其他与之相关联的信息。索引作为信息组织的手段之一,多年来都是以手工方式产生的,一般是南编制人员凭借其知识和经验进行设计而形成的结构性的分类,这样产生的索引为人们的信息检索提供了方便,但也难免有分类上的局限性。另外,大型索引很难凭人力编制。随着计算机技术的发展,大型索引的编制成为可能,索引技术的发展也为快速的信息检索提供了前提条件。 目前,信息检索已经发展到网络化和智能化的阶段。信息检索的对象从相对封闭、稳定一致、由独立数据库集中管理的信息内容扩展到开放、动态、更新快、分布广泛、管理松散的Web内容;信息检索的用户也由原来的情报专业人员扩展到包括商务人员、管理人员、教师学生、各专业人士等在内的普通大众,他们对信息检索从结果到方式提出了更高、更多样化的要求。适应网络化、智能化以及个性化的需要是目前信息检索技术发展的新趋势。互联网规模的急剧增大以及存储系统规模的日益增加推动了现有信息检索技术的发展。 以下是当今比较热门的几种信息检索技术: 1 智能检索或知识检索 传统的全文检索技术基于关键词匹配进行检索,往往存在查不全、查不准、检索质量不高的现象,特别是在网络信息时代,利用关键词匹配很难满足人们的检索要求。智能检索利用分词词典、同义词典,同音词典等改善检索效果,比如用户查询“计算机”,则与“电脑”相关的信息也能检索出来;进一步还可在知识层面或者概念层面上辅助查询,通过主题词典、上下位词典、相关同级词典,形成一个知识体系或概念网络,给予用户智能知识提示,最终帮助用户获得最佳的检索效果。另外,智能检索还包括歧义信息和检索处理。 2 知识挖掘 目前主要指文本挖掘技术的发展,目的是帮助人们更好的发现、组织、表示信息、提取知识,以满足信息检索的高层次需要。知识挖掘包括摘要、分类(聚类)和相似性检索等方面。 自动摘要就是利用计算机自动地从原始文献中提取文摘。在信息检索中,自动摘要有助于用户快速评价检索结果的相关程度;在信息服务中,自动摘要有助于多种形式的内容分发,如发往PDA、手机等。相似性检索技术基于文档内容特征检索与其相似或相关的文档,是实现用户个性化相关反馈的基础,也可用于去重分析。自动分类可基于统计或规则,经过机器学习形成预定义分类树,再根据文档的内容特征将其归类:自动聚类则是根据文档内容的相关程度进行分组归并。 3 异构信息整合检索和全息检索 在信息检索分布化和网络化的趋势下,信息检索系统的开放性和集成性要求越来越高,需要能够检索和整合不同来源和结构的信息。这是异构信息检索技术发展的基点,包括支持各种格式化文件,如TEXT、HTML、XML、RTF、MS Office、PDF、PS2/PS、MARC、IS02709等处理和检索,支持多语种信息的检索,支持结构化数据、半结构化数据及非结构化数据的统一处理和关系数据库检索的无缝集成以及其他开放检索接口的集成等。所谓“全息检索”就是支持一切格式和方式的检索,从目前实践来讲,发展到异构信息整合检索的层面,基于自然语言理解的人机交互以及多媒体信息检索整合等方面尚有待取得进一步突破。 另外,从工程实践角度,综合采用内存和外部存储的多级缓存、分布式群集和负载均衡技术也是信息检索技术发展的重要方面。 三 信息检索技术的发展对现代教育的影响 1 信息检索是培养学生自主学习的有效方法 信息技术的快速发展,知识更新的速度加快。引发了教与学的重大变革,利用信息检索技术促进知识更新、提高自学能力、培养学生创新精神已成为当今教与学中重要的一环。自主性学习是伴随着信息技术与网络的发展而形成的崭新的学习方式,是建立在信息检索技术应用基础之上的一种探究式学习方式,强调让学生掌握认知的手段和方法,变“以教”为主为“以学”为主。自主性学习是信息时代的必然产物,信息检索是连接学习者与网上丰富资源的桥梁,学习者通过与信息资源的交互作用,获取了所需的信息。更新了知识,满足了个性发展需求, 激发了学习的主动性和积极性。因此说,信息检索是漫漫网海中的方向盘,是解决信息爆炸、自主学习、更新知识的有效手段。培养学生的信息检索能力是提高学生自主学习能力的有效方法。 2 信息检索是培养学生创新精神的有效途径 创新教育已成为世界上许多国家教育改革的焦点和核心,其实质是为了培养具有创造性思维、创造性人格和创造性技能的创新人才。创新人才最重要的特征不是掌握很多已有知识,而是具有获取新知识、学习新知识、运用新知识的能力。因此,在我们的学校教育中,如何培养学生的学习技
能,使其学会如何去组织知识,寻找、利用信息,具备不断学习、接受新知识新信息的能力,是当今创新教育的重点。据统计,一项技术的创新,竟有90%综合了前人的成果,只有10%才是自己的成果。由此可见,信息获取与利用的能力及效率将直接影响到创新工作的开展,而创新的效果又取决于各人信息能力的高低,奔涌不息的信息流是人们创新的源泉,信息检索是知识更新的主要途径,继续教育的重要手段。通过信息检索可以不断获取新知识,发现新见解、新概念、新方法、新思路等,提高我们的创新能力。 3 信息检索已成为现代教育技术的重要组成部分 教学过程实质上是信息的选择、存储、传输、转换、分配的过程,而教师在授课之前就开始了信息的检索、收集、筛选、转换行为。特别是在现代教学过程中,教学信息不再是从教师到学生的单向流动过程,而变成一个师生之间能够实现信息互动的双向反馈的过程,这就要求教师必须掌握最新教学信息,因此,教师必须掌握信息检索技术以获取信息,以便于有效地利用信息,优化教学效果,提高教学质量。现代教学资源随着网络的发展与日剧增,网上教程、网上论坛、学术成果、课程资料及各种政策法规、教育管理信息等日新月异,呈现出全球化、海量化、多元化、内容丰富分散、变化频繁等特点。掌握了信息检索的方法便可以无师自通,找到一条吸收和利用大量新知识的捷径,把大家引导到更广阔的知识领域中去,对未知世界进行探索。因此,信息检索技术已成为现代教育技术中不可缺少的一部分,并已在现代教育中发挥重要作用。 四 信息检索技术的发展对高校图书馆工作开展的影响 计算机集成化检索软件的投入使用,使图书馆的采访、编目、流通、典藏、书目检索等全部流程实现了计算机管理,使图书馆的各项业务工作更加规范化、标准化,工作效率大大提高,读者利用图书馆也更加方便、快捷。现在,图书馆在软硬件设施上为现代化信息咨询服务提供了保障一各种光盘数据库、涉及各个领域的中英文网络专业数据库、缩微胶片等多种媒体信息资源的提供,较好地满足了不同层次读者的信息需求。信息检索技术的发展及大型多功能电子阅览室的建成和投入使用,又为广大读者提供了一个可以自主利用现代信息技术,享受图书馆信息服务的现代化阅览环境。 但是,信息检索以及信息资源利用的效果好坏,不仅取决于检索与利用者的检索知识和信息能力,而且取决于他的专业水平以及语言利用能力。但是,好多读者都不善于利用检索工具。因此,如何帮助读者提高检索、获取、利用有用信息的能力,尤其是强化读者对现代即时性动态信息获取的科学方法的培养,已成为现代图书馆信息服务工作的一项重要职能。 五 信息检索的发展对科研的推动作用 信息检索是科学研究的重要环节,科技工作者在科学研究中,从选题、立项、试验、撰写研究报告、研究成果鉴定到申报奖项,每一环节都离不开信息检索。据统计,科研人员在整个研究过程中,查阅文献信息的时间要占全部科研时间的40%左右,只有大量搜集、整理、分析与利用信息,才能弄清楚古今中外进行过哪些研究、运用什么理论、采用何种方法、取得什么成果、达到何种水平、哪些研究领域还没有涉及、哪些研究项目具有可行性、重要性和发展前景。掌握了这些信息,首先,可以了解国内外科技发展水平与动向,利用已有的科研成果,避免重复他人的劳动,把自己的研究工作建立在一个较高的起点上;其次,通过信息这一智慧的火种,可以使科研人员开阔视野、发展思路、启迪创造力、开拓更新的、更高层次的、更广阔的研究领域;再次,掌握信息检索技术与方法,可以大大提高信息检索效率,为科研工作赢得大量宝贵时问,缩短科研周期,加速科研进程,创造出更多的商附加值的技术成果。 总之,在知识经济时代,信息检索对科学研究工作的重要作用日趋明显。 六 总结 信息检索技术的发展对现代教育的各个方面如自主学习、创新教育、教育技术、图书馆工作以及教育科研都起到了巨大的推动作用。随着Internet的迅速普及,检索方式必然向着网络检索的方向继续纵深发展,多种技术的整合和检索手段的智能化将使网络变得更加丰富多彩,信息用户范围将得到空前扩大。 不仅在教育界,信息检索技术在现代社会发展其他领域的应用都将是新世纪人类进步与发展的一个亮点。 参考文献 [1]高荣林.现代教育技术[M].苏州:苏州大学出版社,2000:151 [2]张宏斌,朱明富,陈德军.智能化搜索引擎技术的研究进展[N]信息与控制,2003. [3]张福泉.信息检索的黄金时代[M].闽江学院现代教育技术中心,2005:69―70. [4]孙建军.信息检索技术[M].科学出版社,2004:121―122. [5]贺志刚.现代信息检索[N].信息与控制,2003―18―19 [6]姜瑛俐.创新教学模式与方法[M].上海:东方出版中心,2005:74. [7]叶平.创新教育新论[M].上海:东方出版中心,2001:135 [8]王良成.创新人才培养与信息素质教育[N]中国信息导报,2006. [9]梅光耀.高校图书馆怎样开展信息素质教育[D].华南理工大学图书馆,2003:54. [10]洪拓夷.网络环境下的信息检索教学设计[D].辽宁石油化工大学图书馆,2004:26. [11]柯平.信息素养与信息检索概论[M].上海:南开大学出版社,2005:92―93. [12]袁振国.当代教育学(修订版)[M].上海:上海教育出版社2004:59―60
范文二:信息检索技术在课题中的应用研究
信息检索技术在课题中的应用研究
科研课题中的信息枪索通常包括以下步骤:分析课题一选择检索系统及数据库—选定检索词一制定检索式一上机检索(同时调整检索策略)一输出检索结果。
(1)分析课题
科研人员应从以下几方面分析课题的要求:课题的主题,课题所涉及的学科范围,课题所需信息的内容及特征,课题所需信息的类型,包括文献类型、出版类型、年代范围、语种、著者、机构等>课题对查新、査全和査准的指标要求。
(2)选择检索系统及数据库
从课题内容的广度与深度.课题专业覆盖面、用户要求的信息类型与时间范围、课题检索经费支持等方面综合考虑,选择检索系统及数据库。
(3)选定检索词
在全面了解待检索课题的相关问题后,提炼主要概念与隐含概念,排除次要概念,选择检索词,并根据选定的检索系统、数据库的要求,进一步优化检索词。检索词的选择,一般有以下几种方法:优先选用主题词,选用检索系统规定的代码,选用常用的专业术语
(4)制定检索式
采用检索技术常用的运算方法制定检索式,用逻辑“与”连接不同概念检索词,用逻辑“或”连接同一概念检索词,用位置算符限制词组或词间相对位置关系,用截词来检索具有相关词干的词。
检索式的制定是否合理,将直接影响到检索结果的成败。在制定检索式时,需要注意以下几点:使用逻辑“与”算符可以缩小命中范围,起到缩检的作用,得到的检索结果专指性强,查准率也就高。使用逻辑“或”算符可以扩大命中范围,得到更多的检索结果,起到扩检的作用,查全率也就高,使用逻辑“非”算符可以缩小命中范围,得到更切题的检索结果,也可提高查准率,但使用时要慎重,以免把一些相关信息漏掉。
(5)上机检索
制定完检索式就可以上机检索。检索时,应及时分析检索结果是否与预期目标一致,根据检索结果对检索式做出相应的修改与调整,直到得到比较满意的结果。当检索结果信息太多时,就需要考虑适当紧缩检索式,通过选用漑念较专指的检索词(下位词)或进行限定性检索等方法,来减少检出的信息量,反之,信息量太少,则要考虑采用相反的措施。
(6)输出检索结果
根据检索系统提供的检索结果输出格式,选择需要的检索记录以及相应的字段,将结果显示在屏幕上、存储到存储介质上或直接打印输出,至此,完成了整个检索过程。
范文三:信息检索技术在文档管理中的应用
信息检索技术在文档管理中的应用
摘 要: 为方便信息管理,在已有标准电子文档基础上,运用信息检索原理及信息检索实现技术,研究以关键字查询方法为重点的标准平台索引服务,建立起一个标准共享平台。标准共享平台运行结果表明,信息检索技术能方便地运用于文档的管理中。关键词: 标准共享平台;信息检索;关键字
对石油的开采、运输等工程设计过程中需要用到大量文档信息(国外标准、国家标准、企业标准等)。为方便标准的管理和使用,实现技术有形化及知识共享和积累,将标准的管理与信息检索技术相结合,建立了与数字图书馆[1]类似的能通过关键词查询或任何经过定义的方式获得所需信息的系统。通过该系统,用户可以随时随地、方便而快捷地查找并获得统一、准确的标准信息。 本文以中国石油公司的标准电子词典开发项目为背景,整个项目是通过已有的标准电子文档建立一个标准共享平台[1-2]。讨论以关键字查询为重点的信息检索技术的基本思想。1 信息检索技术 信息检索技术的基本原理[3]是通过对大量的、分散无序的文献信息进行搜集、加工、组织、存储,建立检索系统,并通过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获得和利用信息源。其核心思想是用户信息需求与文献信息集合的比较和选择,是两者匹配的过程。 信息检索的一般过程是检索系统将文档集合中的文献对象进行标引,用户将需要查找的信息(即信息需求)表达成查询,以信息提问的方式提交给检索系统,则检索系统运用预先设定的匹配算法[4]进行计算,检索出查找对象,并最终输出满足用户需要的结果。信息检索主要过程。
2 信息检索技术的实现2.1 标准平台提供的检索功能 对用户的信息需求,标准共享平台提供分类目录查询和输入关键字查询两种方式。输入关键字查询需要用户输入所需查询信息的标题或标准编号中的字、词或者发行部门等信息,计算机通过事先设置的算法返回用户查找的信息。2.2 关键字检索技术 由于标准平台的开发面向已有的电子文档,因此平台的关键字检索设计主要在于解决关键字索引及如何查询索引问题。 按照输入关键字查询要求,将标准名称及对应的标准编号与标准内容通过序号建立一一对应关系[5],可将每篇文档的标题看成是全文信息。利用倒排索引[6-7]思想,一方面将所有标准名称及编号中的每个字按照其首字母先后顺序建立一个索引,称为词表,它包含一个记录表项,记录表项记录了出现这个字的标题所在地址信息及其编号情况。另一方面将出现的各个词项的文档标题或编号构成一个文件,即记录文件。例如,表1展示了部分标准信息,针对这些标准中的词条建立倒排索引,部分内容如表2所示。
在查找索引词表问题上,由于词表是按其首字母顺序进行位置排序,当输入一个字时,利用二分法[3]找到其首字母所属段词表,然后再对此段词表进行顺序搜索,直到查找到此字在词表中的位置,同时找到此字的记录表项,根据记录表项中所记录的标准名称所在位置及序号找到相应的文档标题。当输入不止一个字时通过AND操作,找到同时包含输入字的文档标题,通过之前与全文信息建立的对应关系即可找到文档信息。3 信息检索技术在系统中的实现 在搜索框内输入关键字,便可显示含有关键字的标准或文档信息,如果没有符合的标准,系统则输入“无此项信息”。图2为输入关键字“腐蚀”后的检索示意图。
从对标准电子词典的测试情况发现,运用倒排检索及二分法对词表进行查询的方式所建立的标准共享平台有非常高的正确率,满足用户要求。 标准电子词典的成功开发,是将信息检索技术与企业文档管理相结合思想应用到实际工作中的一个例子,它使得用户通过登
录系统输入关键字便可以对所需标准进行搜索等操作。将工作人员从繁重的、重复的手工劳动中解放出来,提高了管理部门的管理水平。
范文四:信息检索新技术应用
第23卷第8期2005年8月
情
转载请注明出处范文大全网 » 信息检索技术的发展与教育应用