范文一:检索表达式
一、实验目的
了解文献分类、掌握关键词提取及检索表达式制定方法。
二、实验内容
《中图法:专业文献分类》、关键词提取、检索表达式制定
三、实验思考题
1、详细描述《中图法》中文献部类及个大类划分情况(名称、代码)
五大部类:马列类A,哲学类B,社会科学C,自然科学N,综合性Z
二十二大类:A(马列毛邓著作及学习研究)、B(哲学)、C(社会科学总论)、D
(政治、
法律)、E(军事)、F(经济)、G(文化、科学、教育、体育)、H(语言、文字)、
I(文
学)、J(艺术)、K(历史、地理)、N(自然科学总论)、O(数理科学和化学)、P
(文学、
地球科学)、Q(生物科学)、R(医药、卫生)、S(农业科学)、T(工业技术)、U
(交通
运输)、V(航空、航天)、X(坏境科学、劳动保护科学(安全科学))、Z(综合
性图书)
2、提取关键词及制定检索表达式
(1)网络信息资源的检索与利用
关键词:网络信息资源、检索、利用
检索表达式:篇名=网络信息资源 and (篇名=检索 or 篇名=利用)
(2)安全科学数字图书馆建设
关键词:数字图书馆、安全科学、建设
检索表达式:篇名=数字图书馆 and 篇名=安全科学 and 篇名=建设
(3)亚洲金融风暴对中国经济的影响
关键词:亚洲金融风暴、中国经济
检索表达式:篇名=亚洲金融风暴 and 篇名=中国经济
(4)市场经济的负效应与青少年犯罪
关键词:市场经济、负效应、青少年犯罪
检索表达式:篇名=负效应 and 篇名=市场经济 and 篇名=青少年犯罪
(5)大学生违法犯罪的心理特性及预防
关键词:大学生、违法犯罪、心理特性、预防
检索表达式:篇名=大学生 and 篇名=违法犯罪 and (篇名=心理特性or 篇名=预防)
(6)电子商务与企业发展
关键词:电子商务、企业发展
检索表达式:篇名=电子商务 and 企业发展
(7)网络著作权的法律保护
关键词:网络著作权、法律保护
检索表达式:篇名=网络著作权 and 篇名=法律保护
(8)高层建筑抗震设计
关键词:高层建筑、抗震设计
检索表达式:篇名=高层建筑 and 篇名=抗震设计
范文二:检索表达式构造
【资料】检索表达式(提问式)的构造
注:本来这次实习报告是要测试同学们目前的文献检索水平,相当于做一
次调查,再分析存在的问题,有针对性进行教学,提高同学们的检索技能。但
有同学提出一些问题后,老师觉得有必要把这个资料发给你们,希望对你们提
高检索能力有帮助。如对其中的一些问题不理解,也不要焦急,我们这部分没
学到,下个专题就要学学了。顺便把下一专题学习的讲义发给你们,可以提前
学习了解。
检索表达式 也称检索式或检索提问式,是检索策略的具体表现,是用逻辑
运算符将检索词组配而成,它就直接影响检索结果。
检索式是检索策略的具体表述,是通过逻辑算符、位置算符、截词算符等把
表达主题要领的各检索单元组配连接起来的命令形式,它既能表达主题内容,又
能被机器识别和执行,是决定检索策略质量和检索效果的重要因素。
※检索提问式,是指计算机信息检索中用来表达用户检索提问的逻辑表达
式,由检索词和各种布尔逻辑算符、位置算符以及系统规定的其它组配连接符号
组成。
◎◎检索表达式的制定要遵循以下几个步骤:
(1) 切分 是对课题包含的词进行最小的分割
(2) 删除 对过分宽泛或过分具体的词、无实际意义的边词、虚词应予以
删除。如“的” “及”
(3) 替换 对表达不清晰活容易造成检索误差的词加以替换。 如 “绿
色包装” 中的绿色应替换成“环保”
(4) 补充或增加 这一步是将课题筛选出的词进行同义词、近义词、相
关词的扩充,这些词加入检索款目可以避免漏检。
(5) 组合 把检索词用逻辑符号链接组合成检索式。
聚类组合法:切分、删除、替换、补充、增加、组合。
例1:
壮族传统民居的研究
切分:壮族 传统 民居 的 研究
壮族 传统 民居 建筑 的 研究
补充 (删除)
壮族 传统 民居 建筑
例2:
大气中细菌浓度的计算方法
(替换)
大气污染的计算方法
例3:
高层建筑的优化设计
(切分)
高层 建筑 的 优化 设计
(删除)
高层 建筑 优化 设计
(替换)
高层 建筑 优化 结构设计 (词的集合)
(聚类)
高层 优化 结构设计 (组面的集合)
建筑
例4:
(补充)
煤田勘探
煤田勘探+煤田*地质勘探
(增加限义词)
勘探 勘探*煤田(逻辑“与”)
勘探 勘探-煤田(逻辑“非”)
例5:
(组合)
[a,b,c] 1 a,b,c
2 ab,ac,bc,ba,ca,cb
3 abc,acb,bac,bca,cab,cba
生物心理学
1 生物*心理*科学
2 生物学*心理+心理学*生物
3 生物心理学+心理生物学
例6※壮民族旅游文化资源的开发与综合利用
例7绿色设计在我国的发展及状况_____ _ The Green Design's develop
and condition in our country
课题重点、关键词、主题词等分析(中英文): 绿色设计(green design)、我
国(our country) 、发展(develop)、状况(condition)
检索式(例):1. 绿色设计and我国and发展or状况2 绿色设计and中国
and发展or状况3 中国and绿色设计and发展or状况4, 中国and绿色设计and
发展or状况
例8※※※※“有关造纸废水的处理技术”方面的检索式,首先抽起检索词:
造纸——paper making, paper pulp
废水——waster water
处理——treat, treatment
构造检索式:(paper w making or paper w pulp) and waster water and
(treat or treatment)。
例9父母民主型教养方式对幼儿卫生行为习惯培养的影响
【】苏东坡历史故事
苏东坡 历史故事 中国 现代
【】网页设计与网站建设的思考与设计
网页设计 网页制作 网站设计 网站建设
【】投机家的证劵心理分析
股票 证劵投资 市场心理学
【】信息时代的企业人力资源管理
例9 检索实习报告范例三
利用计算机网络数据库检索。我院有多种计算机网络数据库,本范例中只给
出《清华同方全文数据库》和《维普全文数据库》检索样例。其他中文数据库可
以参照实习。
计算机数据库检索是利用字段检索实现信息检索,所以准确使用所需检索的
字段是检索的关键。同时计算机数据库检索都有普通检索与高级检索之分,本课
程检索实习要求使用高级检索(即布尔逻辑检索)或二次检索。
班级 学号 姓名 日期 题目:探讨港口物流中心的运作模式对现代物流的影响
1.课题分析:
以港口为中心,大力发展现代物流业已成为一种必然趋势。而港口发展现代
物流业最重要的是建立现代化的港口物流中心。在我国,目前各大港口都已经朝
着物流中心转化,上海,广州,天津,深圳,厦门等港口都在积极规划建设物流
园或物流中心。我国港口物流中心发展不成熟,且物流中心的建设需要巨大的投
入。因此,对我国港口发展物流中心的运作模式进行理论上的探讨,对指导港口
物流中心的建设是有着现实意义的。即物流问题涉及港口建设与经营、管理。其
次,物流学科是个跨学科的研究对象,除了涉及港口外还涉及对外贸易、铁路与
公路的运输,物资的供应链与流通。但此课题不涉及一般物流概念,诸如:生产
企业的物流、超市物流等。根据这些分析,我们可以看出课题涉及的主题(关键
词)主要是港口、物流、物流中心、供应链等。因此,应该对这些关键词进行全
面的布尔逻辑检索。另外,物流概念是近几年提出,为了检索到较新的信息,检
索时限定检索时限为2001年至今。
2.选择数据库:
《清华同方全文数据库》和《维普全文数据库》
3.检索途径:
根据以上分析选用主题词检索字段检索,且用港口与物流两词进行布尔逻辑检索。即采用高级检索,也可以采用简单检索后进行二次检索方法,以达到同样效果。
高级检索:关键词:港口*物流
一般检索:关键词:港口;在第一次检索后使用二次检索,关键词为:物流(二次检索相当与布尔逻辑检索中的与检索)
4.检索内容:
(1)《清华同方》
※ 【篇名】 当代国际航运中心发展的新趋势——兼析上海国际航运中心的规划建设 CAJ原文下载
【关键词】 国际航运中心;;集装箱转运;;港口区域组合;;物流中心;;上海市
※※【篇名】 天津港集装箱物流中心战略构想 CAJ原文下载
【关键词】 天津港;;集装箱物流中心;;战略规划;;目标模式;;建设构架;;功能设计;;对策建议
(2)《维普》
第一条
【题 名】 全球物流发展趋势与港口功能转变——深圳案例经验分析
【关键词】 深圳市 案例 港口发展 全球物流 发展趋势 港口功能
第二条
【题 名】 港口物流信息系统评价原则及方法
【关键词】 港口 物流信息系统 诊断 评价
检索内容已有格式说明,故不进行格式说明。(以上内容直接从计算机上检索并下载)
※例10 检索实习报告范例四
课题: 计算机辅助设计在建筑设计中的应用
1.课题分析:
当前世界各国在建筑设计广泛采用先进技术,以增强建筑设计上的竞争能力
和提高建筑的技术含量。过去在建筑的设计上主要靠人工完成,随着计算机技术的开发,特别是计算机辅助设计技术的产生和应用,使建筑设计有了很大的技术保障,但我国计算机辅助设计在建筑设计中的应用相对落后。对此,检索有关信息,以利用有关国家在这方面的情报。根据分析,确定的主题词为建筑设计 , 计算机辅助设计。
2、检索途径:
在Ei数据库中有两个可以检索的库,本次检索使用2000—2003的数据库。同时依据以上分析,采用建筑设计, 计算机辅助设计这两个词的“与”检索。“计建筑设计*计算机辅助设计”
其检索式(检索表达式或叫检索提问式)是:“计建筑设计*计算机辅助设计”
3.检索内容:
例10 (二)[实习(实验)二]
检索工具与参考工具使用方法
《全国报刊索引》使用方法(其他检索工具与参考工具使用方法一样)
《全国报刊索引》目前有2种检索途径,分别是分类途径和著者途径。下面举例说明其使用方法。
1.分类途径
[检索工具] 《全国报刊索引》(自然科学技术版)
[检索课题] GPS车辆定位系统研究(1995-2008年)
[检索程序]
第一步:分析研究课题,选择查找分册。根据课题含意,应选《全国报刊索引》(自然科学技术版)。
第二步:确定类目。对照《全国报刊索引》(自然科学技术版)类目表,确定该课题的类目为“P22 大地测量学”。
第三步:根据确定的类目名称逐本查找,直到满足检索要求为止(1995-2008年)。例如在2003年 11期上查得:
031101554 GPS车辆定位监控系统的应用/李星蓉(华北电力大学,071003)//电力系统通信(南京).-2003,24(6).-34-37
第四步:索取原始文献:(1)用上步获得的期刊刊名《电力系统通信》查《中
文期刊馆藏目录》,获得馆藏单位;(2)去人或去函借阅或复制。
2.著者途径
[检索工具] 《全国报刊索引》(哲学社会科学版)
[检索课题]查找经济学家吴晓求2003年发表的论文
[检索程序]
第一步:分析研究课题,选择查找分册。经济学家吴晓求发表的论文一般属于经济学范畴,因此应选择《全国报刊索引》(哲学社会科学版)。
第二步:用著者姓名按姓氏汉语拼音字顺在每期《全国报刊索引》(哲学社会科学版)后面的“著者索引”中查找,获得文献顺序号。例如在2003年6期和9期上分别查得:
吴晓求 030609834 (6期)
吴晓求 030907098 (9期)
第三步:用所获文献顺序号(俗称文摘号)查同期题录本,获得文献篇名与文献出处等。第6期上为:
030609834 资本结构和公司治理/吴晓求(中国人民大学金融与证券研究所)//资本市场.-2003,(4).-23-28
第9期为:
030907098 激励机制与资本结构:理论与中国实证/吴晓求(中国人民大学金融与证券研究所)//管理世界.-2003,(6).-5-14
第四步:索取原始文献:步骤同分类途径,
第四讲 文献检索原理、方法和技术
一、文献检索原理
检索含义:从信息集合中迅速、准确地查找出所需信息的过程和方法。
1、定 义
文献信息检索是人们利用特定的检索技巧与方法,从信息集合中对目标资源进行快速定位,获取与信息需求相关的那部分信息的过程。
从文献信息处理的角度来说:文献信息检索包括信息存储与检索两个过程; 从读者检索的角度来说:文献信息检索仅指从信息集合中找出信息的过程,相当于人们通常所说的信息查询。
信息集合是指有组织的信息资源整体,可以是:馆藏目录、数据库、(印本)检索工具等。
※文献信息存储过程:将大量分散的文献信息搜集起来,根据其内容特征或外表特征进行标引,形成表征这些文献信息的特征标识,并存储在一定的载体上,成为有查询功能的检索工具。
标引:对文献内容特征和外部特征进行分析形成概念标识,再依据一定的标准或规则(检索语言:如分类号、主题词、关键词及著者选用规则等)将其用相应的标识充分、准确地表达出来。
※文献信息检索过程:用户根据自己的信息需求,提出检索提问,然后使用有关的标引语言(也称检索语言)将拟定的检索提问规范成检索标识,用于检索的过程。
二、文献检索方法
在浩如烟海的文献中要查阅到自己所需要的资料,不仅需要遵循准、全、深、快的文献检索原则,更需要灵活掌握和运用文献检索的基本方法。常用的文献检索方法有:
(一)基本方法
1、文献信息检索的常用方法
(1)顺查法
根据检索课题的起始年代,利用检索工具,按照从旧到新、由远及近、由过去到现在的顺时序,逐年查找文献信息的方法。
查全率高。适用于围绕某一主题普查一定时期内的全部文献信息,或者说适用于那些主题较复杂,研究范围较大,研究时间较久的科研课题。
可用于事实检索,更多地用于文献检索。
(2)倒查法
根据检索课题的起始年代,利用检索工具,按照从新到旧、由近及远、由现在到过去的逆时序逐年前推查找文献信息的方法。
查得的信息新颖性强,查全率不高。多用于新课题、新观点、新理论、新技术的检索。检索的重点在近期信息上。
(如:检索“藏青会”的相关信息)
(3)抽查法
利用检索工具,针对某一学科的发展重点、文献信息量较大的阶段,选定一定时间范围进行逐年检索的方法。
必须熟悉学科的发展特点,把握学科发展的高峰期和低谷期。
(如:检索“克隆羊多莉”的相关信息)
2、回溯法
也称引文法,是一种跟踪查找的方法,即以文献后面所附的参考文献和引文索引为线索,逐一追溯查找文献的方法。
适用于检索课题的背景和立论依据等方面的文献。
(如:《科学引文索引》(SCI)、《中国科学引文索引》(CSSCI)。)
3、循环法
是常用法和追溯法交替使用的方法,又称循环法或交替法,既利用检索工具,也利用文献后所附参考文献进行追溯,两种方法交替,分期分段使用,对获得一定年限内相当文献的资料线索,节省检索时间。
4、 浏览法 (积累法)
浏览法,是指研究人员平时对与本专业或本学科相关的原始文献资料进行浏览、阅读和积累的一种方法。 常规法虽然可以在短时间内获得大量切合课题需要的文献,但是,出于任何一种检索工具都只能收录有限的期刊和图书,而且检索工具与原始文献之间一般有6个月左右的时间差,为了弥补这些缺陷,就需要研究人员及时阅读最新生产的原始文献,不断积累相关资料,跟踪学科发展的前沿。浏览法的优点是:能最快地获取信息;能直接阅读原文内容;基本上能获取本学科发展的动态和水平;缺点是科技人员必须事先知道本学科的核心期刊,检索的范畴不够宽,因而漏检率较大。有局限性,不全面,不系统,不能作为查阅文献的主要方法。
四种方法可根据不同情况进行选择,检索中为省时,要充分利用累积索引。
※选择检索方法的原则
1、 如果检索工具不全和根本没有,检索课题涉及面不大。对查全率要求不高,可采用追溯法,用综述和评述最好
2、如工具完备,课题涉及范围大,采用常用法或综合法
3、如课题属于新兴学科或知识更新快的学科可用倒查法
4、如对查全率要求高,如开展查新,一般采用顺查法
5、如一掌握了课题发展规律、特点,一般采用抽查法
(二)数据库和网络资源的检索方法
1、浏览方法
数据库类型浏览,按题录、文摘、全文浏览,按主题目录、导航、学科分类浏览。
2、检索方法
(1) 快速检索
单检索:一般仅提供一个检索框输入检索式,并使用少数常用的检索字段。适合初级用户和构建比较简单的检索式
(2) 专业检索
利用分类导航,按专业类目等级进行检索,是常用的检索方法
(3) 期刊导航检索
按年卷期浏览,期刊漫游
(4) 分类检索
按中图法做学科范围组合,灵活限制检索范围。
(5) 相关主题检索
(6) 高级检索
高级检索或专家检索:适合熟悉检索指令并有检索经验的熟练用户使用。一般需要使用命令行式检索,通常需要使用字段标识符和布尔逻辑算符组配进行检索
(7) 全文检索 按资料的内容检索,而不是按结构化特征来检索
三、计算机检索技术
在计算机信息检索过程中,为了提高检索效率,计算机检索系统常采用一些运算方法,从概念相关性、位置相关性等方面对检索提问实行技术处理。下面介绍几种常用的信息检索技术方法。
(一) 主要检索技术
【资料】基本运算符
※优先算符 括号():如同数学运算符决定检索组配的先后次序。 ※短语符 双引号:引号内的语句会被当成一个词进行检索。 “-”(连接符)“\” (斜杠) “_”(下划线) “,” (逗号) “.”(点) 在不同的搜索引擎中也可作为短语连接符。
※加号(+) 要求结果中必须包含某个特定的检索词,可在它前面加一个“+” 如“+数字图书馆”
※减号 (-)要排除含有某个特定检索词的网络信息,可以在它前面加一个“-” 如关于查office 2003的资料,但又不想要office 2000和 office 98
的信息,检索提问式可以是“office 2003-office 2000-office 98”
※通配符“*”在进行简单检索时,可以在单词末尾加通配符来代替任意字母的组合(最多可代替5个小写字母) 但不能用单词的中间或开头。
1、布尔逻辑检索
所谓布尔逻辑检索(Boolean Logical)是用布尔逻辑算符将检索词、短语或代码进行逻辑组配,指定文献的命中条件和组配次序,凡符合逻辑组配所规定条件的为命中文献,否则为非命中文献。它是机检系统中最常用的一种检索方法。逻辑算符主要有:And/与、Or/或、Not/非,分述如下:
(1)逻辑“与”
运算符为 And 或 * 。检索词A和检索词B用“与”组配,检索式为:A And B或者 A * B, 它表示检出同时含有A、B两个检索词的记录。逻辑与检索能增强检索的专指性,使检索范围缩小,此算符适于连接有限定关系或交叉关系的词。
(2)逻辑“或”
运算符为 Or 或 + 。检索词A和检索词B用“或”组配,检索式为:A Or B或者 A+B 它表示检出所有含有A词或者B词的记录。逻辑或检索扩大了检索范围,此算符适于连接有同义关系或相关关系的词。
(3)逻辑“非”
运算符为 Not 或 - 。检索词A和检索词B用“非”组配,检索式为:A Not B或者 A - B 它表示检出含有A词,但同时不含B词的记录。逻辑非和逻辑与运算的作用类似,可以缩小检索范围,增强检索的准确性。此运算适于排除那些含有某个指定检索词的记录。但如果使用不当,将会排除有用文献,从而导致漏检。
布尔检索式优先执行顺序通常是Not→And→Or,在有括号的情况下,先执行括号内的逻辑运算,在多层括号时,先执行最内层括号中的运算。布尔检索比较容易掌握,但使用不当会造成大量漏检和误检,特别是非运算符的运用应特别小心,否则会把有用的文献排除了。
2、截词检索(截词符*和?)
截词检索(Truncation)
是指用给定的词干做检索词,查找含有该词干的全部
检索词的记录。
因此,也称词干检索或字符屏蔽检索。就是将通配符如“*”、“?”或“$”
等,放在检索词中检索者认为合适的地方截断,用截断的词的一个局部进行检
索,并认为凡满足这个词局部中的所有字符(串)的文献,都为命中文献。
这样,检索者不必输入完整的检索词。它可以起到扩大检索范围,提高查全
率,减少检索词的输入量,节省检索时间,降低检索费用等作用。检索时,若遇
到名词的单复数形式,词的不同拼写法,词的前缀或后缀变化时,均可采用此方
法。在实际检索中,常遇到词干相同、词义相近的检索词,或同一词的单、复数
形式,动、名词形式,英美拼法等。
截词的方式有多种,按截断部位可分为后方截词、前方截词、中间截词等;
按截断长度(字符数量) 可以分为有限截词和无限截词。
(1)后方截词
截去某个词的尾部,是词的前方一致比较,也称前方一致检索。例如:输入
geolog?(?为截断符号),将会把含有geological、geologic、geologist、geologize、
geology等词的记录检索出来。若输入PY=199?,会把90年代的记录全部查出来。
(2)前方截词
截去某个词的前部,是词的后方一致比较,也称后方一致检索。例如:输
入?magnetic 能够检出含有magnetic、electromagnetic、paramagnetic、
thermo-magnetic等词的记录。
(3)中间截词
截去某个词的中间部分,是词的两边一致比较,也称两边一致检索。例如:
输入organi?ation可以检出organization、organisation;输入f??t可查出foot、feet。
(4)有限截词
是指允许截去有限个字符。例如“acid? ?”表示截去一个字符,它可检出acid、
acids,但不能检出acidic、acidicity、acidity等词。又如comput??? ?可检出compute、computer、computers、computing等词,不能检出computable、computation、
computerize等词。注意:词干后面连续的数个问号是截断符,表示允许截去字
符的个数,最后一个问号是终止符,它与截断符之间要有一个空格,输入时一定
要注意。
(5)无限截词
无限截断是指允许截去的字符数量不限,也称开放式截断。上面右截断、左
截断所举的例子均属此类型。
在实际检索时,我们还需要注意这样几个方面:一是任何一种截词检索,
都隐含着布尔逻辑检索的“或”运算。采用截词检索时,既要灵活、又要谨慎,截词的部位要适当,如果截得太短(输入的字符不得少于3个),将增加检索噪声,影响查准率。另外,就是不同的机检系统使用的截词符不同、各数据库所支持的
截断类型也不同,
◎截词检索主要是利用检索词的词干或不完整的词形进行检索。
截词符一般用“?”、“ *”、“$”表示($是引用单元格函数)
※后方截词:用于前方一致的派生词检索。
如:信息?
则表示在数据库中含有信息、信息技术、信息检索等方面的文献记录均为
命中文献。
※前方截词:用于后方一致的派生词检索。
如:?经济
则数据库中含有经济、工业经济、农业经济等方面的文献均为命中文献。 *: 至少键入一个词的前3个字符,
××3、位置运算符检索(常用语外文数据库) 不讲
当检索的概念要用词组表达,或者要求两个词在记录中位置相邻/相连时,
可使用位置算符。位置检索(Proximate)是在检索词之间使用位置算符(也称邻近
算符Adjacent Operators),来规定算符两边的检索词出现在记录中的位置,从而
获得不仅包含有指定检索词而且这些词在记录中的位置也符合特定要求的记录。这种方法能够提高检准率。
机检系统中常用的位置算符(按限制强度递增顺序排列)如下:
(1)(w)算符With或()和 (Nw)
(w)要求检索词必须按指定顺序紧密相连,词序不可变,词之间除允许有空格、
标点、连字符外,不得夹单词或字母;(Nw)表示连接的两个词之间最多可夹入N
个词(N为自然数),词序不得颠倒。例如 input(w)output可检出input output而
wear(1w)materials可检出wear materials、wear of materials e
(2)(n)算符near和(nN)
(n)要求被连接的检索词必须紧密相连,词之间除允许有空格、标点、连
字符外,不得夹单词或字母,词序不限;(Nn)表示两个检索词之间最多可以夹N
个词(N为自然数1、2、3?),且词序任意。例如 information(n)retrieval 可以检
出 information retrieval 和 retrieval information,
(3)(f)算符Field
要求被连接的检索词出现在同一字段中,字段类型和词序均不限。例如
happiness(f)sadness and crying 又如 pollution(f)control/ti,ab
(4)(s)算符Sub-field/Sentence
要求被连接的检索词出现在同一句子(同一子字段)中,词序不限。例如
machine(s)plant
但需要需要说明的是,不同的机检系统,位置检索的功能及算符不同,应
参看各系统的说明。
对于全文型数据库,特别是进行全文字段检索时,使用位置算符往往更理想
4、限制检索
特定年代、特定类型(filetype)、特定检索点等做限制。
限制检索(Range)是通过限制检索范围,达到优化检索结果的方法。限制检
索的方式有多种,例如进行字段检索、使用限制符、采用限制检索命令等。
1、基本字段限制检索
字段检索是把检索词限定在某个字段中,如果记录的相应字段中含有输入的
检索词则为命中记录,否则检不中。
题名(TI) 关键词ID或k 主题词DE 分类号CC
全文(FT,Full text) 作者AU
期刊名JN 出版机构py 语种LA 文件类型 DT
例如:查找wang wei写的文章,可以输入检索式:au=wang wei
2、使用限制符
使用限制符就是用表示语种、文献类型、出版国家、出版年代等的字段标识
符来限制检索范围
尽管网上信息检索不分字段,但大多数网络工具—搜索引擎都具有类似于字
段限定检索功能,依此功能,可以将检索范围限定在特定的范围中。
文献类型的限定 检索词 filetype:ppt(doc pdf xls swf)
范例 保护生物学 filetype:ppt
关键词出现的位置限定 如: intitle 检索词 (按网页标题搜索)
范例 保护生物学 intitle:研究所
把搜索范围限定在某个站点中,提高查询效率。{按网域(站)搜索}
范例 姚明 site:sina.com.cn
把搜索范围限定在url链接中——inurl (按URL搜索)
【检索算符】inurl
基本查询语法:inurl:资源类型+关键词
如:输入[inurl:MP3刘欢]表示搜索可能有刘欢的mp3音乐网站。
网页url中的某些信息,常常有某种有价值的含义。因此对搜索结果的url
做某种限定,就可以获得良好的效果,可提供非常精准的专题资料。
范例 photoshop inurl:jiqiao
3、使用限制指令
限制指令可以分为:一般限制指令(Limit,它对事先生成的检索集合进行限
制)、全限制指令(Limit all,它是在输入检索式之前向系统发出的,它把检索的
全过程限制在某些指定的字段内)。
例如:Limit S5/328000-560000 表示把先前生成的第5个检索集合限定在
指定的文摘号内。又如:Limit all/de,ti 表示将后续检索限定在叙词和题名字段。 上述几种限制检索方法既可独立使用,也可以混合使用。
使用辅助索引字段时要用前缀标识符,即在限制检索符后加等号“=”,再
加检索词(如上例中的LA=)。应当注意,各数据库的前后缀代码的数量和形式
有所不同,在检索某一数据库,需参考有关说明材料。DIALOG系统蓝页中的检
索选择项(Search Option)提供了可检字段说明;利用联机HELP功能,输入指
令“? FIELDn”(n为数据库文档号)可以查阅任何文档可检字段用法一览表。
(二)辅助性检索技术
1、加权检索和聚类检索(引文检索、相关检索、垮裤检索)
加权检索是指根据检索词对检索课题的重要程度,事先指定不同的权值。检
索时,系统先查找这些检索词在数据库记录中是否存在,并对存在的检索词计算
它们的权值总和;凡是在用户指定的临界值(称阈值)之上者作为命中记录被输
出。阈值可视命中记录的多寡灵活地进行调整,阈值越高,命中记录越少。
2、二次检索
3、题录标识检索
4、匹配检索
任意一致、完全一致 前方一致
5、利用检索工具
(三)数据库检索方法
1、检索词的确定
(1) 优先使用检索系统规范化词表中的专业词汇
(2) 选用通用的术语和词汇
(3) 分析课题的实质内容,找出隐含的主题
(4) 以课题核心概念为主,排除无关概念,归并重复概念
(5) 用上位或下位的概念词
2、编制合理的检索式
定义:是实现检索策略,达到预想检索结果的具体形式。
(1) 扩大或缩小检索文献量,排除不相关 文献。
(2) 多主题概念组配,检索式应以简为主。
3、选择检索系统和数据库
四、文献检索步骤
信息检索的步骤
图2-5 信息检索的具体步骤示意图
1、分析研究检索课题的要求 明确主题概念
任何检索课题都是在一定范围内依据已知条件查找未知信息的过程。每项检
索课题都有明确的目的和具体的要求,目的越明确,范围越具体,掌握的线索越
多,查获所需文献信息的可能性就越大。一般在进行课题检索之前从以下三个方
面分析入手:
(1)分析研究课题的主题内容,即研究课题的所属学科、性质、特点,涉及
多学科内容的检索课题,要找出其主要研究对象,确定检索课题所属学科、专业,从而准确把握检索课题核心内容的主题概念。
(2)确定研究课题所需的文献类型。由于现代科技文献的种类较多,并且
所报道的内容各有侧重,如属于基础理论性研究的,一般侧重查找期刊论文,会
议论文。如果是尖端科学技术,则应侧重于科技报告。如属于发明创造、技术革
新,应侧重于专利文献。如为产品定型设计,则需利用标准文献及产品样本。
(3)根据研究课题的背景信息确定出文献检索的时间范围。检索的时间范
围一般据研究课题的具体情况而定,如进行课题查新,需要检索近10年的文献;
若为了掌握动态或解决某个问题,则以满足具体需要为准,确定检索时间范围。
2、选择检索工具和数据库
选择检索工具要根据检索课题的学科、专业特点以及所需文献类型,充分考
虑检索工具报道文献的学科专业范围、文献类型、文种是否符合需要;了解所选
检索工具对文献揭示的深度、提供的检索途径、报道的时差等因素。注重利用权
威性的检索工具,同时注意将综合性与专业性和单一性的检索工具结合使用。并
优先选择机读型检索工具,以争取最佳的检索效率。
※数据库选择原则
(1)按照课题的检索要求和目的,选择收录文献种类、专业覆盖面、年代
跨度对口的数据库。
(2)当需要查找最新文献信息时,选择数据更新周期短的数据库。
(3)当需要获取原文时,选取原文获取较容易和数据库。
(4)要选好数据库,就要弄清所选数据库的标引特征、不同检索特点等。
3、确定检索途径和检索标识
在利用检索工具查找文献信息时,主要是利用检索工具的各种索引,每种索
引提供一种文献信息检索途径,一般来说每种检索工具都为用户提供几种检索途
径,归纳起来一般可以分为四种:分类途径、主题途径、作者途径、题名途径、号码等其他途径。
信息检索与信息存贮是互逆的过程,存贮在检索工具和系统中的数据,有
些著录项或标引字段是可以提供检索的,这些著录项或标引字段就是检索的入
口。
检索词是构成检索式的基本单元,是文献记录中的文献特征标识,可以是
反映文献内容特征的主题词、自由词,也可以是反映文献外表特征的作者、篇名
等。检索词的选择要满足匹配的要求,即形式的匹配和内容的匹配。
※检索标识的定义
检索标识,即检索词,是指能表达检索课题主题概念和信息需求的名词术
语、分类号、名称及代码等的总称。
检索标识是指通过对查新项目的主题分析将自然语言转换成规范化语言,即
确定检索入口的问题,包括分类号标识和主题词标识,这是影响检索质量全面准确
的一个很重要的因素。
检索标识的确定
※检索标识必须反映课题内容和信息需求。
※检索标识和数据库的标引标识应一致。
※所选检索工具或系统具有叙词表或主题词表的,优先选用叙词或主题词
作为检索词。
※要从词表规定的专业范围出发,选用各学科内具有检索价值的基本名词
或术语。
※如检索词为自由词,应选取其同义词、近义词、广义词、狭义词、分子
式、分类号、登记号、专利号、化学物质俗名、商品名等,使用多个词试检,或
通过逻辑“或”组配进行检索。
4、选择检索方法
文献信息检索方法可归纳为追溯法、常用法和综合法三种。在检索文献信息
时可根据检索课题的不同要求,选择不同的检索途径,以达到省时省力查全的效
果。
5、调整检索策略,筛选文献结果
检索策略是为了实现检索目标而制定的全盘计划和方案,是对整个检索过
程的谋划和指导。所以检索策略,,就是在分析信息需求实质的基础上,确定检
索途径与检索用词,并明确各词之间的逻辑关系与查找步骤的科学安排。
检索式是狭义上的检索策略,又称提问逻辑,就是对多个检索词之间的相
互关系和检索顺序作出的某种安排。是检索策略的具体表述,是通过逻辑算符、位置算符、截词算符等把表达主题要领的各检索单元组配连接起来的命令形式,它既能表达主题内容,又能被机器识别和执行,是决定检索策略质量和检索效果
的重要因素。
6、 查找文献线索 查找原始文献
上述步骤完成后,即可利用所选择的检索工具进行具体的检索。但在用分类
途径或主题途径检索时,可能会出现检索提问标识和文献存储标识不一致而查不
到合适的文献的情况,这时应反复修改检索提问标识,直至检索到适合的文献为
止。
当检索到研究课题的相关文献后,应仔细阅读文献著录条目的内容,判定
是否有参考价值,如符合检索需要,则要准确记录下文献的分类号、题名、著者、出处和入藏号等,以便索取原始文献,并用以积累资料。
查找原始文献,一般是由近而远,首先从本单位、本地区的文献资源着手,然后利用全国性的文献联合目录。
利用互联网进行文献的查找和获取目前已成为用户方便、快捷的远程获取
原始文献的一种发展趋势。
五、检索效果分析
(一) 检索效果的评价
检索效果是指检索结果的有效程度,反映了检索系统的检索性能和检索能
力。
1、文献检索的基本要求
第一,要“全”。文献查阅越全面,对自己的观点及论据的完整帮助越大。只
有广泛阅读视野放宽,才不至于偏听偏信。
第二,要“准”。现在学术界流行许多病症,诸多情况皆因为查阅文献失实或者
不善推敲,以致囫囵吞枣。其病概分三类:一是生吞活剥断章取义,二是曲解引申主
观臆测,三是相互转抄以讹传讹,这都是极不负责的态度,是学术研究的大敌。
第三要求“快”
第四,要勤于积累。要有意识地建立自己的资料库,平时注意做摘要、札记、
卡片等。
第五,要善于思考。文献资料也是良莠不齐的,里面也有假冒伪劣。因此要将
“死”书读“活”,就显得十分关键。只有善于思考才能在查阅文献时发现新问
题,才会有理论研究的敏感
(资料来源:裴娣娜《教育研究方法导论》,安徽教育出版社,1995年版 第三
条自己加)
2、评价检索效果常用的指标
检索效果是指检索结果的有效程度,反映了检索系统的检索性能和检索能
力。评价检索效果常用的指标有收录范围、查全率、查准率、响应时间和输出形
式等,其中,查全率和查准率是最重要的也是最常用的指标。
查全率是指检索出的相关文献与系统中的相关文献总量之比,又称“命中
率”。可表示为:
查全率R=检索出相关文献量÷系统中的相关文献总量×100%
查准率是指检索出的相关文献量与检索出的文献总量之比,又称“相关率”。
可表示为:
查准率P=检索出相关文献量÷检索出的文献总量×100%
查全率衡量系统检索出与课题相关信息的能力,查准率衡量系统拒绝非相
关信息的能力。两者结合起来,即表示信息系统的检索效率。检索者的最终目的
是要求达到查全率和查准率均为100%,这实际上是不可能的。 一系列试验结果
表明,查全率和查准率之间存在互逆关系,即二者同时提高是不可能的。也就是
说,对于任何一个信息系统,在其查全率与查准率之间都存在一个最佳的比例关
系,查全率一般在60%~70%,查准率一般在40%~50%,这是检索的最佳状态。见
图2-3。
查100
全80率
R60
40
20
0102030405060708090100查准率 P
图2-6 查全率与查准率关曲线图
(二)影响查全率和查准率的因素
1、客观因素:
(1) 系统内信息存储不全,收录遗漏严重;
(2) 索引词汇缺乏控制;
(3) 词表结构不够完善;
(4) 标引缺乏详尽性,没有网罗应有的内容;
(5) 信息分类(标引)专指度缺乏深度,不能精确地描述信息主题;
(6) 组配规则不严密,容易产生模棱两可或歧义现象。
2、主观因素:
(1) 检索课题要求不明确;
(2) 检索工具选择不恰当;
(3) 检索途径和方法过少;
(4) 检索词缺乏专指性,检索面宽于检索要求;
(5) 用词不当;
(6) 组配错误。
(三)提高检索效果的措施和方法
(1) 选择好的检索工具。
(2) 提高用户利用检索工具的能力,提高用户信息素质。准确使用检索
语言、利用各种辅助索引、扩检或缩检、优选检索词
(3) 制订优化的检索策略。
检索策略就是在分析课题内容的基础上,确定检索系统、检索途径和检索
词,并科学安排各词之间的位置关系、逻辑联系和查找步骤等。检索方案、合理
调整查全率和查准率
【】六、检索实例
【资料】检索表达式(提问式)的构造
检索表达式 也称检索式或检索提问式,是检索策略的具体表现,是用逻辑
运算符将检索词组配而成,它就直接影响检索结果。
检索式是检索策略的具体表述,是通过逻辑算符、位置算符、截词算符等
把表达主题要领的各检索单元组配连接起来的命令形式,它既能表达主题内容,又能被机器识别和执行,是决定检索策略质量和检索效果的重要因素。
※检索提问式,是指计算机信息检索中用来表达用户检索提问的逻辑表达
式,由检索词和各种布尔逻辑算符、位置算符以及系统规定的其它组配连接符号
组成。
◎◎检索表达式的制定要遵循以下几个步骤:
(6) 切分 是对课题包含的词进行最小的分割
(7) 删除 对过分宽泛或过分具体的词、无实际意义的边词、虚词应予以
删除。如“的” “及”
(8) 替换 对表达不清晰活容易造成检索误差的词加以替换。 如 “绿
色包装” 中的绿色应替换成“环保”
(9) 补充或增加 这一步是将课题筛选出的词进行同义词、近义词、相
关词的扩充,这些词加入检索款目可以避免漏检。
(10)组合 把检索词用逻辑符号链接组合成检索式。
聚类组合法:切分、删除、替换、补充、增加、组合。
例1:
壮族传统民居的研究
切分:壮族 传统 民居 的 研究
壮族 传统 民居 建筑 的 研究
补充 (删除)
壮族 传统 民居 建筑
例2:
大气中细菌浓度的计算方法
(替换)
大气污染的计算方法
例3:
高层建筑的优化设计
(切分)
高层 建筑 的 优化 设计
(删除)
高层 建筑 优化 设计
(替换)
高层 建筑 优化 结构设计 (词的集合)
(聚类)
高层 优化 结构设计 (组面的集合)
建筑
例4:
(补充)
煤田勘探
煤田勘探+煤田*地质勘探
(增加限义词)
勘探 勘探*煤田(逻辑“与”)
勘探 勘探-煤田(逻辑“非”)
例5:
(组合)
[a,b,c] 1 a,b,c
2 ab,ac,bc,ba,ca,cb
3 abc,acb,bac,bca,cab,cba
生物心理学
1 生物*心理*科学
2 生物学*心理+心理学*生物
3 生物心理学+心理生物学
例6※壮民族旅游文化资源的开发与综合利用
例7绿色设计在我国的发展及状况_____ _ The Green Design's develop
and condition in our country
课题重点、关键词、主题词等分析(中英文): 绿色设计(green design)、我
国(our country) 、发展(develop)、状况(condition)
检索式(例):1. 绿色设计and我国and发展or状况2 绿色设计and中国
and发展or状况3 中国and绿色设计and发展or状况4, 中国and绿色设计and
发展or状况
例8※※※※“有关造纸废水的处理技术”方面的检索式,首先抽起检索词:
造纸——paper making, paper pulp
废水——waster water
处理——treat, treatment
构造检索式:(paper w making or paper w pulp) and waster water and (treat or treatment)。
例8父母民主型教养方式对幼儿卫生行为习惯培养的影响
【】苏东坡历史故事
苏东坡 历史故事 中国 现代
【】网页设计与网站建设的思考与设计
网页设计 网页制作 网站设计 网站建设
【】投机家的证劵心理分析
股票 证劵投资 市场心理学
【】信息时代的企业人力资源管理
例9 检索实习报告范例三
利用计算机网络数据库检索。我院有多种计算机网络数据库,本范例中只给
出《清华同方全文数据库》和《维普全文数据库》检索样例。其他中文数据库可
以参照实习。
计算机数据库检索是利用字段检索实现信息检索,所以准确使用所需检索的
字段是检索的关键。同时计算机数据库检索都有普通检索与高级检索之分,本课
程检索实习要求使用高级检索(即布尔逻辑检索)或二次检索。
班级 学号 姓名 日期 题目:探讨港口物流中心的运作模式对现代物流的影响
1.课题分析:
以港口为中心,大力发展现代物流业已成为一种必然趋势。而港口发展现代物流业最重要的是建立现代化的港口物流中心。在我国,目前各大港口都已经朝着物流中心转化,上海,广州,天津,深圳,厦门等港口都在积极规划建设物流园或物流中心。我国港口物流中心发展不成熟,且物流中心的建设需要巨大的投入。因此,对我国港口发展物流中心的运作模式进行理论上的探讨,对指导港口物流中心的建设是有着现实意义的。即物流问题涉及港口建设与经营、管理。其次,物流学科是个跨学科的研究对象,除了涉及港口外还涉及对外贸易、铁路与公路的运输,物资的供应链与流通。但此课题不涉及一般物流概念,诸如:生产企业的物流、超市物流等。根据这些分析,我们可以看出课题涉及的主题(关键词)主要是港口、物流、物流中心、供应链等。因此,应该对这些关键词进行全面的布尔逻辑检索。另外,物流概念是近几年提出,为了检索到较新的信息,检索时限定检索时限为2001年至今。
2.选择数据库:
《清华同方全文数据库》和《维普全文数据库》
3.检索途径:
根据以上分析选用主题词检索字段检索,且用港口与物流两词进行布尔逻辑检索。即采用高级检索,也可以采用简单检索后进行二次检索方法,以达到同样效果。
高级检索:关键词:港口*物流
一般检索:关键词:港口;在第一次检索后使用二次检索,关键词为:物流(二次检索相当与布尔逻辑检索中的与检索)
4.检索内容:
(1)《清华同方》
※ 【篇名】 当代国际航运中心发展的新趋势——兼析上海国际航运中心的规划建设 CAJ原文下载
【关键词】 国际航运中心;;集装箱转运;;港口区域组合;;物流中心;;上海市
※※【篇名】 天津港集装箱物流中心战略构想 CAJ原文下载
【关键词】 天津港;;集装箱物流中心;;战略规划;;目标模式;;建设构架;;功能设计;;对策建议
(2)《维普》
第一条
【题 名】 全球物流发展趋势与港口功能转变——深圳案例经验分析
【关键词】 深圳市 案例 港口发展 全球物流 发展趋势 港口功能
第二条
【题 名】 港口物流信息系统评价原则及方法
【关键词】 港口 物流信息系统 诊断 评价
检索内容已有格式说明,故不进行格式说明。(以上内容直接从计算机上检索并下载)
※例10 检索实习报告范例四
课题: 计算机辅助设计在建筑设计中的应用
1.课题分析:
当前世界各国在建筑设计广泛采用先进技术,以增强建筑设计上的竞争能力和提高建筑的技术含量。过去在建筑的设计上主要靠人工完成,随着计算机技术的开发,特别是计算机辅助设计技术的产生和应用,使建筑设计有了很大的技术保障,但我国计算机辅助设计在建筑设计中的应用相对落后。对此,检索有关信息,以利用有关国家在这方面的情报。根据分析,确定的主题词为建筑设计 , 计算机辅助设计。
2、检索途径:
在Ei数据库中有两个可以检索的库,本次检索使用2000—2003的数据库。同时依据以上分析,采用建筑设计, 计算机辅助设计这两个词的“与”检索。“计建筑设计*计算机辅助设计”
其检索式(检索表达式或叫检索提问式)是:“计建筑设计*计算机辅助设计”
3.检索内容:
例10 (二)[实习(实验)二]
检索工具与参考工具使用方法
《全国报刊索引》使用方法(其他检索工具与参考工具使用方法一样)
《全国报刊索引》目前有2种检索途径,分别是分类途径和著者途径。下面举例说明其使用方法。
1.分类途径
[检索工具] 《全国报刊索引》(自然科学技术版)
[检索课题] GPS车辆定位系统研究(1995-2008年)
[检索程序]
第一步:分析研究课题,选择查找分册。根据课题含意,应选《全国报刊索引》(自然科学技术版)。
第二步:确定类目。对照《全国报刊索引》(自然科学技术版)类目表,确定该课题的类目为“P22 大地测量学”。
第三步:根据确定的类目名称逐本查找,直到满足检索要求为止(1995-2008年)。例如在2003年 11期上查得:
031101554 GPS车辆定位监控系统的应用/李星蓉(华北电力大学,071003)//电力系统通信(南京).-2003,24(6).-34-37
第四步:索取原始文献:(1)用上步获得的期刊刊名《电力系统通信》查《中文期刊馆藏目录》,获得馆藏单位;(2)去人或去函借阅或复制。
2.著者途径
[检索工具] 《全国报刊索引》(哲学社会科学版)
[检索课题]查找经济学家吴晓求2003年发表的论文
[检索程序]
第一步:分析研究课题,选择查找分册。经济学家吴晓求发表的论文一般属于经济学范畴,因此应选择《全国报刊索引》(哲学社会科学版)。
第二步:用著者姓名按姓氏汉语拼音字顺在每期《全国报刊索引》(哲学社会科学版)后面的“著者索引”中查找,获得文献顺序号。例如在2003年6期和9期上分别查得:
吴晓求 030609834 (6期)
吴晓求 030907098 (9期)
第三步:用所获文献顺序号(俗称文摘号)查同期题录本,获得文献篇名与文献出处等。第6期上为:
030609834 资本结构和公司治理/吴晓求(中国人民大学金融与证券研究所)//资本市场.-2003,(4).-23-28
第9期为:
030907098 激励机制与资本结构:理论与中国实证/吴晓求(中国人民大学金融与证券研究所)//管理世界.-2003,(6).-5-14
第四步:索取原始文献:步骤同分类途径,
※附录资料 《文献信息检索与利用》检索课题选
以下所列检索课题供学生在完成检索练习时参考,学生尽量依据所学专业选择检索课题,但课题名称可以根据学生意愿进行适当改动。检索时根据课题检索情报、信息,检索到的内容须与课题相关,否则实习成绩不能通过。
1、中东局势对中国旅游的影响
2、关于旅游发展的回顾和设想
3、论中美贸易争端
4、大型构件起重吊架在港口工程中的应用
5、信息产业经济化发展
6、亚洲各国经济发展前景分析
7、城市高层建筑的设计建造
8、世界局势对国内经济发展的影响
9、旅游经济理论与方法
10、 如何发展中国海上旅游业
11、 中国导游人员的培训与教育问题
12、 网络信息的组织与管理
13、 数据库的维护技术
14、 如何利用互联网研究信息传播与利用
15、 建筑企业的投入产出分析
16、 大学生心理问题
17、 电子商务在线购物的创业研究
18、 壮民族旅游文化资源的开发与综合利用
19、 旅游安全及其法规问题探讨
20、 提高建筑企业竞争能力的根本途径分析
21、 现代企业制度中的财务审计
22、 可持续发展的交通运输战略
23、 我国旅游政策与法规的构建
24、 房地产开发中融资市场化问题
25、 信息技术对旅行社业务的影响及应用
26、 城市给水系统优化策略
27、 可拓学在建筑设计领域中的应用
28、 生态建筑学在城市建筑中的应用
29、 建筑与风水的关系
30、 结构用复合材料应用技术现状
31、 建筑结构隔震技术综述
32、 国外(美国等国家的)工程管理及其现状和未来趋势
33、 建设过程之间的界面管理
34、 工程项目全寿命管理信息系统的需求分析
范文三:检索表达式语法
专业检索表达式语法
专业检索用于图书情报专业人员查新、信息分析等工作,使用逻辑运算符和关键词构造检索式进行检索。
如何构造专业检索式: 1. 选择检索项。
跨库专业检索支持对以下检索项的检索:SU=主题(包括题名、关键词、摘要的字段),TI=题名,KY=关键词,AB=摘要,FT=全文,AU=作者,FI=第一责任人,AF=机构,JN=中文刊名&英文刊名, RF=引文,YE=年,FU=基金,CLC=中图分类号,SN=ISSN,CN=统一刊号,IB=ISBN ,CF=被引频次 2. 使用运算符构造表达式。
可使用运算符说明如下:
3. 使用“AND”、“OR”、“NOT”等逻辑运算符,“()”符号将表达式按照检索目标组合起来。
注意事项:
? ?
所有符号和英文字母,都必须使用英文半角字符;
“AND”、“OR”、“NOT”三种逻辑运算符的优先级相同;如要改变组合的顺序,请使用英文半角圆括号“()”将条件括起;
? ?
逻辑关系符号 (与(AND)、或(OR)非(NOT)前后要空一个字节;
使用“同句”、“同段”、“词频”时,需用一组西文单引号将多个检索词及其运算符括起, 如:'流体 # 力学'; 例1
要求检索钱伟长在清华大学或上海大学时发表的文章。检索式:AU =钱伟长 and (AF =清华大学 or AF =上海大学) 例2
要求检索钱伟长在清华大学期间发表的题名或摘要中都包含“物理”的文章。检索式:AU =钱伟长 and AF=清华大学 and (TI =物理 or AB = 物理)
TI=国民经济信息化与“CHINA” and AU=钟义信
或者TI=国民经济信息化 and AU=钟义信
曹燕检索报告
2010年3月24日11时25分
一、本次检索输入的条件: 检索控制条件: 学科范围: 不限 数据库: 中国图书全文数据库,中国重要报纸全文数据库,中国博士学位论文全
文数据库,中国学术期刊网络出版总库,中国优秀硕士学位论文全文数据库,中国重要会议论文全文数据库,中国年鉴网络出版总库,中国专利数据库,中国标准数据库,国家科技成果数据库,国外标准数据库,德国SPRINGER公司期刊数据库,TAYLOR期刊数据库
发表时间: 不限 文献来源: 不限 支持基金: 不限
作者: 钟义信 作者单位: 不限 检索内容条件:
题名=国民经济信息化 and 作者=钟义信
二、检索结果统计报表:
?
1.只对前10万条记录进行统计。为了获得更好的检索报告,您需要重新
提
示: 构建检索表达式,使检索结果更少,更准确,方便下一步的文献筛选。
2.检索结果只列出记录最多的8个学科,您可以通过在检索条件中选择相应的学科范围,使检索结果集中在一定的学科领域中,方便下一步的文献筛选。
范文四:检索表达式构建
【资料】检索表达式(提问式)的构造
注:本来这次实习报告是要测试同学们目前的文献检索水平的,相当于做一
次调查,再分析存在的问题,有针对性进行教学,提高同学们的检索技能。但
有同学提出一些问题后,老师觉得有必要这个资料个你们,希望对你们提高检
索能力有帮助。如对其中的一些问题不理解,也不要焦急,我们这部分没学得,下个专题就要学到了。顺便发下一专题学习的教案给你们,可以提前了解。
检索表达式 也称检索式或检索提问式,是检索策略的具体表现,是用逻辑
运算符将检索词组配而成,它就直接影响检索结果。
检索式是检索策略的具体表述,是通过逻辑算符、位置算符、截词算符等把
表达主题要领的各检索单元组配连接起来的命令形式,它既能表达主题内容,又
能被机器识别和执行,是决定检索策略质量和检索效果的重要因素。
※检索提问式,是指计算机信息检索中用来表达用户检索提问的逻辑表达
式,由检索词和各种布尔逻辑算符、位置算符以及系统规定的其它组配连接符号
组成。
◎◎检索表达式的制定要遵循以下几个步骤:
(1) 切分 是对课题包含的词进行最小的分割
(2) 删除 对过分宽泛或过分具体的词、无实际意义的边词、虚词应予以
删除。如“的” “及”
(3) 替换 对表达不清晰活容易造成检索误差的词加以替换。 如 “绿
色包装” 中的绿色应替换成“环保”
(4) 补充或增加 这一步是将课题筛选出的词进行同义词、近义词、相
关词的扩充,这些词加入检索款目可以避免漏检。
(5) 组合 把检索词用逻辑符号链接组合成检索式。
聚类组合法:切分、删除、替换、补充、增加、组合。
例1:
壮族传统民居的研究
切分:壮族 传统 民居 的 研究
壮族 传统 民居 建筑 的 研究
补充 (删除)
壮族 传统 民居 建筑
例2:
大气中细菌浓度的计算方法
(替换)
大气污染的计算方法
例3:
高层建筑的优化设计
(切分)
高层 建筑 的 优化 设计
(删除)
高层 建筑 优化 设计
(替换)
高层 建筑 优化 结构设计 (词的集合)
(聚类)
高层 优化 结构设计 (组面的集合)
建筑
例4:
(补充)
煤田勘探
煤田勘探+煤田*地质勘探
(增加限义词)
勘探 勘探*煤田(逻辑“与”)
勘探 勘探-煤田(逻辑“非”)
例5:
(组合)
[a,b,c] 1 a,b,c
2 ab,ac,bc,ba,ca,cb
3 abc,acb,bac,bca,cab,cba
生物心理学
1 生物*心理*科学
2 生物学*心理+心理学*生物
3 生物心理学+心理生物学
例6※壮民族旅游文化资源的开发与综合利用
例7绿色设计在我国的发展及状况_____ _ The Green Design's develop
and condition in our country
课题重点、关键词、主题词等分析(中英文): 绿色设计(green design)、我
国(our country) 、发展(develop)、状况(condition)
检索式(例):1. 绿色设计and我国and发展or状况2 绿色设计and中国
and发展or状况3 中国and绿色设计and发展or状况4, 中国and绿色设计and
发展or状况
例8※※※※“有关造纸废水的处理技术”方面的检索式,首先抽起检索词:
造纸——paper making, paper pulp
废水——waster water
处理——treat, treatment
构造检索式:(paper w making or paper w pulp) and waster water and (treat or treatment)。
例9父母民主型教养方式对幼儿卫生行为习惯培养的影响
【】苏东坡历史故事
苏东坡 历史故事 中国 现代
【】网页设计与网站建设的思考与设计
网页设计 网页制作 网站设计 网站建设
【】投机家的证劵心理分析
股票 证劵投资 市场心理学
【】信息时代的企业人力资源管理
例9 检索实习报告范例三
利用计算机网络数据库检索。我院有多种计算机网络数据库,本范例中只给
出《清华同方全文数据库》和《维普全文数据库》检索样例。其他中文数据库可
以参照实习。
计算机数据库检索是利用字段检索实现信息检索,所以准确使用所需检索的
字段是检索的关键。同时计算机数据库检索都有普通检索与高级检索之分,本课
程检索实习要求使用高级检索(即布尔逻辑检索)或二次检索。
班级 学号 姓名 日期 题目:探讨港口物流中心的运作模式对现代物流的影响
1.课题分析:
以港口为中心,大力发展现代物流业已成为一种必然趋势。而港口发展现代
物流业最重要的是建立现代化的港口物流中心。在我国,目前各大港口都已经朝
着物流中心转化,上海,广州,天津,深圳,厦门等港口都在积极规划建设物流
园或物流中心。我国港口物流中心发展不成熟,且物流中心的建设需要巨大的投
入。因此,对我国港口发展物流中心的运作模式进行理论上的探讨,对指导港口
物流中心的建设是有着现实意义的。即物流问题涉及港口建设与经营、管理。其
次,物流学科是个跨学科的研究对象,除了涉及港口外还涉及对外贸易、铁路与
公路的运输,物资的供应链与流通。但此课题不涉及一般物流概念,诸如:生产
企业的物流、超市物流等。根据这些分析,我们可以看出课题涉及的主题(关键
词)主要是港口、物流、物流中心、供应链等。因此,应该对这些关键词进行全
面的布尔逻辑检索。另外,物流概念是近几年提出,为了检索到较新的信息,检
索时限定检索时限为2001年至今。
2.选择数据库:
《清华同方全文数据库》和《维普全文数据库》
3.检索途径:
根据以上分析选用主题词检索字段检索,且用港口与物流两词进行布尔逻辑检索。即采用高级检索,也可以采用简单检索后进行二次检索方法,以达到同样效果。
高级检索:关键词:港口*物流
一般检索:关键词:港口;在第一次检索后使用二次检索,关键词为:物流(二次检索相当与布尔逻辑检索中的与检索)
4.检索内容:
(1)《清华同方》
※ 【篇名】 当代国际航运中心发展的新趋势——兼析上海国际航运中心的规划建设 CAJ原文下载
【关键词】 国际航运中心;;集装箱转运;;港口区域组合;;物流中心;;上海市
※※【篇名】 天津港集装箱物流中心战略构想 CAJ原文下载
【关键词】 天津港;;集装箱物流中心;;战略规划;;目标模式;;建设构架;;功能设计;;对策建议
(2)《维普》
第一条
【题 名】 全球物流发展趋势与港口功能转变——深圳案例经验分析
【关键词】 深圳市 案例 港口发展 全球物流 发展趋势 港口功能
第二条
【题 名】 港口物流信息系统评价原则及方法
【关键词】 港口 物流信息系统 诊断 评价
检索内容已有格式说明,故不进行格式说明。(以上内容直接从计算机上检索并下载)
※例10 检索实习报告范例四
课题: 计算机辅助设计在建筑设计中的应用
1.课题分析:
当前世界各国在建筑设计广泛采用先进技术,以增强建筑设计上的竞争能力和提高建筑的技术含量。过去在建筑的设计上主要靠人工完成,随着计算机
技术的开发,特别是计算机辅助设计技术的产生和应用,使建筑设计有了很大的技术保障,但我国计算机辅助设计在建筑设计中的应用相对落后。对此,检索有关信息,以利用有关国家在这方面的情报。根据分析,确定的主题词为建筑设计 , 计算机辅助设计。
2、检索途径:
在Ei数据库中有两个可以检索的库,本次检索使用2000—2003的数据库。同时依据以上分析,采用建筑设计, 计算机辅助设计这两个词的“与”检索。“计建筑设计*计算机辅助设计”
其检索式(检索表达式或叫检索提问式)是:“计建筑设计*计算机辅助设计”
3.检索内容:
例10 (二)[实习(实验)二]
检索工具与参考工具使用方法
《全国报刊索引》使用方法(其他检索工具与参考工具使用方法一样)
《全国报刊索引》目前有2种检索途径,分别是分类途径和著者途径。下面举例说明其使用方法。
1.分类途径
[检索工具] 《全国报刊索引》(自然科学技术版)
[检索课题] GPS车辆定位系统研究(1995-2008年)
[检索程序]
第一步:分析研究课题,选择查找分册。根据课题含意,应选《全国报刊索引》(自然科学技术版)。
第二步:确定类目。对照《全国报刊索引》(自然科学技术版)类目表,确定该课题的类目为“P22 大地测量学”。
第三步:根据确定的类目名称逐本查找,直到满足检索要求为止(1995-2008年)。例如在2003年 11期上查得:
031101554 GPS车辆定位监控系统的应用/李星蓉(华北电力大学,071003)//电力系统通信(南京).-2003,24(6).-34-37
第四步:索取原始文献:(1)用上步获得的期刊刊名《电力系统通信》查《中
文期刊馆藏目录》,获得馆藏单位;(2)去人或去函借阅或复制。
2.著者途径
[检索工具] 《全国报刊索引》(哲学社会科学版)
[检索课题]查找经济学家吴晓求2003年发表的论文
[检索程序]
第一步:分析研究课题,选择查找分册。经济学家吴晓求发表的论文一般属于经济学范畴,因此应选择《全国报刊索引》(哲学社会科学版)。
第二步:用著者姓名按姓氏汉语拼音字顺在每期《全国报刊索引》(哲学社会科学版)后面的“著者索引”中查找,获得文献顺序号。例如在2003年6期和9期上分别查得:
吴晓求 030609834 (6期)
吴晓求 030907098 (9期)
第三步:用所获文献顺序号(俗称文摘号)查同期题录本,获得文献篇名与文献出处等。第6期上为:
030609834 资本结构和公司治理/吴晓求(中国人民大学金融与证券研究所)//资本市场.-2003,(4).-23-28
第9期为:
030907098 激励机制与资本结构:理论与中国实证/吴晓求(中国人民大学金融与证券研究所)//管理世界.-2003,(6).-5-14
第四步:索取原始文献:步骤同分类途径,
第四讲 文献检索原理、方法和技术
一、文献检索原理
检索含义:从信息集合中迅速、准确地查找出所需信息的过程和方法。
1、定 义
文献信息检索是人们利用特定的检索技巧与方法,从信息集合中对目标资源进行快速定位,获取与信息需求相关的那部分信息的过程。
从文献信息处理的角度来说:文献信息检索包括信息存储与检索两个过程; 从读者检索的角度来说:文献信息检索仅指从信息集合中找出信息的过程,相当于人们通常所说的信息查询。
信息集合是指有组织的信息资源整体,可以是:馆藏目录、数据库、(印本)检索工具等。
※文献信息存储过程:将大量分散的文献信息搜集起来,根据其内容特征或外表特征进行标引,形成表征这些文献信息的特征标识,并存储在一定的载体上,成为有查询功能的检索工具。
标引:对文献内容特征和外部特征进行分析形成概念标识,再依据一定的标准或规则(检索语言:如分类号、主题词、关键词及著者选用规则等)将其用相应的标识充分、准确地表达出来。
※文献信息检索过程:用户根据自己的信息需求,提出检索提问,然后使用有关的标引语言(也称检索语言)将拟定的检索提问规范成检索标识,用于检索的过程。
二、文献检索方法
在浩如烟海的文献中要查阅到自己所需要的资料,不仅需要遵循准、全、深、快的文献检索原则,更需要灵活掌握和运用文献检索的基本方法。常用的文献检索方法有:
(一)基本方法
1、文献信息检索的常用方法
(1)顺查法
根据检索课题的起始年代,利用检索工具,按照从旧到新、由远及近、由过去到现在的顺时序,逐年查找文献信息的方法。
查全率高。适用于围绕某一主题普查一定时期内的全部文献信息,或者说适用于那些主题较复杂,研究范围较大,研究时间较久的科研课题。
可用于事实检索,更多地用于文献检索。
(2)倒查法
根据检索课题的起始年代,利用检索工具,按照从新到旧、由近及远、由现在到过去的逆时序逐年前推查找文献信息的方法。
查得的信息新颖性强,查全率不高。多用于新课题、新观点、新理论、新技术的检索。检索的重点在近期信息上。
(如:检索“藏青会”的相关信息)
(3)抽查法
利用检索工具,针对某一学科的发展重点、文献信息量较大的阶段,选定一定时间范围进行逐年检索的方法。
必须熟悉学科的发展特点,把握学科发展的高峰期和低谷期。
(如:检索“克隆羊多莉”的相关信息)
2、回溯法
也称引文法,是一种跟踪查找的方法,即以文献后面所附的参考文献和引文索引为线索,逐一追溯查找文献的方法。
适用于检索课题的背景和立论依据等方面的文献。
(如:《科学引文索引》(SCI)、《中国科学引文索引》(CSSCI)。)
3、循环法
是常用法和追溯法交替使用的方法,又称循环法或交替法,既利用检索工具,也利用文献后所附参考文献进行追溯,两种方法交替,分期分段使用,对获得一定年限内相当文献的资料线索,节省检索时间。
4、 浏览法 (积累法)
浏览法,是指研究人员平时对与本专业或本学科相关的原始文献资料进行浏览、阅读和积累的一种方法。 常规法虽然可以在短时间内获得大量切合课题需要的文献,但是,出于任何一种检索工具都只能收录有限的期刊和图书,而且检索工具与原始文献之间一般有6个月左右的时间差,为了弥补这些缺陷,就需要研究人员及时阅读最新生产的原始文献,不断积累相关资料,跟踪学科发展的前沿。浏览法的优点是:能最快地获取信息;能直接阅读原文内容;基本上能获取本学科发展的动态和水平;缺点是科技人员必须事先知道本学科的核心期刊,检索的范畴不够宽,因而漏检率较大。有局限性,不全面,不系统,不能作为查阅文献的主要方法。
四种方法可根据不同情况进行选择,检索中为省时,要充分利用累积索引。
※选择检索方法的原则
1、 如果检索工具不全和根本没有,检索课题涉及面不大。对查全率要求不高,可采用追溯法,用综述和评述最好
2、如工具完备,课题涉及范围大,采用常用法或综合法
3、如课题属于新兴学科或知识更新快的学科可用倒查法
4、如对查全率要求高,如开展查新,一般采用顺查法
5、如一掌握了课题发展规律、特点,一般采用抽查法
(二)数据库和网络资源的检索方法
1、浏览方法
数据库类型浏览,按题录、文摘、全文浏览,按主题目录、导航、学科分类浏览。
2、检索方法
(1) 快速检索
单检索:一般仅提供一个检索框输入检索式,并使用少数常用的检索字段。适合初级用户和构建比较简单的检索式
(2) 专业检索
利用分类导航,按专业类目等级进行检索,是常用的检索方法
(3) 期刊导航检索
按年卷期浏览,期刊漫游
(4) 分类检索
按中图法做学科范围组合,灵活限制检索范围。
(5) 相关主题检索
(6) 高级检索
高级检索或专家检索:适合熟悉检索指令并有检索经验的熟练用户使用。一般需要使用命令行式检索,通常需要使用字段标识符和布尔逻辑算符组配进行检索
(7) 全文检索 按资料的内容检索,而不是按结构化特征来检索
三、计算机检索技术
在计算机信息检索过程中,为了提高检索效率,计算机检索系统常采用一些运算方法,从概念相关性、位置相关性等方面对检索提问实行技术处理。下面介绍几种常用的信息检索技术方法。
(一) 主要检索技术
【资料】基本运算符
※优先算符 括号():如同数学运算符决定检索组配的先后次序。 ※短语符 双引号:引号内的语句会被当成一个词进行检索。 “-”(连接符)“\” (斜杠) “_”(下划线) “,” (逗号) “.”(点) 在不同的搜索引擎中也可作为短语连接符。
※加号(+) 要求结果中必须包含某个特定的检索词,可在它前面加一个“+” 如“+数字图书馆”
※减号 (-)要排除含有某个特定检索词的网络信息,可以在它前面加一个“-” 如关于查office 2003的资料,但又不想要office 2000和 office 98
的信息,检索提问式可以是“office 2003-office 2000-office 98”
※通配符“*”在进行简单检索时,可以在单词末尾加通配符来代替任意字母的组合(最多可代替5个小写字母) 但不能用单词的中间或开头。
1、布尔逻辑检索
所谓布尔逻辑检索(Boolean Logical)是用布尔逻辑算符将检索词、短语或代码进行逻辑组配,指定文献的命中条件和组配次序,凡符合逻辑组配所规定条件的为命中文献,否则为非命中文献。它是机检系统中最常用的一种检索方法。逻辑算符主要有:And/与、Or/或、Not/非,分述如下:
(1)逻辑“与”
运算符为 And 或 * 。检索词A和检索词B用“与”组配,检索式为:A And B或者 A * B, 它表示检出同时含有A、B两个检索词的记录。逻辑与检索能增强检索的专指性,使检索范围缩小,此算符适于连接有限定关系或交叉关系的词。
(2)逻辑“或”
运算符为 Or 或 + 。检索词A和检索词B用“或”组配,检索式为:A Or B或者 A+B 它表示检出所有含有A词或者B词的记录。逻辑或检索扩大了检索范围,此算符适于连接有同义关系或相关关系的词。
(3)逻辑“非”
运算符为 Not 或 - 。检索词A和检索词B用“非”组配,检索式为:A Not B或者 A - B 它表示检出含有A词,但同时不含B词的记录。逻辑非和逻辑与运算的作用类似,可以缩小检索范围,增强检索的准确性。此运算适于排除那些含有某个指定检索词的记录。但如果使用不当,将会排除有用文献,从而导致漏检。
布尔检索式优先执行顺序通常是Not→And→Or,在有括号的情况下,先执行括号内的逻辑运算,在多层括号时,先执行最内层括号中的运算。布尔检索比较容易掌握,但使用不当会造成大量漏检和误检,特别是非运算符的运用应特别小心,否则会把有用的文献排除了。
2、截词检索(截词符*和?)
截词检索(Truncation)
是指用给定的词干做检索词,查找含有该词干的全部
检索词的记录。
因此,也称词干检索或字符屏蔽检索。就是将通配符如“*”、“?”或“$”
等,放在检索词中检索者认为合适的地方截断,用截断的词的一个局部进行检
索,并认为凡满足这个词局部中的所有字符(串)的文献,都为命中文献。
这样,检索者不必输入完整的检索词。它可以起到扩大检索范围,提高查全
率,减少检索词的输入量,节省检索时间,降低检索费用等作用。检索时,若遇
到名词的单复数形式,词的不同拼写法,词的前缀或后缀变化时,均可采用此方
法。在实际检索中,常遇到词干相同、词义相近的检索词,或同一词的单、复数
形式,动、名词形式,英美拼法等。
截词的方式有多种,按截断部位可分为后方截词、前方截词、中间截词等;
按截断长度(字符数量) 可以分为有限截词和无限截词。
(1)后方截词
截去某个词的尾部,是词的前方一致比较,也称前方一致检索。例如:输入
geolog?(?为截断符号),将会把含有geological、geologic、geologist、geologize、
geology等词的记录检索出来。若输入PY=199?,会把90年代的记录全部查出来。
(2)前方截词
截去某个词的前部,是词的后方一致比较,也称后方一致检索。例如:输
入?magnetic 能够检出含有magnetic、electromagnetic、paramagnetic、
thermo-magnetic等词的记录。
(3)中间截词
截去某个词的中间部分,是词的两边一致比较,也称两边一致检索。例如:
输入organi?ation可以检出organization、organisation;输入f??t可查出foot、feet。
(4)有限截词
是指允许截去有限个字符。例如“acid? ?”表示截去一个字符,它可检出acid、
acids,但不能检出acidic、acidicity、acidity等词。又如comput??? ?可检出compute、computer、computers、computing等词,不能检出computable、computation、
computerize等词。注意:词干后面连续的数个问号是截断符,表示允许截去字
符的个数,最后一个问号是终止符,它与截断符之间要有一个空格,输入时一定
要注意。
(5)无限截词
无限截断是指允许截去的字符数量不限,也称开放式截断。上面右截断、左
截断所举的例子均属此类型。
在实际检索时,我们还需要注意这样几个方面:一是任何一种截词检索,
都隐含着布尔逻辑检索的“或”运算。采用截词检索时,既要灵活、又要谨慎,截词的部位要适当,如果截得太短(输入的字符不得少于3个),将增加检索噪声,影响查准率。另外,就是不同的机检系统使用的截词符不同、各数据库所支持的
截断类型也不同,
◎截词检索主要是利用检索词的词干或不完整的词形进行检索。
截词符一般用“?”、“ *”、“$”表示($是引用单元格函数)
※后方截词:用于前方一致的派生词检索。
如:信息?
则表示在数据库中含有信息、信息技术、信息检索等方面的文献记录均为
命中文献。
※前方截词:用于后方一致的派生词检索。
如:?经济
则数据库中含有经济、工业经济、农业经济等方面的文献均为命中文献。 *: 至少键入一个词的前3个字符,
××3、位置运算符检索(常用语外文数据库) 不讲
当检索的概念要用词组表达,或者要求两个词在记录中位置相邻/相连时,
可使用位置算符。位置检索(Proximate)是在检索词之间使用位置算符(也称邻近
算符Adjacent Operators),来规定算符两边的检索词出现在记录中的位置,从而
获得不仅包含有指定检索词而且这些词在记录中的位置也符合特定要求的记录。这种方法能够提高检准率。
机检系统中常用的位置算符(按限制强度递增顺序排列)如下:
(1)(w)算符With或()和 (Nw)
(w)要求检索词必须按指定顺序紧密相连,词序不可变,词之间除允许有空格、
标点、连字符外,不得夹单词或字母;(Nw)表示连接的两个词之间最多可夹入N
个词(N为自然数),词序不得颠倒。例如 input(w)output可检出input output而
wear(1w)materials可检出wear materials、wear of materials e
(2)(n)算符near和(nN)
(n)要求被连接的检索词必须紧密相连,词之间除允许有空格、标点、连
字符外,不得夹单词或字母,词序不限;(Nn)表示两个检索词之间最多可以夹N
个词(N为自然数1、2、3?),且词序任意。例如 information(n)retrieval 可以检
出 information retrieval 和 retrieval information,
(3)(f)算符Field
要求被连接的检索词出现在同一字段中,字段类型和词序均不限。例如
happiness(f)sadness and crying 又如 pollution(f)control/ti,ab
(4)(s)算符Sub-field/Sentence
要求被连接的检索词出现在同一句子(同一子字段)中,词序不限。例如
machine(s)plant
但需要需要说明的是,不同的机检系统,位置检索的功能及算符不同,应
参看各系统的说明。
对于全文型数据库,特别是进行全文字段检索时,使用位置算符往往更理想
4、限制检索
特定年代、特定类型(filetype)、特定检索点等做限制。
限制检索(Range)是通过限制检索范围,达到优化检索结果的方法。限制检
索的方式有多种,例如进行字段检索、使用限制符、采用限制检索命令等。
1、基本字段限制检索
字段检索是把检索词限定在某个字段中,如果记录的相应字段中含有输入的
检索词则为命中记录,否则检不中。
题名(TI) 关键词ID或k 主题词DE 分类号CC
全文(FT,Full text) 作者AU
期刊名JN 出版机构py 语种LA 文件类型 DT
例如:查找wang wei写的文章,可以输入检索式:au=wang wei
2、使用限制符
使用限制符就是用表示语种、文献类型、出版国家、出版年代等的字段标识
符来限制检索范围
尽管网上信息检索不分字段,但大多数网络工具—搜索引擎都具有类似于字
段限定检索功能,依此功能,可以将检索范围限定在特定的范围中。
文献类型的限定 检索词 filetype:ppt(doc pdf xls swf)
范例 保护生物学 filetype:ppt
关键词出现的位置限定 如: intitle 检索词 (按网页标题搜索)
范例 保护生物学 intitle:研究所
把搜索范围限定在某个站点中,提高查询效率。{按网域(站)搜索}
范例 姚明 site:sina.com.cn
把搜索范围限定在url链接中——inurl (按URL搜索)
【检索算符】inurl
基本查询语法:inurl:资源类型+关键词
如:输入[inurl:MP3刘欢]表示搜索可能有刘欢的mp3音乐网站。
网页url中的某些信息,常常有某种有价值的含义。因此对搜索结果的url
做某种限定,就可以获得良好的效果,可提供非常精准的专题资料。
范例 photoshop inurl:jiqiao
3、使用限制指令
限制指令可以分为:一般限制指令(Limit,它对事先生成的检索集合进行限
制)、全限制指令(Limit all,它是在输入检索式之前向系统发出的,它把检索的
全过程限制在某些指定的字段内)。
例如:Limit S5/328000-560000 表示把先前生成的第5个检索集合限定在
指定的文摘号内。又如:Limit all/de,ti 表示将后续检索限定在叙词和题名字段。 上述几种限制检索方法既可独立使用,也可以混合使用。
使用辅助索引字段时要用前缀标识符,即在限制检索符后加等号“=”,再
加检索词(如上例中的LA=)。应当注意,各数据库的前后缀代码的数量和形式
有所不同,在检索某一数据库,需参考有关说明材料。DIALOG系统蓝页中的检
索选择项(Search Option)提供了可检字段说明;利用联机HELP功能,输入指
令“? FIELDn”(n为数据库文档号)可以查阅任何文档可检字段用法一览表。
(二)辅助性检索技术
1、加权检索和聚类检索(引文检索、相关检索、垮裤检索)
加权检索是指根据检索词对检索课题的重要程度,事先指定不同的权值。检
索时,系统先查找这些检索词在数据库记录中是否存在,并对存在的检索词计算
它们的权值总和;凡是在用户指定的临界值(称阈值)之上者作为命中记录被输
出。阈值可视命中记录的多寡灵活地进行调整,阈值越高,命中记录越少。
2、二次检索
3、题录标识检索
4、匹配检索
任意一致、完全一致 前方一致
5、利用检索工具
(三)数据库检索方法
1、检索词的确定
(1) 优先使用检索系统规范化词表中的专业词汇
(2) 选用通用的术语和词汇
(3) 分析课题的实质内容,找出隐含的主题
(4) 以课题核心概念为主,排除无关概念,归并重复概念
(5) 用上位或下位的概念词
2、编制合理的检索式
定义:是实现检索策略,达到预想检索结果的具体形式。
(1) 扩大或缩小检索文献量,排除不相关 文献。
(2) 多主题概念组配,检索式应以简为主。
3、选择检索系统和数据库
四、文献检索步骤
信息检索的步骤
图2-5 信息检索的具体步骤示意图
1、分析研究检索课题的要求 明确主题概念
任何检索课题都是在一定范围内依据已知条件查找未知信息的过程。每项检
索课题都有明确的目的和具体的要求,目的越明确,范围越具体,掌握的线索越
多,查获所需文献信息的可能性就越大。一般在进行课题检索之前从以下三个方
面分析入手:
(1)分析研究课题的主题内容,即研究课题的所属学科、性质、特点,涉及
多学科内容的检索课题,要找出其主要研究对象,确定检索课题所属学科、专业,从而准确把握检索课题核心内容的主题概念。
(2)确定研究课题所需的文献类型。由于现代科技文献的种类较多,并且
所报道的内容各有侧重,如属于基础理论性研究的,一般侧重查找期刊论文,会
议论文。如果是尖端科学技术,则应侧重于科技报告。如属于发明创造、技术革
新,应侧重于专利文献。如为产品定型设计,则需利用标准文献及产品样本。
(3)根据研究课题的背景信息确定出文献检索的时间范围。检索的时间范
围一般据研究课题的具体情况而定,如进行课题查新,需要检索近10年的文献;
若为了掌握动态或解决某个问题,则以满足具体需要为准,确定检索时间范围。
2、选择检索工具和数据库
选择检索工具要根据检索课题的学科、专业特点以及所需文献类型,充分考
虑检索工具报道文献的学科专业范围、文献类型、文种是否符合需要;了解所选
检索工具对文献揭示的深度、提供的检索途径、报道的时差等因素。注重利用权
威性的检索工具,同时注意将综合性与专业性和单一性的检索工具结合使用。并
优先选择机读型检索工具,以争取最佳的检索效率。
※数据库选择原则
(1)按照课题的检索要求和目的,选择收录文献种类、专业覆盖面、年代
跨度对口的数据库。
(2)当需要查找最新文献信息时,选择数据更新周期短的数据库。
(3)当需要获取原文时,选取原文获取较容易和数据库。
(4)要选好数据库,就要弄清所选数据库的标引特征、不同检索特点等。
3、确定检索途径和检索标识
在利用检索工具查找文献信息时,主要是利用检索工具的各种索引,每种索
引提供一种文献信息检索途径,一般来说每种检索工具都为用户提供几种检索途
径,归纳起来一般可以分为四种:分类途径、主题途径、作者途径、题名途径、号码等其他途径。
信息检索与信息存贮是互逆的过程,存贮在检索工具和系统中的数据,有
些著录项或标引字段是可以提供检索的,这些著录项或标引字段就是检索的入
口。
检索词是构成检索式的基本单元,是文献记录中的文献特征标识,可以是
反映文献内容特征的主题词、自由词,也可以是反映文献外表特征的作者、篇名
等。检索词的选择要满足匹配的要求,即形式的匹配和内容的匹配。
※检索标识的定义
检索标识,即检索词,是指能表达检索课题主题概念和信息需求的名词术
语、分类号、名称及代码等的总称。
检索标识是指通过对查新项目的主题分析将自然语言转换成规范化语言,即
确定检索入口的问题,包括分类号标识和主题词标识,这是影响检索质量全面准确
的一个很重要的因素。
检索标识的确定
※检索标识必须反映课题内容和信息需求。
※检索标识和数据库的标引标识应一致。
※所选检索工具或系统具有叙词表或主题词表的,优先选用叙词或主题词
作为检索词。
※要从词表规定的专业范围出发,选用各学科内具有检索价值的基本名词
或术语。
※如检索词为自由词,应选取其同义词、近义词、广义词、狭义词、分子
式、分类号、登记号、专利号、化学物质俗名、商品名等,使用多个词试检,或
通过逻辑“或”组配进行检索。
4、选择检索方法
文献信息检索方法可归纳为追溯法、常用法和综合法三种。在检索文献信息
时可根据检索课题的不同要求,选择不同的检索途径,以达到省时省力查全的效
果。
5、调整检索策略,筛选文献结果
检索策略是为了实现检索目标而制定的全盘计划和方案,是对整个检索过
程的谋划和指导。所以检索策略,,就是在分析信息需求实质的基础上,确定检
索途径与检索用词,并明确各词之间的逻辑关系与查找步骤的科学安排。
检索式是狭义上的检索策略,又称提问逻辑,就是对多个检索词之间的相
互关系和检索顺序作出的某种安排。是检索策略的具体表述,是通过逻辑算符、位置算符、截词算符等把表达主题要领的各检索单元组配连接起来的命令形式,它既能表达主题内容,又能被机器识别和执行,是决定检索策略质量和检索效果
的重要因素。
6、 查找文献线索 查找原始文献
上述步骤完成后,即可利用所选择的检索工具进行具体的检索。但在用分类
途径或主题途径检索时,可能会出现检索提问标识和文献存储标识不一致而查不
到合适的文献的情况,这时应反复修改检索提问标识,直至检索到适合的文献为
止。
当检索到研究课题的相关文献后,应仔细阅读文献著录条目的内容,判定
是否有参考价值,如符合检索需要,则要准确记录下文献的分类号、题名、著者、出处和入藏号等,以便索取原始文献,并用以积累资料。
查找原始文献,一般是由近而远,首先从本单位、本地区的文献资源着手,然后利用全国性的文献联合目录。
利用互联网进行文献的查找和获取目前已成为用户方便、快捷的远程获取
原始文献的一种发展趋势。
五、检索效果分析
(一) 检索效果的评价
检索效果是指检索结果的有效程度,反映了检索系统的检索性能和检索能
力。
1、文献检索的基本要求
第一,要“全”。文献查阅越全面,对自己的观点及论据的完整帮助越大。只
有广泛阅读视野放宽,才不至于偏听偏信。
第二,要“准”。现在学术界流行许多病症,诸多情况皆因为查阅文献失实或者
不善推敲,以致囫囵吞枣。其病概分三类:一是生吞活剥断章取义,二是曲解引申主
观臆测,三是相互转抄以讹传讹,这都是极不负责的态度,是学术研究的大敌。
第三要求“快”
第四,要勤于积累。要有意识地建立自己的资料库,平时注意做摘要、札记、
卡片等。
第五,要善于思考。文献资料也是良莠不齐的,里面也有假冒伪劣。因此要将
“死”书读“活”,就显得十分关键。只有善于思考才能在查阅文献时发现新问
题,才会有理论研究的敏感
(资料来源:裴娣娜《教育研究方法导论》,安徽教育出版社,1995年版 第三
条自己加)
2、评价检索效果常用的指标
检索效果是指检索结果的有效程度,反映了检索系统的检索性能和检索能
力。评价检索效果常用的指标有收录范围、查全率、查准率、响应时间和输出形
式等,其中,查全率和查准率是最重要的也是最常用的指标。
查全率是指检索出的相关文献与系统中的相关文献总量之比,又称“命中
率”。可表示为:
查全率R=检索出相关文献量÷系统中的相关文献总量×100%
查准率是指检索出的相关文献量与检索出的文献总量之比,又称“相关率”。
可表示为:
查准率P=检索出相关文献量÷检索出的文献总量×100%
查全率衡量系统检索出与课题相关信息的能力,查准率衡量系统拒绝非相
关信息的能力。两者结合起来,即表示信息系统的检索效率。检索者的最终目的
是要求达到查全率和查准率均为100%,这实际上是不可能的。 一系列试验结果
表明,查全率和查准率之间存在互逆关系,即二者同时提高是不可能的。也就是
说,对于任何一个信息系统,在其查全率与查准率之间都存在一个最佳的比例关
系,查全率一般在60%~70%,查准率一般在40%~50%,这是检索的最佳状态。见
图2-3。
查100
全80率
R60
40
20
0102030405060708090100查准率 P
图2-6 查全率与查准率关曲线图
(二)影响查全率和查准率的因素
1、客观因素:
(1) 系统内信息存储不全,收录遗漏严重;
(2) 索引词汇缺乏控制;
(3) 词表结构不够完善;
(4) 标引缺乏详尽性,没有网罗应有的内容;
(5) 信息分类(标引)专指度缺乏深度,不能精确地描述信息主题;
(6) 组配规则不严密,容易产生模棱两可或歧义现象。
2、主观因素:
(1) 检索课题要求不明确;
(2) 检索工具选择不恰当;
(3) 检索途径和方法过少;
(4) 检索词缺乏专指性,检索面宽于检索要求;
(5) 用词不当;
(6) 组配错误。
(三)提高检索效果的措施和方法
(1) 选择好的检索工具。
(2) 提高用户利用检索工具的能力,提高用户信息素质。准确使用检索
语言、利用各种辅助索引、扩检或缩检、优选检索词
(3) 制订优化的检索策略。
检索策略就是在分析课题内容的基础上,确定检索系统、检索途径和检索
词,并科学安排各词之间的位置关系、逻辑联系和查找步骤等。检索方案、合理
调整查全率和查准率
【】六、检索实例
【资料】检索表达式(提问式)的构造
检索表达式 也称检索式或检索提问式,是检索策略的具体表现,是用逻辑
运算符将检索词组配而成,它就直接影响检索结果。
检索式是检索策略的具体表述,是通过逻辑算符、位置算符、截词算符等
把表达主题要领的各检索单元组配连接起来的命令形式,它既能表达主题内容,又能被机器识别和执行,是决定检索策略质量和检索效果的重要因素。
※检索提问式,是指计算机信息检索中用来表达用户检索提问的逻辑表达
式,由检索词和各种布尔逻辑算符、位置算符以及系统规定的其它组配连接符号
组成。
◎◎检索表达式的制定要遵循以下几个步骤:
(6) 切分 是对课题包含的词进行最小的分割
(7) 删除 对过分宽泛或过分具体的词、无实际意义的边词、虚词应予以
删除。如“的” “及”
(8) 替换 对表达不清晰活容易造成检索误差的词加以替换。 如 “绿
色包装” 中的绿色应替换成“环保”
(9) 补充或增加 这一步是将课题筛选出的词进行同义词、近义词、相
关词的扩充,这些词加入检索款目可以避免漏检。
(10)组合 把检索词用逻辑符号链接组合成检索式。
聚类组合法:切分、删除、替换、补充、增加、组合。
例1:
壮族传统民居的研究
切分:壮族 传统 民居 的 研究
壮族 传统 民居 建筑 的 研究
补充 (删除)
壮族 传统 民居 建筑
例2:
大气中细菌浓度的计算方法
(替换)
大气污染的计算方法
例3:
高层建筑的优化设计
(切分)
高层 建筑 的 优化 设计
(删除)
高层 建筑 优化 设计
(替换)
高层 建筑 优化 结构设计 (词的集合)
(聚类)
高层 优化 结构设计 (组面的集合)
建筑
例4:
(补充)
煤田勘探
煤田勘探+煤田*地质勘探
(增加限义词)
勘探 勘探*煤田(逻辑“与”)
勘探 勘探-煤田(逻辑“非”)
例5:
(组合)
[a,b,c] 1 a,b,c
2 ab,ac,bc,ba,ca,cb
3 abc,acb,bac,bca,cab,cba
生物心理学
1 生物*心理*科学
2 生物学*心理+心理学*生物
3 生物心理学+心理生物学
例6※壮民族旅游文化资源的开发与综合利用
例7绿色设计在我国的发展及状况_____ _ The Green Design's develop
and condition in our country
课题重点、关键词、主题词等分析(中英文): 绿色设计(green design)、我
国(our country) 、发展(develop)、状况(condition)
检索式(例):1. 绿色设计and我国and发展or状况2 绿色设计and中国
and发展or状况3 中国and绿色设计and发展or状况4, 中国and绿色设计and
发展or状况
例8※※※※“有关造纸废水的处理技术”方面的检索式,首先抽起检索词:
造纸——paper making, paper pulp
废水——waster water
处理——treat, treatment
构造检索式:(paper w making or paper w pulp) and waster water and (treat or treatment)。
例8父母民主型教养方式对幼儿卫生行为习惯培养的影响
【】苏东坡历史故事
苏东坡 历史故事 中国 现代
【】网页设计与网站建设的思考与设计
网页设计 网页制作 网站设计 网站建设
【】投机家的证劵心理分析
股票 证劵投资 市场心理学
【】信息时代的企业人力资源管理
例9 检索实习报告范例三
利用计算机网络数据库检索。我院有多种计算机网络数据库,本范例中只给
出《清华同方全文数据库》和《维普全文数据库》检索样例。其他中文数据库可
以参照实习。
计算机数据库检索是利用字段检索实现信息检索,所以准确使用所需检索的
字段是检索的关键。同时计算机数据库检索都有普通检索与高级检索之分,本课
程检索实习要求使用高级检索(即布尔逻辑检索)或二次检索。
班级 学号 姓名 日期 题目:探讨港口物流中心的运作模式对现代物流的影响
1.课题分析:
以港口为中心,大力发展现代物流业已成为一种必然趋势。而港口发展现代物流业最重要的是建立现代化的港口物流中心。在我国,目前各大港口都已经朝着物流中心转化,上海,广州,天津,深圳,厦门等港口都在积极规划建设物流园或物流中心。我国港口物流中心发展不成熟,且物流中心的建设需要巨大的投入。因此,对我国港口发展物流中心的运作模式进行理论上的探讨,对指导港口物流中心的建设是有着现实意义的。即物流问题涉及港口建设与经营、管理。其次,物流学科是个跨学科的研究对象,除了涉及港口外还涉及对外贸易、铁路与公路的运输,物资的供应链与流通。但此课题不涉及一般物流概念,诸如:生产企业的物流、超市物流等。根据这些分析,我们可以看出课题涉及的主题(关键词)主要是港口、物流、物流中心、供应链等。因此,应该对这些关键词进行全面的布尔逻辑检索。另外,物流概念是近几年提出,为了检索到较新的信息,检索时限定检索时限为2001年至今。
2.选择数据库:
《清华同方全文数据库》和《维普全文数据库》
3.检索途径:
根据以上分析选用主题词检索字段检索,且用港口与物流两词进行布尔逻辑检索。即采用高级检索,也可以采用简单检索后进行二次检索方法,以达到同样效果。
高级检索:关键词:港口*物流
一般检索:关键词:港口;在第一次检索后使用二次检索,关键词为:物流(二次检索相当与布尔逻辑检索中的与检索)
4.检索内容:
(1)《清华同方》
※ 【篇名】 当代国际航运中心发展的新趋势——兼析上海国际航运中心的规划建设 CAJ原文下载
【关键词】 国际航运中心;;集装箱转运;;港口区域组合;;物流中心;;上海市
※※【篇名】 天津港集装箱物流中心战略构想 CAJ原文下载
【关键词】 天津港;;集装箱物流中心;;战略规划;;目标模式;;建设构架;;功能设计;;对策建议
(2)《维普》
第一条
【题 名】 全球物流发展趋势与港口功能转变——深圳案例经验分析
【关键词】 深圳市 案例 港口发展 全球物流 发展趋势 港口功能
第二条
【题 名】 港口物流信息系统评价原则及方法
【关键词】 港口 物流信息系统 诊断 评价
检索内容已有格式说明,故不进行格式说明。(以上内容直接从计算机上检索并下载)
※例10 检索实习报告范例四
课题: 计算机辅助设计在建筑设计中的应用
1.课题分析:
当前世界各国在建筑设计广泛采用先进技术,以增强建筑设计上的竞争能力和提高建筑的技术含量。过去在建筑的设计上主要靠人工完成,随着计算机技术的开发,特别是计算机辅助设计技术的产生和应用,使建筑设计有了很大的技术保障,但我国计算机辅助设计在建筑设计中的应用相对落后。对此,检索有关信息,以利用有关国家在这方面的情报。根据分析,确定的主题词为建筑设计 , 计算机辅助设计。
2、检索途径:
在Ei数据库中有两个可以检索的库,本次检索使用2000—2003的数据库。同时依据以上分析,采用建筑设计, 计算机辅助设计这两个词的“与”检索。“计建筑设计*计算机辅助设计”
其检索式(检索表达式或叫检索提问式)是:“计建筑设计*计算机辅助设计”
3.检索内容:
例10 (二)[实习(实验)二]
检索工具与参考工具使用方法
《全国报刊索引》使用方法(其他检索工具与参考工具使用方法一样)
《全国报刊索引》目前有2种检索途径,分别是分类途径和著者途径。下面举例说明其使用方法。
1.分类途径
[检索工具] 《全国报刊索引》(自然科学技术版)
[检索课题] GPS车辆定位系统研究(1995-2008年)
[检索程序]
第一步:分析研究课题,选择查找分册。根据课题含意,应选《全国报刊索引》(自然科学技术版)。
第二步:确定类目。对照《全国报刊索引》(自然科学技术版)类目表,确定该课题的类目为“P22 大地测量学”。
第三步:根据确定的类目名称逐本查找,直到满足检索要求为止(1995-2008年)。例如在2003年 11期上查得:
031101554 GPS车辆定位监控系统的应用/李星蓉(华北电力大学,071003)//电力系统通信(南京).-2003,24(6).-34-37
第四步:索取原始文献:(1)用上步获得的期刊刊名《电力系统通信》查《中文期刊馆藏目录》,获得馆藏单位;(2)去人或去函借阅或复制。
2.著者途径
[检索工具] 《全国报刊索引》(哲学社会科学版)
[检索课题]查找经济学家吴晓求2003年发表的论文
[检索程序]
第一步:分析研究课题,选择查找分册。经济学家吴晓求发表的论文一般属于经济学范畴,因此应选择《全国报刊索引》(哲学社会科学版)。
第二步:用著者姓名按姓氏汉语拼音字顺在每期《全国报刊索引》(哲学社会科学版)后面的“著者索引”中查找,获得文献顺序号。例如在2003年6期和9期上分别查得:
吴晓求 030609834 (6期)
吴晓求 030907098 (9期)
第三步:用所获文献顺序号(俗称文摘号)查同期题录本,获得文献篇名与文献出处等。第6期上为:
030609834 资本结构和公司治理/吴晓求(中国人民大学金融与证券研究所)//资本市场.-2003,(4).-23-28
第9期为:
030907098 激励机制与资本结构:理论与中国实证/吴晓求(中国人民大学金融与证券研究所)//管理世界.-2003,(6).-5-14
第四步:索取原始文献:步骤同分类途径,
※附录资料 《文献信息检索与利用》检索课题选
以下所列检索课题供学生在完成检索练习时参考,学生尽量依据所学专业选择检索课题,但课题名称可以根据学生意愿进行适当改动。检索时根据课题检索情报、信息,检索到的内容须与课题相关,否则实习成绩不能通过。
1、中东局势对中国旅游的影响
2、关于旅游发展的回顾和设想
3、论中美贸易争端
4、大型构件起重吊架在港口工程中的应用
5、信息产业经济化发展
6、亚洲各国经济发展前景分析
7、城市高层建筑的设计建造
8、世界局势对国内经济发展的影响
9、旅游经济理论与方法
10、 如何发展中国海上旅游业
11、 中国导游人员的培训与教育问题
12、 网络信息的组织与管理
13、 数据库的维护技术
14、 如何利用互联网研究信息传播与利用
15、 建筑企业的投入产出分析
16、 大学生心理问题
17、 电子商务在线购物的创业研究
18、 壮民族旅游文化资源的开发与综合利用
19、 旅游安全及其法规问题探讨
20、 提高建筑企业竞争能力的根本途径分析
21、 现代企业制度中的财务审计
22、 可持续发展的交通运输战略
23、 我国旅游政策与法规的构建
24、 房地产开发中融资市场化问题
25、 信息技术对旅行社业务的影响及应用
26、 城市给水系统优化策略
27、 可拓学在建筑设计领域中的应用
28、 生态建筑学在城市建筑中的应用
29、 建筑与风水的关系
30、 结构用复合材料应用技术现状
31、 建筑结构隔震技术综述
32、 国外(美国等国家的)工程管理及其现状和未来趋势
33、 建设过程之间的界面管理
34、 工程项目全寿命管理信息系统的需求分析
范文五:专业检索表达式语法.doc
专业检索表达式语法
专业检索用于图书情报专业人员查新、 信息分析等工作, 使用逻辑运算符和关键词构造检索式进行 检索。
如何构造专业检索式:
1. 选择检索项。
跨库专业检索支持对以下检索项的检索:SU=主题 ,TI=题名 ,KY=关键词 ,AB=摘要 ,FT=全文 ,AU=作 者 ,FI=第一责任人 ,AF=机构 ,JN=中文刊名 &英文刊名 , RF=引文 ,YE=年 ,FU=基金 ,CLC=中图分类 号 ,SN=ISSN,CN=统一刊号 ,IB=ISBN ,CF=被引频次
2. 使用运算符构造表达式。
可使用运算符说明如下:
3. 使用“AND”、“OR”、“NOT”等逻辑运算符,“()”符号将表达式按照检索目标组合起来。 注意事项:
所有符号和英文字母,都必须使用英文半角字符;
?“AND”、“OR”、“NOT”三种逻辑运算符的优先级相同;如要改变组合的顺序,请使用英文半 角圆括号“()”将条件括起;
?逻辑关系符号 (与(AND )、或(OR )非(NOT )前后要空一个字节;
?使用“同句”、 “同段”、 “词频”时, 需用一组西文单引号将多个检索词及其运算符括起, 如: ' 流体 # 力学 ' ;
例 1
要求检索钱伟长在清华大学或上海大学时发表的文章。 检索式:AU =钱伟长 and (AF =清华大学 or AF =上海大学 )
例 2
要求检索钱伟长在清华大学期间发表的题名或摘要中都包含“物理”的文章。检索式:AU =钱伟 长 and AF=清华大学 and (TI =物理 or AB = 物理 )