private&share

   

------------------------------------------

-=图情=-

 
检索策略
作者:pine.lee  发表时间:2006-1-24

 

一、检索策略
所谓检索策略,就是在分析检索提问的基础上,确定检索的数据库、检索的用词,并明确检索词之间的逻辑关系和查找步骤的科学安排。检索式(即检索用词与各运算符的组配成的表达式)仅仅是狭义上的检索策略。事实上,在构造检索策略过程中,要涉及到许多方面的知识与技能。诸如,用户对检索课题的明确程度,对检索课题的分析;对数据库及其系统特性和功能的掌握;编制逻辑检索式的技巧以及调整检索策略的方法等方面都会影响用户检索的整体效果。因此制定检索策略是一种全面的知识与技能,也是一种经验.掌握了这种技能和经验,再通过广泛实习,可以获得比较好的检索效果。
1. 明确课题需求、选择数据库
检索过程中的首要环节,就是要明确课题需求,第一步如果搞错了,就谈不上最后检索结果的正确性。
由于用户对自己的需求,特别是潜在的、模糊的需求并不总是非常明确,因此需要进行分析,以求得一个完整而明确的表达。
在用户需求分析中,应搞清楚以下一些问题:
(1)分析课题检索的目的
通常有几种类型:
1)  1) 开始某一项科学研究或承接某项工程设计,需要对课题进行全面的文献普查,并从中筛选出所需的资料,用以编写可行性报告、计划任务书等。
对这样的课题,应选择一个年限比较长的,收录比较广泛的相关专业的二次文献数据库,在全面回溯检索的基础上,选出相关的文献,再获取一次文献。
2)  2) 为解决某个技术难题,查找关键性的技术资料。
对这样的课题,应选择工程和技术类数据库或专利数据库。
3)  3) 为贸易与技术引进、合资谈判,了解国外市场、产品与公司的行情。
查找科学数据库以了解技术的先进性,查找市场、产品、公司等商情数据库以对手的情况。
4)  4) 为申报专利或鉴定成果,查找参考依据。
以选择国内外专利数据库为主。
5)  5) 为某项决策查找有关情报。
根据决策的不同性质,进行综合性的全面文献调研,涉及到科学研究、技术研究、产品、市场等最新发展动态。
6)  6) 为撰写论文查找相关文献等。
以期刊论文、学位论文等学术研究性的数据库为主。
(2)明确题所涉及的学科范围和专业面
明确课题所涉及的主要学科范围、相关学科范围、交叉学科范围,并根据数据库的主题收录范围进行选择。
(3)对文献的新颖性程度的要求
对文献新颖性要求高,就要选择数据更新周期短、速度快的数据库。
(4)用户对检索的查全与查准要求
为满足查全要求,就要普查多种数据库,为快速满足查准要求,应选择主题范围最专指的数据库。
2 主题分析
明确检索需求后,就要对用户课题的具体内容作主题分析,这是正确选用检索词和逻辑算符的的关键,它将决定检索策略的质量并影响检索效果。
主题分析就是对用户的课题进行主题概念的分析,并用一定的概念词来表达这些主题内容,同时明确概念与概念之间的逻辑关系。主题分析必须注意:
(1)概念的表达要确切。抓住课题的实质性内容,分析出课题中有几个概念组面。
(2)找出核心的概念组面,排除掉无关概念组面,包括意义不大的概念和重复概念。用户有时会认为选取的概念组面越多,逻辑组配越细致,检索结果的针对性越强。事实上,过多过严的概念组配很可能导致大量的漏检,甚至结果为零。因此有时需要简化逻辑关系,减少概念组面,以提高检索效果。
(3)找出隐含的重要概念。如"智力测试",隐含着"能力测试"、"态度测试"、"创造力测试"等概念。数据库的标引往往使用比较专指的词,用户对标引规则不甚了解,往往会列出比较抽象的概念,而忽略了较专指的概念
(4)明确概念组面之间的交叉关系,即明确是逻辑"与"、逻辑"或"还是逻辑"非"的关系。哪些概念可以用来扩大检索范围,哪些可以作为进一步缩小检索范围的主题词。明确这些逻辑关系,有助于编制出正确的检索式。
3 编制检索式
制定检索式可以分为以下几个步骤。
(1)选择合适的检索用词:
对于分析出来的每个概念组面,用具体的检索用词来表示,如"学校活动"这个概念可以用具体的"班级活动"、"课外活动"、"学生活动"等检索词来表示。一个概念可能有许多同义词、近义词,如果在规范化词表中找不到规范叙词来统一这些词的话,就必须考虑各种形式的同义自由词,以防漏检许多文献。
(2)选择合适的位置算符
对于每一个概念组面选择出来的检索词,为表达位置关系,可根据各系统的规定,使用位置算符,如,Wn、 W/n等。不同系统的位置算符,词间的位置关系不同,得到检索结果也不同,需要注意。同时不同的位置算符决定检索的宽泛程度。
检索词的位置关系一般根据用户的专业知识或文献中常见的这种词的位置关系来确定。但如果资料见得较少,可以参考先检索到的一部分文献,再进行策略调整和修改。
(3)拟定合理的检索式
检索式是上述各步骤和各种检索技术的综合体现,是检索策略的表达形式。检索式编制得好坏直接关系到检索的最终结果。编制检索式需注意以下几点原则:
1)  1) 注意概念组配的逻辑关系不要搞错,正确使用布尔逻辑AND,OR,NOT算符。
2)  2) 英文检索词的不同表达方式尽量使用截词技术;
3)  3) 正确使用各种位置算符。
4)  4) 注意后缀与前缀代码的限定使用。
5)  5) 注意逻辑算符与位置算符的先后处理次序,注意括号的使用。
4.调整检索策略
根据初步拟定的检索式进行上机操作后,还可能会出现一些不理想的现象,如误检或漏检的情况。对于这种情况,应调整检索策略再行检索。调整检索策略主要是三方面:扩大检索结果;缩小检索范围;找出检索式中词与算符表达的错误。
(1)缩小检索范围的调整技术
将检索词限定在篇名或叙词字段中。
增加概念,加入AND算符。
用时间期限或其它辅助字段来限定。
用NOT算符排除无关概念。
将AND改为更精确狭隘的位置算符。
(2)扩大检索结果的调整技术
增加同义词、相关词,加入OR算符。
减少AND或NOT的使用次数。
将狭隘的位置算符改成宽泛的位置关系或AND。
在文摘或全文字段中检索。
但必须注意缩小检索范围会降低查全率,扩大检索范围则会降低查准率。
二、检索效果评价
信息检索的效率评价方面有着长期的传统,其中两个重要的指标就是查全率和查准率。
查全率是指检索出的相关文献量占系统中所有相关文献总量的百分比,用来反映检索的全面性。查准率是指检索出的相关文献量占所有检出文献总量的百分比,用来反映检索的准确性。如果查全率用R表示,查准率用P表示,检出的相关文献量为a,检出的非相关文献量为b,系统中未检出的相关文献量为c,那么可用公式表示如下
查全率P=a/(a+c)ⅹ100%
查准率R=a/(a+b)ⅹ100%
查全率的互补数就是漏检率,而查准率的互补数就是误检率。
查全率和查准率也是两个互补的关系。在一个特定的检索系统中,当查全率不断提高的同时,查准率就会降低,而当查准率提高的同时,查全率又会降低。但值得引起注意的是当查全率和查准率都很低的时候,两者可以通过检索策略的改善同时得到提高。
用户查找信息的目的各不相同,对查全和查准的要求也不同,有时,寻找特定的事实并不关心一次检索中漏检了多少,或探索某个主题时,并不在乎误检了多少。因此可根据用户需要,选择合适的查全和查准要求。
三、检索系统和数据库选择参考表
(限于本校订购和正在试用的外文数据库,不包括DIALOG系统,仅供本班专业同学参考)

专业  数据库
教育  EBSCO:ERIC、ASE、 Professional Collection Development、Primary Search、MAS Ultra - School EditionElsevier、Kluwer、John Wiley
心理  EBSCO: ERIC、ASE, Professional Collection Development、Elsevier、Kluwer、John WileyNISC: PSYCINFO, PsycARTICLESPQDD-B
生物  BIOSIS、Ecology Abstract、PQDD-BElsevier、Kluwer、John Wiley、SpringerEBSCO AnimalsEBSCO:ASE
数学  MathNet、PQDD-BElsevier、Kluwer、John Wiley、Springer、WorldSciNet、EBSCO:ASE
环境  CA、BIOSIS、Ecology Abstract、PQDD-BElsevier、Kluwer、John Wiley、Springer、WorldSciNet、EBSCO:ASE
工程  Ei Compendex、PQDD-BElsevier、Elsevier、Kluwer、John Wiley、Springer、WorldSciNetEBSCO:ASE
地学  Elsevier、Springer、Kluwer、John Wiley、EBSCO:ASE
法政  The Matter of Fact、EBSCO:ASEISI新兴市场、Elsevier 、Springer、John Wiley、Kluwer
经济  EBSCO:BSE、ISI新兴市场ELSEVIER、Gale、Springer、Kluwer、John Wiley
管理  EMERALEBSCO:BSE、Elsevier、Kluwer、John Wiley
文学  Gale
语言  EBSCO:ASE、Elsevier、Kluwer、
历史  EBSCO: ASE、ElsevierGale: History Resource Center
哲学  Kluwer、EBSCO:ASE

----------------------------------------
 

 

pine.lee发表于:工作中心  


 

全部分类中有 1 篇日志 | 每页显示 1 篇
留言内容(共有条)


{CommentAuthor}评论说:
{CommentContent}

--- {CommentTime} {CommentUrl}


 

流年--似水


也说--几句


 来来--往往


 

 快速--登陆

*用户名:
*密   码:

 


日志--搜索


踩上--几脚

 
pine 最新的 20 条日志
 

 

 

Designed By UBABY--2005