论基于OPAC的信息资源整合信息资源整合的现实意义
随着图书馆向数字化,网络化方向发展,电子图书,电子期刊,数据库等数字化资源迅速增加,带来日益丰富的多样化的信息资源,同时也带来了新的矛盾和问题.
对读者而言,各种资源内容交叉,信息重复,关联度低,难以很好选择和掌握.同时,各种资源检索系统方法不同,风格各异,读者需要花费大量的时间和精力去学习,掌握各种不同厂商,不同界面的数字资源系统检索技术,否则便难以充分利用各种资源,造成数字资源利用的"技术瓶颈".
对于以图书馆为代表的文献信息服务机构而言,则为了保证数字资源的使用率,需要不断投入大量的人力,物力,财力进行资源内容宣传推荐,检索技术读者培训,往往还难以达到理想效果.
图书馆迫切需要对馆藏信息资源(包括印刷型和数字型)进行统一的组织和梳理,提供统一的入口和定位.信息资源整合就是要以一个统一的检索系统和用户界面,实现读者单一的检索表达,在一个涵盖各种不同信息资源的集合中得到响应,提供无缝,透明的信息资源服务.从而解决数字资源利用的技术障碍,把读者和图书馆从应用困境中解脱出来,提高信息资源整体使用效果.
基于OPAC的信息资源整合的优势
近来,各种软件厂商,数据库厂商与图书馆对资源整合开展了各种的尝试与实践.国内清华同方,TRS,杭州天宇,北大图书馆,中科院文献信息中心等纷纷推出了自己的资源整合服务系统.各家资源整合系统均采用了第三方的解决方案,即各系统是完全独立与各种资源之外的,不拥有自己的资源.
基于OPAC的信息资源整合属于资源整合的一种解决方案.它立足于OPAC,Online Public Access Catlog (联机公共检索目录),依托于图书馆集成管理系统,完全占有馆藏书目数据资源,在此基础上通过功能扩展,实现对其它信息资源的整合.
基于OPAC的信息资源整合与其它第三方系统比较的优势在于:
强大的资源基础
虽然数字化信息资源在馆藏资源中占据越来越大的比重,发挥越来越大的作用,但是,传统纸质文献资源在一个相当长的时间里,依然是馆藏资源的主体,不可取代,其作用不可忽视.所以,解决数字资源系统的整合问题,首先需要解决数字化资源与传统纸质文献资源之间的整合问题.基于OPAC的数字资源本身完全拥有百万计的传统纸质文献资源的数字化信息(馆藏书目数据库),在解决数字化资源与传统纸质文献资源之间的整合问题时,具有无可比拟的便利性和优越性.
同时,OPAC系统通常是各种图书馆集成管理系统的子系统,可以方便地调用读者库数据,拥有最权威和完整的读者信息资源,为以后的个性化服务奠定了坚实的基础.
稳定的系统保证
OPAC从第一代OPAC系统——机读目录,发展到今天的OPAC系统,已经完全突破了书目数据的限制,引进了期刊题录,文摘及信息数据等,支持预约,预借,续借,读者信息查询等交互功能,使书目数据服务与信息服务有机结合.
数十年的用户使用,反馈,无数次的升级,修改,完善,已经使OPAC系统非常稳定和成熟.这种稳定为现代信息技术的使用和资源整合的功能拓展提供了系统保证.
成熟的用户需求
在文献信息迅猛增长,馆藏资源极大丰富的今天,OPAC已经成为揭示和检索图书馆馆藏资源必不可少的工具,是目前图书馆馆藏主体资源系统,是用户利用馆藏资源的切入点.在几十年的使用和发展过程中,已经培养了一大批掌握检索技术,习惯于并乐于使用的用户群体.通过基于OPAC的数字资源整合,配合渐近的引导,用户不需要去学习太多新的,复杂的检索技术,就可以利用图书馆各种新的数字化资源.
灵活的系统架构
OPAC系统本身已经具有各种服务功能,是一个完整的服务平台,各个信息资源整合模块实际上是搭积木式地搭建在这个平台之上的.在构建时,图书馆可以根据自身的客观条件,充分运用现有的平台,技术与资源,有计划,有步骤地构建电子图书,电子期刊,数据库等各个模块.并可以根据馆藏资源的变化随时改变,灵活调整.
基于OPAC的信息资源整合的层次
关于信息资源整合的层次已经有不少文章提出了自己的理论,本文认为,基于OPAC的信息资源整合的可以分为两个层次:
数据层的整合(Data Integrate)
这是一种最彻底的,最完全意义上的整合.它完全脱离了各种异构系统原有的服务平台,利用各种数据库入口或ODBC(开放数据库联接)标准,直接获取各种异构系统的裸数据,构建新的数据集合,或者对各种异构系统的裸数据直接访问,直接处理.它可以便利的对检索结果进行归纳,查重,筛选等处理,使检索结果稳定,完整,一致.
但是,数据层的整合建立在通用数据库平台和开放系统之上,而在当前,很多数据厂商基于各种原因和利益考虑,不愿意开放其通用数据库权限,公开其裸数据访问接口,不愿意异构系统不受限制的访问其裸数据.所以,现阶段,只有部分信息资源能够实现数据层整合.
服务层的整合(Service Integrate)
服务层的整合是构建与各种信息资源自有的服务系统平台之上的整合.迫于用户需求与发展需要,越来越多的数据厂商开始在其服务系统平台中开放一个或一些接口,提供第三方系统调用.我们可以充分利用这些接口,或模仿客户机,提交有关检索表达式,获取一个服务系统反馈的Resultpage,再借助各种技术手段,分析处理结果,提取出有用的数据.
服务层的整合几乎对所有的系统都是适用的,它不需要等待标准,等待数据厂商的数据开放,具有良好的现实操作性.但是,由于检索结果不是对各种异构系统的裸数据直接访问产生的,所以,往往造成检索结果不稳定,不完整,较难进行过滤,归纳,查重,排序等处理,结果不够友好.
基于OPAC的信息资源整合的技术
基于OPAC的信息资源整合主要需要使用以下技术:
MARC与DC技术
MARC是非常成熟和稳定的一种信息资源描述方式.在几十年的时间里,适应了文献信息载体形式的发展,成功提供了对各种资源的描述.在当前,依然得到广大数字资源厂商的认可,如北大方正,书生之家,EBSCO,Elsevier等很多数字资源厂商都直接提供自己资源的MARC数据.但是,MARC过于注重形式,结构复杂,制作成本高,在对大量数字资源进行描述时具有局限性.
DC具有简单明晰,可修饰,可扩展等优点,提供了基于世界标准的,具有强大开放性的信息资源对象描述方式.在当前网络环境下,DC的研究和应用发展异常迅速,很可能成为将来数字资源的整合标准.
数据库技术
当前,众多的数字资源都是构建与MS SQL Server,Oracle,Sybase等通用数据库系统之上.如北大方正,书生之家电子图书的元数据系统都是采用了MS SQL Server技术.借助于通用数据库的相关技术,能够较为容易地实现对底层数据的访问和操作.
OpenURL技术
OpenURL是信息源与信息服务组件之间协调工作,并在开放链接环境中提供局部化服务的一种协议.它传输特定的元数据或关键词到某一可操作URL地址或网络服务组件上(如到SFX服务器上),以获取其提供的相应数据集.此时,目标URL地址叫做用户的Institutional Service Component (ISC).OpenURL的关键在于其元数据与关键词的结构与名称具有一个严格的标准.当前,越来越多的数据库厂商认可了OpenURL,并提供OpenURL支持.
程序设计技术
数字资源整合系统的构建需要使用ASP,JSP,CGI等程序设计技术,提供对各种数据库和OpenURL的操作,对结果的处理,对各种数字资源服务系统认证子系统的屏蔽,还包括异构系统上Agent的算法设计与实现.
基于OPAC的信息资源整合的方法
馆际馆藏书目数据资源的整合.
通过Z39.50协议或OpenURL技术,联结整合不同图书馆的OPAC系统,聚合不同平台上的异构OPAC数据库, 建立同一界面,同一平台,同一检索式下的书目整合检索系统.用户只要通过一个OPAC系统界面,提交一次检索式,即可检索相关图书馆的OPAC.如上海交通大学图书馆的"Webpac检索系统"的"多节点数据库检索"和中国人民大学书目整合检索系统.
随书光盘服务系统的整合.
随书光盘服务系统是一个提供随书光盘网上下载,使用的服务系统.可以在OPAC MARC记录215字段@e"附件"子字段中标注或揭示随书光盘信息,同时在300字段中加以描述和说明.当读者通过题名,ISBN等途径在OPAC系统中检索到某一本书时,OPAC则以215字段的@e为输出内容,告知用户该书有无随书光盘.如果有,通过调用随书光盘服务系统接口,用户可以直接点击下载该书的随书光盘,从而实现OPAC系统与随书光盘服务系统的整合.如暨南大学图书馆的随书光盘整合系统.
电子图书的整合.
有两个途径.
其一,依据MARC格式要求和相关著录规则,对电子图书进行编目.或直接从数据库厂商获取电子图书的MARC数据,导入OPAC系统中.通过启用MARC纪录856字段,标注与电子图书系统的URL链接,读者可以在检索到某一本电子图书后,直接点击指定的URL链接,阅读全文.
其二,设计Agent中间件.用户在OPAC系统中检索定位到某一本图书时,OPAC在后台将对应的参数传递给Agent,Agent利用通用数据库接口,在电子图书数据库中查找对应的电子图书,如执行conn.execute ("select * from book where isbn='"+isbn+"'").如果返回Recordset为空,则Agent返回OPAC空参数,OPAC显示:该书无电子版.如果返回Recordset非空,Agent则获取该书的相关OpenURL信息,并返回给OPAC,如书生之家电子图书http://....../tushuw/book/search.asp srhmode=isbn&kyword=.那么,用户则可以直接点击阅读该书的电子全文.
电子期刊的整合.
有两个途径.
其一,依据MARC格式要求和相关著录规则,对电子期刊进行编目.或直接从数据库厂商获取电子期刊的MARC数据,导入OPAC系统中.启用MARC纪录856字段,可用856字段@u来标注与电子期刊系统的URL链接,用@z来标注与刊名连接的注释;同时采用530字段附注说明,注明相关订购信息.读者可以在检索到某一本电子期刊后,直接点击链接,阅读全文.
其二,由于电子期刊的往往是网络数据库形式,比较分散,而且后台数据库一般不可以直接访问.所以,只有当用户在OPAC系统中检索定位到某一种期刊时,OPAC在后台将对应的参数传递给Agent,Agent分别调用各个电子期刊数据库的OpenURL信息,进行必要的认证系统登陆和检索式构建,返回OPAC完成后的OpenURL链接.当读者点击某种电子期刊数据库链接时,由相应电子期刊数据库执行检索操作,并返回检索结果.
其它数据库的整合.
当用户在OPAC系统中提交检索表达式时,后台Agent自动获取该检索表达式,并对其进行运算分析,分离并记忆界定词与关键词.
同时,分析各种数据库的参数数据表,构建符合不同数据库规定的检索表达式.对于可以基于数据层进行整合的数据库,由Agent直接通过ODBC等接口,连接数据库,提交检索表达式,并获取Recordset结果.对于只能基于服务层进行整合的数据库,由Agent将检索表达式"翻译"成符合各个数据库特定格式的检索语句,通过OpenURL等技术和接口,向该数据库检索系统提交,并获取Resultpage结果.
最后,由Agent对尽可能对各个Recordset和Resultpage结果进行分析,查重,合并,排序等操作,将结果转化为统一的格式,并显示给用户.
国内,清华同方的异构数据库统一检索平台(USP,Union Search Platform)是这一整合方式一个较好的典范.
[参考文献]:
马文峰. 基于知识组织理论之上的数字资源整合 [J]. 情报资料工作,2003,(1 ).
黄辰. 资源整合模式及其实现研究 [J]. 中国图书馆学报,2004,(1 ).
马文峰. 数字资源整合研究 [J]. 中国图书馆学报,2002,(4 ).
王善平. 论数字信息资源的整合与标准化 [J]. 情报资料工作,2002,(6).
黄成. 资源整合模式及其实现研究 [J]. 大学图书馆学报,2004,(1).
OPAC模块功能特点
OPAC可满足一般读者和图书工作人员查询公共目录的要求,同时,为各系/分馆提供公共目录查询。可以与其它数据库(本馆、本校、校外)的连接,保持一致的检索界面,并与系统中的相关模块,如采访、编目、期刊、流通等模块集成。显示必要的文献订购、签到、加工和流通信息。允许读者自己执行某些流通功能,如:续借、预约/取消预约、申请馆际互借等。读者能浏览自己的流通记录,查看借阅的资料和了解过期、罚款、停借、违章等信息。OPAC提供实时信息服务。其它子系统的数据一经修改,即在OPAC实时显示。编目子系统或流通子系统一旦建立了一个新的馆藏记录,OPAC立即能显示;文献一旦办理了归还手续,OPAC立即显示更新后的状态信息,并根据规定的时间,自动改变为"可供借阅"的流通状态。OPAC提供图形界面,功能齐全,操作简便,术语简明,助记性强。既具有基本检索功能,也具有高级检索功能(如:组合、限制、布尔);既能满足新手操作的简单方便,又能满足熟练者的高效要求。OPAC界面提供本馆、本校和外来数据库(包括有协作关系的数据库和商业数据库)的连接,用户可以直接访问这些数据库,并根据需要选择返回OPAC或直接退出子系统。OPAC提供的检索点:著者、题名、主题、分类/索书号、关键词等。中文著者和题名包括全拼式汉语拼音和汉语拼音首字母检索点。检索时能从书目记录连接到订单记录、馆址卷册记录、期刊签到;连接到相关的目次表文档和全文数据库,执行目次表检索和全文检索,或连接到馆外相关数据库。除执行单一途径索引检索,还提供组配检索功能。如,责任者与题名、责任者与主题、责任者与关键词、主题与主题等组配检索。包括著者、题名和主题标目检索。公共目录显示,提供记录浏览、显示。浏览为检索者提供命中记录的清单,供读者进一步浏览,告诉有无被命中记录。索引浏览仅显示与检索有关的标目。记录显示可按行列式目录和卡片式目录信息显示。也可以按全MARC格式显示。馆藏信息显示简明扼要,明确的馆藏地址和文献状态。能通过书目记录的有关字段连接到本馆其它数据库或外部数据库。LC MARC 856字段,本系统的499字段连接到与书目记录有关的URL,浏览显示。同样,期刊签到记录连接到相关的文档并供浏览。可选择预约有关文献。关于预约规则和预约的权限由流通系统规定。
----------------------------------------
|