数字图书馆云服务模型研究
摘 要:本文结合数字图书馆信息检索现状,在原有数字图书馆信息检索模型的基础上,构建云服务数字图书馆模型。该模型通过四层架构模式将云计算资源、云存储资源、云基础设施资源、云应用资源统一划分为一个大的数字图书馆资源库, 为用户提供安全、高效、经济、可控的云个性化阅读服务。通过综合评价各层次的各个因素,构建指标评价体系。通过对模型的研究,旨在提高数字图书馆信息检索的效率和准确性,希望能对后续同类研究提供方法上的指导。
关键词:云服务;数字图书馆;信息检索
一、云计算和云服务研究现状
(一)云计算和云服务的定义
2006 年 8 月 9 日的谷歌(Google)搜索引擎大会(SES San Jose 2006)上,当时的谷歌首席执行官埃里克·施密特(Eric Schmidt)第一次提出了“云计算”(Cloud Computing)的概念。
美国国家技术和标准学会(National Institute of Technology and Standards,NIST)认为云计算是一种模型,它支持方便、按需地通过网络访问可配置计算资源的共享池,可以在尽可能不需要管理工作或服务供应商交互的情况下迅速提供和发布这些可配置计算资源[ 1 ]。
维基百科认为云计算是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需提供给计算机和其他设备[ 2 ]。
(二)国内外研究现状
我国对于云计算的发展也非常的重视,周洪波主编的《云计算技术、应用、标准和商业模式》对云计算的技术沿革、应用和商业模式做了清晰有力的论证分析,以期拨开云计算的迷雾,还原云计算的真实面目,Venkata Joysula,Malcolm Orr,Greg Page等主编的《云计算与数据中心自动化》完整、详尽地向读者展示了如何构建和实施管理云的解决方案架构,袁玉宇,刘川意,郭松柳等编著的《云计算时代的数据中心》从数据中心的基本构成入手,介绍了一个典型数据中心的基本硬件和软件,并分别从数据中心的硬件架构、供电系统、操作系统、可靠性、存储系统及数据保护、能耗、成本核算模型等方面详细讲述了如何从设计者和构建者的角度去解构一个数据中心,王鹏主编的《云计算的关键技术与应用实例》以全新的视角全面讲述了云计算技术,主要内容包括并行计算技术、云计算的关键技术、架构及实例、云计算与智能、云计算技术的竞争性分析等内容。但目前尚未出版专门论述云服务模式下数字图书馆信息检索模型的构建及评价的专著。
综上所述,现有的研究多是从云服务关键技术和平台架构方面对云服务模式下数字图书馆展开研究,从语义网、本体、P2P、 Jena规则推理和正则表达式等方面对传统数字图书馆信息检索模型进行改进,少见将云服务模式应用于数字图书馆模型中,构建云服务模式下的数字图书馆模型,并对构建的模型从查全率、查准率、结果文档重复度、结果排序质量等方面进行评价的研究。
二、模型构建
(一)信息检索过程
信息检索包括存储和查询两个过程。存储过程是把大量杂乱无序的信息加以科学地组织,形成—个信息集合体。查询过程是存储的逆过程,即从已经组织好的信息集合体中查检和索取出所需的信息。
检索结果是随着查询过程的发生而逐步发生动态变化的,这种变化伴随着各类活动与情境交互的复杂行为,这就对检索算法和模型提出了更高的要求。
图书馆作为最早采用检索系统的公共机构之一,最初的检索系统 是从系统论的角度来考量用户检索行为,这一时期的检索结果更多地关注系统需求,而非用户需求。
80年代中后期,很多专家学者认为系统导向的检索系统存在诸多局限,对检索系统的研究焦点开始向用户转化而不是过多关注系统需求。
而基于云计算技术的数字图书馆模型和传统的数字图书馆相比具有很多的优势。基于云服务的数字图书馆模型通过动态部署云存储,按需使用避免资源浪费。通过图书馆云服务平台,可以很好地为用户提供多种类型、异构的电子资源服务。利用云服务平台所提供的服务,读者可以在自己方便的任何时间段访问图书馆资源,尊享无间断的下载、浏览、观看等服务,同时也与平台内的其他读者共享带宽和电子资源。
(二)云服务平台构建
数字图书馆云服务模型采用四层网络架构,包括做为基础设施层的Iaas(Infrastructure asa Service,云计算设备服务)、中间层的Paas(Platform as a Service,云计算平台服务)和Saas(Software as a Service,云计算软件服务)以及会话层的客户端应用。云存储是平台的核心,通过应用软件来对外提供业务访问和数据存储服务。
基于Iaas的基础设施层主要由云存储集群设备、云存储虚拟化软件、云物理资源监控设备等设施组成。实现云存储中多个存储设备之间的协同工作,从而可以让多个的存储设备按需对外提供多种服务,并提供性能更高、速度更快、服务更好的数据访问性能。
PaaS 是基于IaaS 的底层服务,为图书馆提供二次开发服务,主要包括设计、应用开发、应用测试和应用托管的接口服务。
图书馆无需要购买电子书和期刊的阅读应用服务程序相关的硬件设备与软件, 仅通过互联网租用就可满足读者各种阅读下载所需。
SaaS 是基于IaaS 或者PaaS 平台应用服务基础之上,借助于SaaS, 图书馆可以向读者提供个性化的云阅读服务。读者不需要将云阅读软件安装在自己的电脑或者服务器上, 只需要输入用户名和密码即可获取相关阅读软件读取电子资源。
云会话层:云服务模式下的图书馆,有别于传统图书馆,读者可以借助于智能终端输入用户名和密码,如智能手机,Ipad来随时随地访问图书馆购买的各种电子资源。
云服务模式下的数字图书馆, 通过将现有的硬件软件资源统一为云计算资源、云存储资源、云硬件资源、云阅读资源, 为用户提供安全、高效、经济、可控的云个性化阅读服务。
三、指标体系构建
图书馆云模型的好坏将决定云图书馆的生命周期,而模型的好坏必须经过指标体系的监测。
一个好的指标体系必须判断并综合评价低层次的各个因素的比例以及权重,经过运算得出每个独立因素集的评价,最后经过层层评价,最后完成对总的指标的评价,图书馆云模型也不例外。
在指标体系构建过程中主要采取以下思路和步骤来进行:
(一)基本因子分析
综合分析和考虑影响云数字图书馆系统的各个要素利用系统论和层次分析法对这些要素进行整合。
(二)确立评价指标,设计评价体系
对影响模型的关键因素进行抽象分析,确立一级指标和二级指标,并根据这些指标的关系确定各要素的影响因子,确立指标体系对模型进行评价。
四、结论
随着电子资源数据日益庞大,硬件和存储的包袱越来越重,如能将云计算应用于数字图书馆必将为数字图书馆读者提供海量的电子资源,以分布式存储的方式将文献资源按需提供给读者;这种异构的数据存储模式将在很大程度上降低图书馆的运营成本,同时也将为图书馆的读者提供更加高效、便捷的数字图书馆阅读服务。
本文从系统整体角度出发构建了四层云服务模式的数字图书馆模型评价体系,为数字图书馆信息检索的健康评价提供了一套可供借鉴和参考的方法体系。本文及后续的研究成果可应用数字图书馆检索领域,为逐步实现真正意义上的云计算信息检索打下基础。
参考文献:
[1] Buyya,R,Broberg,J,Goscinski,A.M(Eds.).Cloud computing:Principlesand paradigms[M].2011,John Wiley & Sons,Inc,New Jersey.
[2] Handurukande S B,Kemmarrec AM.Peer sharing behavior in the eDonkey network, and implications for the design of serverless file sharing systems[EB/OL].
[3] Wood D. Model behaviour for 3D-HDTV[J]. Electronics Letters,2010,46(15):1045-1047.
作者简介:
张亚娟(1982-),女,硕士,助理馆员。