数据挖掘技术在图书馆创新服务中的应用探讨
摘 要
为应对如今信息量巨大,获取有效有用的资源信息难度陡增的现状,图书馆在创新服务中采取数据挖掘等技术致力于更好满足不同读书的需求。本文详细介绍了数据挖掘技术的功能和现代图书馆创新服务革新的主要内容,最后重点介绍了数据挖掘技术在图书馆创新服务中的三种应用形式,个性化服务、挖掘读者信息需求以及文献信息组织和开发等。
【关键词】数据挖掘 信息推荐 个性化服务
在中国的文化中,图书馆其实发源很早,早至书院、私塾、官家藏书等等,到如今的图书馆。但是图书馆的各项功能、服务较之以前都有了很大变革。如今,图书馆所说的创新服务,是指图书馆管理者通过多种途径来主动了解读者的需求,并分析读者类型以所属的需求结构,及时更新改善服务手段或方式,以达到提高服务质量,为更多读者提供更加实用、快捷的服务。图书馆实施改革管理、改变服务方式以及新技术的应用都是创新,其最终目的都是为了更好的满足读者的需求,服务读者。
1 数据挖掘技术的介绍
现代信息技术的高速发展使得网络数据信息暴增,在有限的资源获取手段下,大量的数据无法被人们所发掘、利用。传统的查询搜索方式早已无法满足这些信息的需求,因此,一种能搜索并处理大量信息资源新的数据分析技术—数据挖掘技术就产生了。
数据挖掘的功能简介:数据挖掘的作用是从大量数据集合中搜索发现隐藏的、有效资源数据等,可以归纳为以下几大功能。
1.1 聚类
聚类,一般可分为两种,一种是数学分类学法,另一种是模式识别方法,即在数据库中的记录可被化分为一系列有效子集。它可以增强了人们对客观事实的认知,是一切偏差分析或概念描述的先决条件。
1.2 关联分析
数据关联,指数据库中存在于两个及以上变量取值间的规律,可分为因果、简单、时序等三种关联形式,目的是在庞大的数据库中识别并找到隐藏的关联网。
1.3 概念描述与偏差检测
概念描述简单来说就是对特定的对象所包含的隐藏含义进行相关描述、对其有关的特征进行概括归纳。概念描述有区别性、特征性两种,前者描述对象之间的差异和区别,后者描述两者的共同特征。数据库中往往会存在一些数据异常的记录,从其中检测到这些偏差具有很重要的实际意义。偏差包括很多种,如规律外特例、案例实例、量值随时间的变化、观测值与预测值偏差等,对于偏差检测的基本方法是就是对观测值与参照值间存在的差别进行检查分析。
2 图书馆创新服务主要内容
2.1 信息服务以互联网为依托
互联网已经成为现代社会人们获取资源的首要途径,所以首先充分利用网络信息资源进行相关地拓展服务。图书馆可以通过多种形式为读书提供互联网服务,如: 整理加工、搜集专题信息资源、远程文献信息传递以及网上数据库使用的培训等,都是常见有效的方式。
2.2 为提供读者个性化信息服务
更加人性化、个性化的服务是很多行业发展的新方向,所谓个性化就是针对不同读者对信息不同的需求不同,提供有针对性的服务。一是个性化推送服务可以利用相应的信息推送技术,定期定量向读者提供其定制的信息栏、网络页面等;或通过电子邮件的形式推送信息,同样也可根据读者的定制需要来提供相应的服务。另外是个性化推荐服务,可以根据读者的兴趣特点主动提供相关相似的信息服务。
2.3 提供专业化垂直服务
专业化垂直服务是根据读者目标提供相应解决方案的服务,它需要图书馆管理者具备一定提前意识,即超前于读者的当前的现实需求和欲望,主动深入目标读者群体, 结合读者需求调研与图书馆的宣传服务。该服务重视读者需求的分析,通过分析和重组所获取的读者需求信息,提供相应符合读者未来可能需要的知识产品,并且对知识产品的质量进行评估。
3 数据挖掘在创新服务中应用举例
面对现在这个被数据“淹没”的年代,而人们对于资源又季度渴求的现状,基于数据开采、数据挖掘技术应运而生,已在各层图书馆被广泛应用。
3.1 个性化服务中的应用
个性化服务是图书馆推出众多创新服务形式中最主要、最受好评的形式。它主要形式有三类:一是根据特定用户的信息需求,为用户提供定制的信息网页、信息频道或信息栏目等,并协助实施代理查询;或者根据特定主题为用户提供文献源、文献搜索方向或直接提供文献全文的个性化文献性信息服务;还可以是按照特定主题为其提高相对完整的知识方案的个性化决策支持服务。
3.2 挖掘读者信息需求方向
创新服务的最终目的都是为了尽可能满足读者的需求,所以首先得重复了解不同读者对于信息的不同需求。在该技术出现前,图书馆只能通过对读者的借阅情况进行随机或针对地抽样统计、分析数据,最后判断读者的需求方向和情况,这当然没有效率但是也不得不进行。自从出了数据挖掘技术以后,图书馆管理系统可以利用该技术直接通过读者个人系统统计某读者借阅数据情况、浏览网页情况进行分析,并进一步挖掘其个人兴趣爱好、研究方向,帮助管理者确定提供针对性服务的内容和方向。
3.3 文献信息组织和开发
传统服务的信息组织方式是在庞大的网络数据中定位、找到读者需要的特定的信息,无疑这是一项艰难而低效的工作。利用数据挖掘技术,使得这一过程变得容易并且得以实现。数据开采技术是特别针对互联网上信息获取困难这个难度而产生发展起来的,其具体实现过程包括信息采集、文档的识别和信息分类等。除此之外,针对全球化信息化中所遇到的诸如地理和语言障碍,又研究开发了多语种信息发现。主要包括如: 集成机器翻译、多语种信息检索系统和多语种电子文档获取三个研究方向。另外还有一种是跨多学科协同的检索应用。该技术的应用可以同时向多个数据库并发请求,并与馆际互借系统、电子资源和文档提交等相连,多学科领域搜素最后返回结果给用户进行筛选。
4 结语
在信息爆炸的时代,为了满足各不同层次的人对于信息的多样化需求,图书馆等信息资源获取主要阵地将面临前所未有的压力,更好利用最新的科学手段发展更加高效快捷的信息技术已经成为当下信息产业的发展热点,数据挖掘技术在数字图书馆的改革创新建设以及信息服务质量的提升等方面都具有广阔的应用前景。
参考文献
[1]谢旭明.数据挖掘技术在图书馆个性化服务管理中的应用[J].企业导报,2013.2013(15):50.
[2]乔幸娟.数据挖掘技术在数字图书馆中的应用研究[J].农业图书情报学刊,2014(26):118-120.
[3]厍睿.挖掘技术在数字化数字图书馆中的应用[J].电子世界,2014(8):78.
作者单位
南阳医学高等专科学校 河南省南阳市 473000