首页 > 文章中心 > 正文

网络数字图书馆服务比较研究

前言:本站为你精心整理了网络数字图书馆服务比较研究范文,希望能为你的创作提供参考价值,我们的客服老师可以帮助你提供个性化的参考范文,欢迎咨询。

网络数字图书馆服务比较研究

编者按:本论文主要从社会网络及其主要理论;社会网络在数字图书馆服务中的作用;基于社会网络的数字图书馆服务模型等进行讲述,包括了六度分隔理论、弱连带理论、并行生产理论、长尾理论、基本思路、社会化网络分析、用户知识过滤模型构建、基于社会网络的数字图书馆服务模型等,具体资料请见:

[摘要]分析六度空间理论、弱连带理论等社会网络理论及其对数字图书馆服务的影响,利用自我中心网分析和社会网络中心网分析方法确定数字图书馆平台上的知识团体、知识库,并在此基础上建立知识过滤模型,从而构建起基于社会网络的数字图书馆服务模型。

[关键词]社会网络数字图书馆服务模型

Web2.0时代,Blog、Wiki、SNS、RSS、标签等的应用,使每个用户都有了主动参与建设和分享信息资源的能力,随着用户间交流的增加,传统的人际关系网络在互联网上得以延伸和扩大。

1社会网络及其主要理论

社会网络(Socialnetwork)是由许多节点构成的一种社会结构,其中个体或者组织是节点,连接他们的社会关系是线,点与线的连接构成了社会网络图。

1.1六度分隔理论

六度分隔理论的核心思想是一种聚合产生的效应,通过信息手段将一些有关联的人与人、人与资源聚合在一起,产生一个可信任的网络。社会化软件利用了这一理论,典型的如Blog、Wiki、IM等,它们将人与人、人与资源联系起来,形成网络中的社会关系,QQ用户在中国就是一个互联网上最大的社会网络。一些图书情报服务机构中,已经开始利用社会化软件提供服务,如中国科学院国家科学图书馆的e划通。

1.2弱连带理论

美国社会学家MarkGranovetter提出的弱连带理论指出,一个人往往只与那些在各方面与自己具有较强相似性的人建立比较紧密的关系(强连带关系),从而形成一个小团体,而与此人不紧密或者间接联系的社会网络(弱连带关系)却可能给此人带来更大范围的信息资讯。了解社会网络中的这两种联系及其特点,对于我们提供数字图书馆网络服务有很大帮助。

1.3并行生产理论

并行生产(PeerProduction)的意思是通过汇集分散的投入和努力来有效地完成特定任务。它在信息收集与处理方面有极大的优势,因为它可以大大降低信息产业中的人力成本。

1.4长尾理论

长尾理论中的那部分“冷门商品”(misses)就是经常为人遗忘的长尾。数字图书馆中的很多资源,正是位于长长的的尾部部分,这部分尾部的资源不一定不是精品,数字图书馆在推荐服务的时候,完全可以把这部分资源和热门资源结合在一起推荐,用户可能在这种推荐中获得意想不到的信息,卓越、当当,Amazon等都采取了这样的方式。

2社会网络在数字图书馆服务中的作用

数字图书馆服务平台上,用户之间的互利合作行为、信任机制、通过社会协作形成的聚类等,与实际社会中非常相似,因此,在一定程度上可借用社会网络分析的方法,分析数字图书馆服务模式,为用户提供更为人性化的服务。

社会网络在国外图书馆信息服务中已有一些应用,如美国北卡罗莱那大学、南加州大学、印第安那大学、斯坦福大学、亚利桑那大学、爱荷华大学等,主要集中在在线资源评论、学科建设、服务评论和社交网络等方面;耶鲁大学科学图书馆利用社会性网络服务的嵌入功能,将社交网站Facebook和MySpace、网络相册服务Flickr、SMS短信咨询、IM即时通讯、Twitter、Blog等服务集成到本馆的一个页面上来。国内的徐媛媛等用社会网络分析法对引文分析进行实证研究,直观揭示出群体的引用状况与结构并分析出群体联系的紧密程度;刘心舜等也指出,图书馆合作(2.0)就是图书馆社会网络。

数字图书馆是一个知识服务空间,它不仅为用户提供了大量的数字资源,更为用户提供了知识交流和知识创新的服务平台。在用户的交流中,人际网络在这个空间中逐渐形成和展开,因此,帮助用户建立交流和协作机制,发现相似用户群,形成虚拟知识团体,进而针对团体和用户开展个性化服务非常有意义。

3基于社会网络的数字图书馆服务模型

综合分析上述社会网络理论,可将数字图书馆服务模型关注的重点放在,利用社会网络关系,对用户和数字图书馆资源进行有效的知识组织,把用户的特征和关联表示出来,通过社会网络分析方法,识别出知识团体;把知识客体(各种数字资源)中的知识因子和知识关联表示出来,识别出知识库(知识客体资源库);最后,将有关联的知识团体和知识库结合起来,让用户直接面对最需要的资源。

3.1基本思路

分析数字图书馆用户的社会网络关系,发现数字图书馆服务网络中的知识团体,并建立基于用户的知识库和知识团体库,进而利用知识库和知识团体库,为用户提供个性化、智能化、专业化的推荐服务。

要构建基于社会网络的数字图书馆推荐服务模型,需要:①确定知识团体。假设使用数字图书馆服务的多数用户都会通过Blog、图书(数字资源)评论、BBS等方式发表自己对使用过的资源的看法,与其他用户交流,也会利用图书馆搜索引擎检索感兴趣的信息资源,利用标签描述和收藏有价值的信息资源,那么通过这些途径,就可以显性和隐性地发掘收集用户数据并进行处理,找出数字图书馆平台上面具有强连带关系的用户,形成若干知识团体,知识团体的成员及其相互关系可记录到知识团体库,对该团体有价值的信息资源被纳入到该团体的知识库(如Blog上的精品文章、数据库中的精品资源),通过这样的处理,每个知识团体的信息需求特征非常明确,因此,数字图书馆可以为每个团体提供有针对性的服务和推荐;②不同团体不同背景的用户之间往往能提供更为广阔的信息来源,从而启发新的思维,这种弱联系一般存在于小团体和小团体之间,它可以为知识的扩展和延伸提供桥梁,对用户拓展思路,进行跨学科跨专业的合作研究有重要意义。因此,发现小团体与小团体之间,担任桥梁作用的用户,对于信息的传播和交流有很大帮助;③确定知识团体内部关系网络。根据不同知识团体内的个体间关系,对他们的评论和推荐设置不同的权重,从而影响知识团体内的用户。在一个团体内,可以通过发文数量和文章质量等因素确定团体内的核心人物(如该领域的专家),核心人物权威性更强,他的评论和推荐影响力更宽,所以权重设置大一些,次核心人物权重低于核心人物,以此类推;④分析知识团体与知识团体之间的联系,找出存在的弱连带关系和承担联系的关键个体,分析他们可能的信息需求;⑤除上述思路外,还可以利用六度空间理论,围绕每个个体的人际关系网进行分析,例如,一度空间内的关系对个人来说是最紧密和最重要的,因此他们的评论和推荐权重大于二度和三度空间的关系。

通过上述方法,分析清楚知识团体和知识库的内外部关系后,可利用并行生产理论和长尾理论为用户提供具体的服务。例如,亚马逊公司的协同过滤图书推荐机制(collaborativefiltering)就是并行生产理论的体现,这一机制记录用户所有浏览和购买图书的行为,并利用这些行为数据为亚马逊公司的其他顾客推荐图书;利用长尾理论为用户进行组合推荐(推荐一些跨专业或位于长尾尾部的精品资源)。

3.2社会化网络分析

社会网络分析有两类研究方法,一类是围绕特定的参考点展开的自我中心网(egocentric)分析,主要关心的问题是个体与哪些人有联系以及联系的强度;另一类是以整体网络关联模式为对象的社会中心网(so-eiocentric)分析,主要研究的是群体中不同角色的关系结构,掌握群体中的社会网络分布情况,区分网络中不同地位的角色。具体分析时,可以将这两种方法结合起来使用。

3.2.1自我中心网分析在数字图书馆平台上,每个用户作为一个节点,分析该用户与其他用户的联系。根据弱连带理论,测量关系强弱有四个维度:一是互动的频度,互动的次数多为强关系,反之则为弱关系;二是感情力量,感情较强、较深为强关系,反之则为弱关系;三是亲密程度,关系密切为强关系,反之则为弱关系;四是互惠交换,互惠交换多而广为强关系,反之则为弱关系。关系强弱是这四个方面共同作用的结果,并且关系强弱很可能是一个连续性变量。

数字图书馆社会网络分析的难点在于,无法像在现实生活中那样,通过问卷等方式进行调查。因此,在设计四个维度的评价指标时,除互动频度外,其他几个维度的指标设计相对较困难。互动维度(权重0.5)主要通过Blog发文和回复、BBS、站内信、即时聊天等途径进行分析;感情力量和亲密程度(权重0.3)可以通过联系人分类(用户将联系人到不同类别中,如同事、好友、一般朋友等);互惠关系(权重0.2)可以通过专业或兴趣爱好的相似度来衡量。表1可用于测量A与其他用户的联系强度:

3.2.2社会中心网分析社会中心网分析可用于发现数字图书馆网络中存在的知识团体及每个知识团体中的成员角色。当部分成员的交流和联系会明显多于其他成员之间的联系,就构成了一个知识团体。

在社会中心网分析中,可通过点度中心度(pointcentrality)分析,考察各节点的相对中心度,找到局部中心和整体中心,进而围绕中心进行聚类,划分出各知识团体,确定其中的关键人物及每个成员的角色。

由于数字图书馆网络中存在若干知识团体,因此,我们考察局部中心更有意义。如果某点有许多邻点与它直接联系,我们便说该点是局部中心点,图1中的A和1分别是两个局部中心,围绕他们形成了两个知识团体。A和I是这两个知识团体中的核心人物,还有若干次核心人物如B、C,F在这里担任了连接两个知识团体的桥梁,他的存在使两个知识团体有了交流和沟通的渠道。

在实际操作中,通过用户行为跟踪等方式收集数据,并利用UCINET软件分析数据得出社会网络结构。

3.3基于社会网络的数字图书馆服务模型

基于社会网络的数字图书馆服务模型包括用户管理、数字资源、Blog平台、评论平台、检索平台、标签平台、其他服务几大模块。各模块具体功能如下:①用户管理模块用于管理用户注册信息,维护和更新用户个性化信息,生成和管理知识团体库;②数字资源模块用于管理和维护数字图书馆馆藏资源,生成和维护数字资源集;③Blog平台用于管理注册用户在该平台上的文章,生成和维护Blog资源集;④评论平台为用户提供对各种数字资源(数据库资源、其他用户的Blog文章)的评论,生成和维护评论集;⑤搜索平台为用户提供对各种数字资源的简单和高级检索,生成和维护检索集;⑥标签平台为用户提供对各种数字资源的标签标记和管理,生成和维护标签集;⑦其他服务模块提供系统帮助信息和管理员维护功能。

具体服务流程:①用户登录进入数字图书馆网络平台,系统根据用户身份识别用户所属知识团体,提取用户特征值;②根据用户特征值,查找符合用户的知识库资源(包括Blog资源集、评论资源集、搜索资源集、标签资源集和数字馆藏资源集),生成用户个人数字图书馆应用平台,推荐相关资源和服务,包括:同一知识团体内其他用户访问最多的数字资源,评论最激烈的Blog文章、使用最频繁的检索词,收藏最多的资源等;③在用户的使用中,系统自动记录用户行为(查看过的B1og文章,评论过Blog文章和馆藏资源及其具体评分,使用过的搜索关键词,收藏的最新资源及使用的标签),这些用户行为特征又会影响知识库的构成(具体由知识过滤模型计算和处理)。

在这个过程中,知识库的形成和知识过滤模型的构建是整个系统的关键。知识库主要通过社会网络分析和用户使用记录得到,知识过滤模型建立在知识库的基础上,提供推荐和服务。

3.4用户知识过滤模型构建

用户第一次登录时,系统需要初始化用户信息,归类用户所属的知识团体。由于没有用户的使用记录,可以通过用户填写的个人资料(如专业、兴趣爱好等)进行归类。如果用户允许,还可以根据用户的邮箱联系人地址信息(很多社交网络如豆瓣网、天际网都是利用这样的方法),快速形成用户的社交网络(1度空间),归类用户所属知识团体。

由于用户所属的知识团体可能不同,因此,同一资源对于不同用户的价值也可能不同。知识过滤模型会计算每一个数字资源对用户的价值(通过Blog文章或馆藏资源的点击数量,用户的评论和打分,搜索关键词、收藏和标签),从而构建起知识库。图3以用户评论对一个数字资源价值的影响为例,给出了一个计算数字资源价值的方法(属于知识过滤模型的一部分),最终向用户推荐排名靠前的数字资源。

具体过程如下:①用户登录后,会首先判断用户所属知识团体;②当用户查看某一数字资源时,其他用户对该资源的评论会影响该资源对此用户的价值。这里,不同用户的评论对该用户的参考意义不同:与此用户属于同一知识团体的用户评论价值大于非同一知识团体的用户评论价值,同一知识团体内关键人物的评论价值大于一般成员的评论价值,因此,k1>k2>k3;③资源得分大于事先设定的推荐门限时,向用户推荐该资源,否则,计算下一资源的得分;该资源被推荐次数大于事先设定的门限时,将该资源放人相应知识库,继续计算下一资源。

同理,Blog发文和回复、搜索、标签也都将作为计算数字资源价值的指标,通过综合评估。计算出这个数字资源对特定用户的价值,并据此判断是否推荐。

4结语

六度空间理论和弱连带理论为我们发现数字图书馆中的社会网络关系提供了理论基础,并行生产理论和长尾理论为我们提升数字图书馆服务提供了思路,社会网络分析为我们具体的操作提供了可行的方法。社会网络在互联网上的应用代表了互联网更深层次的变革,这是一种能让计算机学会“理解”人类意图的新型网络形式,基于社会网络的数字图书馆模型正体现了这一思想,数字图书馆的用户构成了若干社会网络关系,每个用户的每一个行为都可能与其他用户产生联系,本模型就是希望充分利用这种联系,把数字图书馆打造成更高质量的知识服务平台。