前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇信息资源服务范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
信息资源云服务是通过云计算将分布式的信息资源进行资源整合、信息分析、数据挖掘等一系列操作后,为用户提供满足其信息需求的一种云端服务模式。信息资源云服务的客体是信息资源,主体则为云用户,在信息资源云服务体系中,大部分信息资源都存储在云端,因此,信息安全成为一个不得不考虑的问题,而这一问题牵涉信息资源云服务体系的各个方面,要想解决信息资源云服务的安全就必须结合通过云计算构建信息资源的流程及方法。信息资源云服务体系主要涉及资源层、用户层、服务层三个核心层次。
1.资源层与安全风险资源层是信息资源云服务体系的基础,旨在为用户提供满足需求的丰富的信息资源,主要通过终端输入和网络爬虫的方式采集信息资源后进行存储,建立资源池并生成信息索引。终端输入是信息资源供给方将本地的信息资源数字化后上传到云端服务器,而在数据传输过程中或许会面临遭遇网络攻击与重要信息资源被截取的可能,即信息资源传输风险,从而造成巨大的损失。资源层采集信息资源的另一种方式是网络爬虫,即网络爬虫是一种按照一定的规则自动抓取万维网资源的程序或者脚本,能在抓取一个或若干个初始网页的URL和网页内容的同时通过数据库比对、自然语言理解、交叉语言检索、数据挖掘等技术进行提取并建立自身的数据库。信息资源云服务的目的之一在于共享,但为保持各个信息资源供给方自身的优势,又有必要保留其特色信息资源,并且只能通过接口的方式访问,而网络爬虫的肆意抓取将会导致诸多信息资源供给方面临信息资源访问权的风险。另外,云存储风险是存在于资源层中的较大问题,云端数据的丢失将使整个信息资源云服务体系失去作用,例如,微软提供SIDEKICK服务曾中断了一个星期,导致用户不能访问自己的邮箱、日历还有其他个人数据,并且微软最后也承认这些数据无法恢复。因此,信息资源云服务中数据的完整性、可用性、保密性是开展云服务的基础。
2.用户层与安全风险信息资源云服务体系中资源池的构建不仅取决于云端信息资源的储备,也涵盖用户这一层面。在整个信息资源云服务体系中,云用户的信息需求直接影响信息资源的构建方向,云用户的个性化特征将指引服务模式的创新,因此,用户与信息资源云系统的交互在服务体系中担当着不可估量的角色。两者之间的交互具体体现在用户根据自身的信息需求向信息资源云系统请求服务和信息资源云系统分析用户信息行为两个方面。第一个方面,用户在请求服务前必须登入自己的云端账户以获取自己所需的信息资源。信息资源云服务的构建中用户分为普通用户和管理员用户,不同的用户拥有的权限必须有所区别。在信息资源云系统针对不同用户提供服务时,许多信息资源都要经过二次加工后才能满足用户的需求,而这类加工操作则必须由信息资源云系统的管理员才能完成,因此,权限的设定在服务中尤为重要,否则将引发管理权限风险。第二个方面,为了提供更好的个性化服务,信息资源云系统需要对用户的信息行为踪迹进行收集和分析,通过数据挖掘等技术发现用户的隐性需求,这也是云计算中普遍使用的一种方法。用户的个人信息行为属于用户隐私的范畴,因此云计算提供的服务与用户隐私间存在着持久的矛盾,对用户个人信息行为的分析是云计算提供更好服务的前提,但此举实际上又侵犯用户个人隐私。对于普通用户而言,用户隐私保护也是信息资源云服务的构建中迫切需要解决的问题。
3.服务层与安全风险信息资源云服务层为用户提供信息资源的检索、个性化定制、推送、云管理等信息资源云服务。信息资源云服务体系中使用的是公共云、私有云和混合云三种模式。信息资源公共云是第三方提供商为信息资源用户提供的能够使用的云;信息资源私有云是为一个信息资源用户单独使用而构建的,提供对数据、安全性和服务质量的最有效控制(这里的用户通常是信息资源方);而信息资源混合云则是两种云的混合,具备两者的基础特征。在信息资源云服务中,三种云之间的访问应是无缝连接的,能够同步完成信息资源的检索、个性化定制、推送等操作,要实现这些功能,必须拥有信息资源云管理的统一标准。轻量目录访问协议(LightweightDire-ctoryAccessProtocol,LDAP)是一个用来目录信息到许多不同资源的协议,能够构建一个这样的通用平台。LDAP通过TLS(安全传输层协议)和SASL(简单认证和安全层)来保证信息传输的安全性,但最近在拉斯维加斯举办的黑帽大会上,安全研究人员AngeloPrado、NealHarris与YoelGluck披露了一种名为BREACH(超文本自适应压缩浏览器勘测与渗透)的新技术,该技术能够获取来自SSL/TLS加密网络流量的敏感信息,并且三位研究人员声称,BREACH技术能给采用加密机制、算法的大部分TLS/SSL带来巨大威胁。由此可见,数据的安全传输在信息资源云服务层中是一个很大的问题。所以,信息安全问题在信息资源云服务体系中主要体现为:信息资源传输风险、资源访问权的风险、云存储风险、管理权限风险、用户隐私保护问题、数据的安全传输等几方面,归类后,安全问题可划分为信息资源过程管理和用户管理两大模块。
二、信息资源云服务中信息安全技术的应用
1.信息资源过程管理与信息安全技术信息资源过程管理包括信息采集、信息组织加工、信息存储与检索、信息服务四大子过程。在对信息资源进行云管理之前,可根据重要性对本地数字化的信息资源和网络爬虫抓取的信息资源划分为一般信息资源、重要信息资源和信息资源。一般信息资源的目的在于分享,其重要性往往较低,在信息资源安全问题的管理上,可采用HTTP(超文本传输协议)或HTTPS(安全超文本传输协议,采用完全套接字层SSL作为HTTP应用层的子层)的方式直接进行传输,以保证其使用效率,改善用户体验。重要信息资源旨在为拥有更高信息需求的用户提供服务,包括许多经过数据挖掘、信息分析和多次加工后的信息资源,这些资源也是增强用户对信息资源云服务粘合度的重要原因之一,因此有必要对这类信息资源进行进一步的加密,实现技术为可在信息资源云服务器上部署云端加解密模块。本地的重要信息资源数字化后,经过数字水印技术和AES(AdvancedEncryptionStandard,高级加密标准)算法加密后,通过VPN技术在公网上封装出一个数据通讯隧道,上传到云服务器,而网络爬虫抓取的信息资源则直接通过云端加密模块进行加密后保存。由于通过VPN技术访问信息资源的速度会降低不少,并且许多VPN技术受网络环境及使用平台影响的复杂程度也不尽相同,因此会导致用户的使用效率受到影响。在保证信息资源安全性的前提下,为了尽可能地提高使用效率,可采用SSLVPN协议。SSLVPN结合了SSL和VPN两者的优点,SSL处于网络结构体系的传输层和应用层之间,因此SSLVPN几乎支持所有的WEB浏览器,这也意味着用户不需要为了获取SSLVPN的支持而安装第三方软件,符合云计算开发的初衷。用户通过SSLVPN协议访问重要的信息资源不仅不受平台的限制,而且能极大地提高使用效率。信息资源理论上并不适合保存在云服务器上,其资源池的建立是为了解决部分用户因地域限制等因素而无法及时获取自己所需的那些保密性较高的信息资源。为保证这类信息资源的安全,可使用多重技术,即用户将访问保密信息资源的请求经数据通讯隧道发送给信息资源的另一服务器,由该服务器将请求转发给原始服务器,并最后得到所需的信息资源,这样做的目的是为了隐藏用户的目的及信息资源请求的来源,最大限度地保证这些保密信息不被窃取。信息资源能够保证使用的前提是其完整性,为了避免由于物理因素、网络安全风险、人为因素等引起的数据丢失、信息更改的现象,应适时采用云备份与磁盘备份相结合的方式对信息资源进行数据备份。
2.用户管理与信息安全技术用户的管理主要涉及用户权限管理和用户隐私保护。根据用户层对用户的分类,不同权限的用户拥有不同的访问权,在用户权限管理上应用的信息安全技术为信息确认技术和网络控制技术。信息确认技术的核心为涵盖消息确认、身份确认和数字签名的信息确认系统,对于需要一般信息资源的用户通常可采用静态密码的方式来确认身份,访问重要信息资源的用户则必须开通动态密码服务来获取身份的确认,而针对那些与信息资源有关的用户可根据实际情况采用生物识别技术。同时对普通用户和管理员而言,两者也不能出现超越限制权限的行为,否则会引起信息资源云服务的隐性风险,因此云服务器有必要通过网络控制技术来规范其行为,最典型的即为防火墙技术,通过该技术既能够允许获得授权的外部人员访问云服务器,又能够识别和抵制非授权者的访问。实际上,现有的防火墙技术并不能完全保证信息资源的安全,也存在被黑客突破的可能性,一旦突破,信息资源将完全呈现出来,同时外部用户的身份认证技术也无法解决这一问题,为此需要对信息资源本身的文件操作制定相应的规则,而这一技术就是主动防御系统(Host-basedIntrusionPreven-tionSystem,HIPS)。HIPS不仅能够限制用户的行为,也能保护用户隐私。HIPS包括应用程序防御体系、注册表防御体系和文件防御体系,通过定制合适的规则可实现对运行程序、注册表和文件读写操作的控制,在一定程度上可防止用户访问权限外的信息资源,同时也能保证用户的行为不被云服务器肆意跟踪。以上几种信息安全技术的综合应用将使用户管理更趋科学化、合理化。
三、结束语
本文从政务信息资源整合的需求出发,首先对信息资源整合的国内外发展情况以及相关的技术进行综述,并对政府组织结构和政务信息资源等特点分别进行建模分析,在此基础上,基于 WebServiCes思想和目录结构重载了政务环境下目录服务的概念,构筑了异构政务信息资源目录服务模型。在该模型框架体系中,主要分为三大主要子模型,一是政务目录服务资源信息模型、二是资源互动双方通信模型的建立、第三,也是尤为重要的一部分即政务信息资源目录服务中心模型的构筑。
在建模过程中,首先对模型总体架构及层次结构进行研究阐述,构筑信息子模型和通信子模型并利用WSDL以及SOAP等协议给出其实现机制。文章着重探讨了注册过程子模型,核心研究了目录服务中心的构建策略,主要包括基于缓存和排队机制的服务中心注册策略研究,利用并行注册方式缓解目录服务中心大规模信息资源注册压力问题;基于元数据的信息资源存储策略研究,利用元数据映射将注册资源映射为适于政务领域资源表述方式及目录服务中心的存储形式;采用适用于中国国情和政府组织结构的资源分类标准,设计目录服务中心注册资源目录体系结构,并采用个性化目录描述器设计资源目录展现策略;最终对模型查询处理策略进行了研究,并利用多种手段对其优化处理,形成了一套完整的目录服务中心模型构筑策略的研究。
政务信息资源目录服务模型的构筑研究及其在政务领域信息资源整合中的应用,可以轻松实现异地异构政务信息、资源透明共享、交换与集成,并且通过合理目录体系结构的设计及导航,分布环境一F孤立复杂资源得以关联,无序的资源得以有序化,为使用者提供“一站式”信息资源查找和定位服务,使用户得以以最短路径寻找到需要的信息,实现分布式异构多元信息源有效的整合。本文的研究为政府海量信自、资源整合的进一步研究提供了参考,对实现政务信息资源增值,促进资源发现、共享与利用效率具有理论价值和现实意义。
关键词:电子政务;信息、资源整合;
绪论
十六大指出:“信息化是我国加快实观工业化和现代化的必然选择。坚持信息化带动工业化,以工业化促进信息化”。政府作为国家信息化的先行者与实践着,己把电子政务作为政府工作和国家信息化建设的重要战略,并力图通过电子政务的建设与应用来带动相关产业群体的建设与发展,促进整个国民经济的发展、提高现代化管理水平、政府行政效率以及工作的透明度等。政务信息资源作为电子政务建设的基石与核心,产生于政府行政过程中并直接影响政府施政的准确性与高效性。
资料表明,政务信息占社会总信息量80%以上,这些信息资源作为国家发展的战略资源,受到各级政府、企事业单位乃至全社会的关注。从地位上看,它在一个国家政治、经济、科技、军事、文化领域中具有重要的战略意义;从作用看,它是政府部门、企业单位、公众个人社会经济活动以及信息内容产业发展普遍需要、不可或缺的重要资源。电子政务的有效运行,也必须以这些海量的数据和信息为基础。
1.1问题的提出
政府办公自动化、行政审批、决策支持等电子政务业务,都以数据和信息的存储、交换、共享为基础。因此,有效管理、合理开发和利用政务信息资源对促进政府职能转变、提高行政效率、增强监管和服务能力、推动全社会信息化持续健康发展有重要意义。为在施政过程中获得最有力信息资源支持,并能够最大限度的管理利用现有信息资源,
我国各级政府加大力度建设电子政务应用系统,这些系统局部提升了政府工作效率,但是仍旧不能够满足政府跨部门及与全社会业务协同的需要。信息资源开发利用的发展极不平衡,存在急待解决的问题:
(l)政府部门信息独占性严重。电子政务建设至今,虽然信息资源服务范围发生变化,但资源的开发和管理还以政府为主体,据统计,政府控制着国内约80%的信息资源,而电子政务推行的“十二”金工程更是进一步确立了政府部门对信息资源的高占有率和权威性。并且,由于政府对国家管理的特殊性和长久以来形成的封闭思维观念,导致真正开放且流动的信息资源不能够满足市场和社会发展的需要。
(2)政务信息资源查找困难。一方面由于海量信息资源无序而杂乱的分布在政务资源网络中,缺乏统一的管理;另一方面政务信息资源广泛存在于分布式环境中,资源拥有部之间缺乏有效的共享机制与协同技术,导致信息需求者难以发现既存资源。
(3)政府各部门间信息资源难以相容。一方面由于政府部门各自为政,政务信息资源缺乏统一采集标准,数据类型、格式与存储方式差异严重,导致部门间信息资源不一致、政务信息资源目录服务模型研究不完整;另一方面政务信息资源多方采集、重复采集现象普遍,数据不能同步更新,造成部门间信息资源不一致。
(4)政务系统难以互联互通。一方面由于缺乏统一规划,各政务系统分散建设,缺乏交互接口,导致系统难以兼容,信息资源难以共享信息孤岛现象严重;另一方面系统构建技术多样化,难于实现系统间互联互通。这些全部直接影响信息资源的管理利用,使信息资源的价值不能够充分发挥,导致政府业务不能进行顺畅、高效的衔接,行政效率低下。
为了解决上述问题、提高政府工作效率,充分利用政府以及社会中的信息资源,必须提供有效的技术手段整合现有的信息资源,提高政府部门对信息资源的共享水平和利用效率。
【关键字】 SOA 信息资源 资源服务 一体化管理一、建设背景
福建烟草经过多年信息化建设,形成一套结构合理、内容完善的应用系统体系,有效支撑企业各项业务应用,也由此产生了一定量级、多个类别、各类主题的信息资源群。由于以往信息化建设缺乏对信息资源体系统一规划,企业信息资源存在架构不明晰、标准不一致,管理不规范,分类不合理,应用不深入等问题,导致企业信息资源利用存在“找不到,不会用,用不好”的问题,制约信息资源价值的充分发挥。
“十二五”以来,全行业高度重视信息资源建设工作, 把提升资源共享利用水平作为信息化建设的出发点和落脚点。国家局 “CT155”发展规划明确指出:要高度重视信息资源的深度开发利用,努力实现集成整合、协同共享,真正发挥各类信息资源的综合价值,充分体现信息化效能,支撑决策科学化,构建面向行业的信息资源共享服务体系。福建烟草“十三五”信息化规划要求:做好信息资源规划,统筹信息资源开发利用,加强资源信息化管理,实现信息资源的标准化、平台化、服务化。
面对现状,根据国家局、省局相关要求,我们研究并开发 “福建烟草信息资源服务平台”,为福建烟草实现对企业信息资源的一体化管理提供信息化支撑,有效解决信息资源管理混乱、冗余建设、重复开发、交互不便、共享困难的问题。
二、系统组成
2.1系统架构
信息资源服务平台按系统架构分为企业资源层、服务交换层、管理平台层和服务使用层。
企业资源层:按照资源结构特征,将企业信息资源分为标准、数据、指标、报表和应用组件五大类。其中,标准资源是指各类管理标准和技术标准。数据资源是指由信息系统产生的、可供共享使用的企业经营数据;指标是对企业经营数据的加工结果,反映企业各类运行情况;报表资源是数据面向业务应用的表格化展示;组件资源是应用系统中可供共享使用的功能单元。
服务交换层:交换服务层主要是企业服务总线,为数据交换提供了一个互联互通、可移植性和安全性的标准接口,是实现服务交互的基础。
管理平台层:管理平台实现信息资源逻辑层面的汇聚和分类,辅助解决信息资源的“进、退、管、用”的问题,提供信息、综合检索、资料下载等功能,方便用户更好地了解和使用各类信息资源。
服务使用层:主要是使用信息资源的各类用户,比如开发商、集成商、资源管理用户和普通用户等。不同的用户有不同的系统使用权限和规范。
2.2系统流程
资源建设阶段:包括资源发现、资源开发、资源测试三个环节。资源发现是指在新建或改造系统中,从资源共享的角度出发,确定信息系统中可提炼的共享资源。资源开发是指按照规范化、标准化的要求进行共享资源的提炼和服务化封装。资源开发完成后,进行功能性和标准性测试,确保符合平台的集成要求。
资源管理阶段:包括资源、对接管理、运行监控和资源维护四个环节。资源是指共享信息资源经过测试后,注册并到平台中。对接管理是指对各项服务接口进行集中管理,进行接口启用和停用等。运行监控是指对资源服务的服务质量进行监控。资源维护是指根据运行情况对信息资源进行更新维护。
资源服务阶段:包括资源申请、资源使用和资源评价三个环节。资源申请是由资源使用者通过规范化的流程向管理部门提出资源使用申请。资源使用是指通过平台进行资源使用。资源评价是指服务使用者反馈使用过程中存在的问题。
三、技术实现
3.1资源标准化
通过配套文件《信息共享用集成规范》来约束信息资源的建设、管理及应用过程,实现对信息资源建、管、用的标准化管理。
建设标准化:针对正在或即将建设的信息系统,规定其必须遵循已制定的信息分类编码标准、数据元标准、主数据标准、信息交换标准等信息化标准,保证新产生的信息资源在编码方式、数据结构、接口参数等方面同现有资源保持一致;针对已建信息系统产生的,经研究认定需要纳入平台进行统一管理的信息资源,通过代码转换、数据清洗等方式对资源进行加工处理。
管理标准化:首先,做好信息资源分类管理。将信息资源分为标准、数据、指标、报表、应用五大类,通过资源描述、资源内容、使用规范三方面描述信息资源结构,使信息资源能够准确定位,便捷使用。其次,做好信息资源的生命周期管理。对 “进、退、管、用”核心环节进行标准化流程管理。
应用标准化:为充分发挥信息资源的综合价值,避免信息资源的重复开发和冗余建设,通过下发制度文件,对信息资源实行强制使用。已集成、的信息资源,新建系统应通过资源调用集成现有资源,原则上不得重复开发和单独建设。在申请使用信息资源前,应通过服务平台掌握目前信息资源现状,根据资源现状做好需求分析工作,明确资源调用清单、方式和频次,并提交使用申请。
3.2资源服务化
平台采用基于SOA的平台架构,其集成的资源通过服务化封装,以WebService的方式通过企业服务总线向服务使用者提供各类信息资源服务。平台了一系列规范指导信息资源的服务化,主要包括:
服务消息规范:对服务调用和反馈信息的消息格式进行严格约定,服务消息要求按照XML格式进行传输,并明确出包头和包体的具体封装格式,确保平台能按照预定格式进行解析。
服务接口规范:在资源开发时,开发者需遵循 “建设标准化”要求开发相应的Web服务接口。服务接口描述如下:
服务对接规范:主要包括服务使用申请、服务交易令牌、服务报文封装、API调用方式、解析服务报文、服 务联调测试。
3.3资源平台化
信息:在平台上最新的信息资源建设、应用和监控信息,让使用者能够及时了解信息资源建设动态,被使用情况和运行质量反馈等信息。
集成展示:按目录化的要求,在管理后台,根据福建烟草信息资源整体框架做好信息资源的目录管理,在展示前台,根据资源目录向使用者提供分类别、分主题、结构化的信息资源清单。
综合检索:提供按类别、主题、关键字等多维度综合检索功能,并实现资源内容的快速定位,使用者能方便、快捷地找出自己想要的信息资源。
资料下载:平台不单管理信息资源的内容,还包括资源描述和资源使用规范,使用者可对这些材料以文件的形式进行打包下载,以指导信息资源的实际应用。
使用申请:借鉴“商品购物车”的模式,使用者可以浏览并将各类资源加入“资源购物车”,进行资源的统一使用申请。平台能够根据资源条目、用户信息自动生成格式化的申请审批文件,以便使用者向信息管理部门申请使用资源。
运行监控:信息资源以服务的方式提供给信息相关方使用,资源使用者和管理者可通过平台掌握资源服务运行情况,如请求时间、报错信息、传输数据量等。
四、应用效果
1)加强资源共享,降低系统开发成本。通过信息资源的标准化、服务化和平台化,服务平台为信息资源共享提供了规范、高效、便捷的渠道,有效预防信息资源重复、冗余建设,降低信息系统的开发成本。自上线以来,平台充分利用企业现有信息资源向统一门户、ISO系统、电子监察系统、专卖内管系统等11个应用系统累计提供标准服务243项,数据服务140项,指标服务89项,报表服务47项,应用服务23项,为各个应用系统在接口对接方面缩短1/2以上的时间,降低接口集成的开发成本1/4以上。
2)强化资源整合,提高资源效益产出。基于信息资源的标准化,通过服务平台实现了信息资源的高效整合和集中展示,满足了企业跨地域、跨业务、跨系统的集成整合需求以及数据关联分析需求,充分发挥了信息资源的综合价值。解决专卖和营销系统间的8项集成需求,营销和物流系统间的12项集成需求,人力与相关业务系统间33项集成需求,充分发挥了信息资源的整合价值,提高了资源的效益产出。
3)促M标准落地,支撑一体化平台建设。通过服务平台,实现标准和宣贯,有效促进企业信息资源标准体系建设和落地,从而为企业一体化平台建设提供强有力支撑。目前,在平台上项目管理、网络基础设施、运行维护、信息安全、数据中心等五大类信息管理标准共23项;各类信息资源标准1164个,其中数据元标准1023个、信息分类编码标准123个,主数据模型标准18个。平台为用户了解标准、获取标准、反馈信息提供了便捷渠道,有效推动了企业信息标准化的建设。
参 考 文 献
[1]张春芳,孟杰; 基于SOA架构的内蒙古烟草应用集成平台研究与实现; 内蒙古农业大学学报:自然科学版》 ;2013
1基于个性化服务的信息资源整合问题的提出
1.1个性化信息服务对信息资源整合的要求
以用户为中心的个性化信息服务模式,是指为了方便用户利用其各种数字化资源,充分利用各种智能化技术对不同类型、不同特点的数字化资源进行整合,实现信息资源、信息技术、信息内容的集成,使目前信息资源组织系统的公共用户界面变得简单、友好,并且使用户能利用同一检索表达式或检索词对各种数字化资源进行同步检索,实现同一主题信息资源的一步到位的检索与查询。同时,还可以根据某些用户特定的信息需求定制具有个性化特点的用户界面来提供符合其特定需求的具有个性化特点的信息和信息服务。
个性化的信息服务是以信息资源整合和信息服务集成系统的建立为基础的,如果没有完备的资源整合体系作后盾,无缝的、贴切的、高效的、主动的、一站式的信息服务模式则是无法实现的。
个性化信息需求及服务要求信息资源必须进行整合。
由于目前的信息资源组织体系并没有将其提供的各种信息资源整合为一个整体,只是简单地将各种商用数据资源和非商用数据资源连接到机构网站上提供信息服务。所以,目前绝大多数信息资源组织体系给用户提供的用户界面是一个既相当复杂又不考虑不同用户信息需求差异的公共用户界面。用户使用不同的资源往往需要使用不同的检索软件并需要对路径及其它一些参数进行必要的设置,这样就大大增加了用户检索和利用数字化信息资源的麻烦。[1]
目前信息资源组织体系中各种数字化资源的非整体化状态,致使其用户界面复杂单一,检索方式迥然不同。即使专业检索人员要查检有关某一主题的信息资源,也是一件相当麻烦和复杂的事情,更何况绝大多数用户并不了解各种检索技术、各种数字化资源的结构特点,且信息需求各异。所以,把信息资源组织体系诸要素有机地链接成一个整体,使得一般用户在一个简单、友好的公共用户界面上,利用一个检索表达式或检索词,能得到面向主题的“一步到位”的信息服务,是信息资源组织发展的必然趋势。建立以用户为中心的集成信息服务与个性化定制服务相结合的用户服务模式,是信息资源组织体系满足信息用户多元化、多层次、个性化信息需求,改进数字化资源的利用率,提高服务质量的必由之路。[2]
1.2基于个性化服务的信息资源整合
信息资源整合是一种信息资源优化组合的存在状态,是依据一定的需要,对各个相对独立的资源系统中的数据内容、功能结构及其互动关系进行类聚和重组,重新结合为一个新的有机整体,形成一个效能更好、效率更高的新的信息资源体系。信息资源的整合程度直接关系到信息资源能否被高效吸收与利用。
整合是连接现代信息资源组织与传统信息资源组织的桥梁。传统信息机构已建立起大量的电子化、网络化的书目数据库系统,指引读者使用图书馆馆藏。最著名的书目数据库是OCLC的WorldCat数据库[3],该数据库集合了全世界3万多个图书馆的4000万条书目记录。这些用MARC格式保存的书目记录自然应该成为信息资源组织体系的一部分。由于数字化信息只是人类信息的一部分,传统方式组织的书目信息也将日益增长。所以要将数字化信息与非数字化信息有机地联系起来,组成一个广泛的、有序的和完整的信息组织体系。由于传统书目信息和数字信息资源的组织,在技术和标准等方面有较大的差别,怎样建立起这两种信息组织之间的对应关系,也是信息资源组织研究的课题。[4]
基于个性化服务的信息门户将数据库、数据仓库和文档中的信息转变成可利用的信息,并把这些信息传送到用户面前。通过集成化的方法把原有应用系统通过一个核心组件服务器(即应用服务器的服务之一)集成在一起,能够获取其他应用系统中的相关数据和消息,所有独立的、分散的应用系统通过事件、消息和数据的相关性集成为一个有机整体。由于分布、异构的信息系统将是数字信息环境的主流形态,因此整合检索和整合浏览是网络环境下信息服务的迫切要求。目前虽有多方面的探索,但仍处于初步发展阶段。而互操作性又涉及系统的、语法的、结构的和语义的4方面的问题。我们不可能奢望已存信息系统以及即将建立的信息系统全部实现标准化。我们只能最大限度地追求接口标准化,实现跨主题信息网关检索,从而为用户提供高质量的信息检索服务。[5]
信息资源整合应立足于信息资源系统结构性优化整合。系统的结构性是指系统中各要素之间所形成的某种关系,是系统有机联系的反映。相同的要素具有不同的结构形式时,系统就会产生不同的功能和效果。
信息资源系统的结构整合包括横向和纵向结构整合。横向结构指的是信息资源专业学科上的相互关联性,横向整合即对不同的数据库中相同学科专业的信息资源进行优化整合。纵向结构指信息资源在空间上的相互关联性,纵向整合即是将不同学科专业的信息资源整合为具有多维立体网状结构的有机知识整体。
结构是功能的基础,结构决定功能。要发挥信息资源系统的整体功能,必须合理地整合结构,构建有效发挥功能的信息资源体系结构。[6]
基于个性化服务的信息资源整合方式优势有:首先,能够整合多种渠道多种媒体的数字信息,不仅包括文字、还包括图像、音频、视频等不同载体、不同介质的数字信息。其次,能够实现不同类型、不同级次(一次和二次)资源间的链接,建立其图书、期刊、会议、机构、人物等科学研究所需核心资源和相关资源间的整合与链接关系。第三,能够保持知识体系的整体性和关联性,通过知识因子的有序化和知识关联的网状化,沟通相互隔绝的学科领域,使之成为相互渗透、相互作用的有机体,发挥科学知识的整体功能。第四,能够形成具有新的组织结构和功能的资源系统。这种整合不是简单的集合和链接,而是剔除冗余、重复和劣质信息,形成一个获取便捷、利用率高的新的信息资源体系。[7]
理想的信息资源整合把各种信息资源透明地、无缝地链接在一起,让用户十分方便地使用这些资源而感觉不到他的每一步操作所调用的可能是不同的资源。
在个性化知识组织门户中,经过信息资源的整合,提供统一的检索界面,用户的信息利用将会变得非常便利,这也是数字资源开发、组织和管理所追求的一个重要的目标。
2个性化知识门户中信息资源整合的构想
在个性化知识门户中,信息资源的整合与系统组织形式有:建立开放资源系统、信息资源的整合导航、信息资源的无缝链接与动态重组。
2.1建立开放资源系统
从技术角度,个性化知识门户采用开放结构,开放地集成各种分布、异构和多样化信息资源和服务系统,动态构建满足各种用户群或业务流程需要的虚拟信息服务机制。
之所以采用开放体系,是因为用户面临的是一个分布的信息环境,需要充分利用各种现有和未来的、自建或引进或链接的、采用各种技术平台和数据模式的资源与服务系统,无论这些系统分布在什么地方。为了支持用户在分布环境中搜寻、获取和利用信息,个性化知识门户需要能够对分布和多样化的资源和服务系统进行搜寻、调用和集成,支持互操作和整合处理以及相应的集成管理,形成逻辑的集成服务。而这一切,又要在信息技术和用户需要不断发展、信息资源组织技术和体系结构不断变化的情况下建立,因此必须在按照一个逻辑体系来构建相应的资源与服务体系的同时,争取适应新的技术与机制(包括新的资源与服务类型)的发展。[8]
开放资源系统建设的目标是:制定信息资源系统和服务系统的开放描述、开放数据接口和开放服务接口规范,建立对资源系统数据进行系统化定制加工和个性化组织的政策机制和权益管理机制,建立对服务系统功能与流程进行系统化集成和个性化重组的政策机制和权益管理机制,支持第三方(包括市场力量)按照规则开发、组织和提供个性化知识化特色服务。
2.2信息资源的整合导航
信息资源整合强调导航能力,因为信息资源组织体系提供的信息,不管是专业性的还是综合性的,如果不提供导航能力,用户就像是在大海中迷路的船只一样。导航的途径是多种多样的,既有基于资源类型的导航,也有基于知识分类体系的导航,同时也可以按照字顺浏览等。美国国家教育图书馆上,就按照资源的提供网站,向用户提供导航,让人一目了然。OhioLink提供了按主题浏览、资源类型、首字母来提供导航功能。[9]
笔者认为,随着数字化进程的加快,信息资源数量将会越来越多,在基于个性化服务的信息资源组织系统中,全面收集信息资源的相关信息,提供包含刊名、URL、数据库来源、ISSN、学科分类、主题词、资源类型、出版机构、使用权限、刊物被著名检索系统收录情况、刊物通信地址、刊物简介等在内的导航服务十分必要。同时应重视对引进数据库资源的开发研究工作,建立基于信息资源共享的信息机构联机电子资源检索平台,并提供各信息机构的虚拟馆藏信息,以便开展电子资源的文献传递服务。
中国科学院国家科学数字图书馆为支持科研用户方便有效地搜寻、发现和选择利用各种数字信息资源和其它信息资源,建立多个分布的学科信息门户网站,提供权威和可靠的学科信息导航,整合学科信息资源与服务系统,将学科信息资源与服务整合到用户桌面。[10]
2.3信息资源的链接与动态重组
在信息资源组织系统中,普遍存在着信息资源分散组织的现状。如不同格式的电子文档、多媒体文件无法实现统一管理和查询;基于关系数据库建立的业务系统无法高效地完成内容全文检索和主题检索;自建数据库和引进的数据库系统由于来源、所用管理系统的不一,各数据库信息资源之间无法实现统一维护管理,资源与资源之间缺乏按照知识主题的整合,各个分散的资源之间缺乏有机联系,不同信息资源无法实现集中、统一地上网并实现检索界面、检索方法的统一。
所谓信息链接与动态重组,指在已建立的信息资源体系基础上,将有关信息内容链接起来形成新的信息链或信息集合,从而实现信息的重组。[11]这种链接重组重要不依靠作者事先建立的链接,而是专门建立相应的链接机制,有意识地根据用户的特定需要和信息内容内在关系来进行面向用户的信息组织,可以看成是用户界面层的信息组织机制。
在基于个性化服务的信息资源组织系统中,要实现信息资源的无缝链接,即通过统一界面方便快捷地检索到信息资源组织体系内的所有分布式异构资源,实现统一检索界面、统一检索平台、统一用户认证。
在系统内实现对这些多源异构数据的统一管理;为异构、分布式资源提供统一的权限管理机制和安全机制;对多源异构数据的统一和检索;在统一管理和统一检索的基础上为用户提供个性化服务。
使用MARC格式对网络学术数据库的电子资源进行整合,将“实体资源”与“虚拟资源”融于一体,建立基于OPAC的一站式检索,提供“一站式”(One-stopShopping)信息服务。
2.3.1信息链接与动态重组的形式
信息链接具有多样化的形式,如:
(1)知识性链接。主要是信息内容与相关的知识组织体系链接,包括与词汇表、叙词表、分类表等的链接,通过建立链接可解释有关信息内容、按知识组织体系显示及组合信息内容,或进一步支持利用知识组织体系的映射。
(2)参考文献链接。主要指文摘索引与它们所标引的文献之间的链接,
目前已成为各个文摘索引和全文期刊出版系统的标准功能之一,并逐步走向跨出版商跨系统的、可本地控制的开放式链接机制。
(3)引用网络链接。主要链接引用目标文献的文献、被目标文献引用的文献、同被引文献、引文耦合文献等。这类系统往往融合参考文献链接功能,但能进一步通过引文关系来链接相关文献,还可对引用链接实行动态更新,从而形成一个以文献为中心的不断更新的相关信息集合。[12]
(4)语义链接。主要是利用语义网络和概念集等,将信息内容与那些虽然没有直接语言关系或引文关系,但有一定逻辑联系的信息内容连接起来,例如关于某一疾病的文献与那些和该疾病有并发关系的其他疾病的文献链接起来。语义链接需要知识组织体系和推理的支持,往往体现为虚拟的动态的链接。
(5)重组性链接。其重点不在具体文献的检索,而是对一批信息内容按照特定体系重新组织,而这个体系可能是动态定义和个性化的,例如个性化资源系统,按不同分类体系或同一分类体系的不同层面组织资源体系,按主题分类组织检索结果。[13]
2.3.2信息链接与动态重组的模式
在个性化信息资源组织体系中,需要对信息资源进行链接与动态重组,其方式有浅入深依次为:书目管理系统OPAC与数字资源的整合、通过联合检索达到一定程度的整合、建立统一元数据库通过整合检索达到更高层次的整合。
(1)书目管理系统OPAC与数字资源的整合。书目管理系统OPAC与数字资源的整合有两种方法:第一种方法是通过元数据融合达到统一检索的目的,第二种方法是通过建立关联达到相互调用的目的。(2)通过联合检索达到一定程度整合目的。它的实现有两种方法:一是通过执行Z39.50协议,聚合不同平台上的异构OPAC数据库,建立书目整合检索系统。如上海地区图书馆所采用的“Webpac检索系统”的“多数据库检索”,可在统一检索界面上通过著者、题名、主题、关键词、标书号等途径,检索上海交通大学图书馆、华东师范大学图书馆、复旦大学图书馆、上海图书馆的OPAC书目信息,不需要在各个图书馆不同的OPAC界面间来回切换。二是利用数据商提供的MARC数据,根据图书馆制定的数字资源著录标准,将数字资源导入OPAC,形成实体和虚拟馆藏的书目整合检索系统。
(3)建立统一元数据库通过整合检索达到更高层次的整合。通过支持分布的数字信息系统间的互操作、无缝交换和共享信息资源与服务,构建一个逻辑的集成信息服务机制,并按数字资源的逻辑关系组织成立体网状、相互联系的知识资源系统。如中国试验型数字式图书馆,它的数字图书馆应用系统是进行数字化建设及整合各类数字资源的基础平台,实现资源的深层标引和分布式资源库的跨库链接。
3基于个性化服务的信息资源整合展望
信息资源整合与重组是个性化服务发展和信息资源多样性发展的产物。随着数字资源的迅猛发展和个性化服务的普遍实施,可供利用的信息资源层出不穷,资源整合与重组势在必行。但由于数据库集成开发商为了维护自己的利益,在制作数据资源的过程中往往对数据库进行了种种限制,如对数据库进行加密,使一般人难以读懂和理解其数据格式;同时还存在版权问题,这给信息资源整合与重组带来了一定的限制。目前,对资源整合与重组的探讨还处于萌芽状态,还是一个有待于探讨的领域。本文在个性化服务的信息资源组织中初步探讨了其资源整合与重组问题,其实现还有待于信息资源组织领域和数据库开发商的共同努力。
厘定思路,加强领导与规划
档案信息化建设必须坚持以档案信息资源为核心,以信息资源共享为目的,所以网络这个新生事物一经出现,便吸引了浙江档案部门的视线。借助因特网这个"第四大媒体",可以打破原来的边界束缚,让档案信息资源在无限宽广的领域得到共享,以此创建档案工作开放、积极、务实、人文的新窗口。
思路甫定,全省各地就紧锣密鼓地开始了筹划实施工作。经过前期的试点摸索,2002年8月,全省召开档案互联网站建设会议,对网站建设进行全面动员。会议要求各地以积极的态度、严格的制度、严谨的作风搞好网站建设,明确布置了各地的工作任务,组织各市档案局(馆)技术骨干进行网页制作培训。省档案局在做好引导工作的同时,积极向基层输送技术服务与咨询,帮助下面解决技术上的困难。
在实施过程中,针对各地网站建设的不同进度,省档案局不定期地信息通报,肯定建设速度与效果都较好的单位,督促、鞭策建设进度较慢的单位,以便保质保量地完成全省的预期目标。
独辟蹊径,开创档案网站建设的全新模式
浙江省档案馆尝试探索建立网站主要是依托电脑公司的技术力量,搭建了"浙江档案网",并于2001年7月正式接入Internet。"浙江档案网"的开通,受到了社会的普遍欢迎。截至2002年6月,网站的访问量达两万多人次。但是在网站运行中也暴露出不少问题,如开发成本较高、安全与维护的技术难度较大、与电脑公司的沟通比较困难等。省档案馆是全省档案网站建设的先行者,同时也是实验者,所以他们在工作中暴露出来的问题,给全省的网络规划与运作提供了借鉴与思考。
财力物力捉襟见肘,信息技术人员凤毛麟角,这似乎是档案部门的行业特征。为了找到适合档案部门特色的互联网站建设道路,解决束缚网站建设的人财物问题、技术准入问题、安全维护问题,实现轻轻松松建网、平平安安运行,作为全省的档案行政管理部门,省档案局煞费苦心,动了不少脑筋,经过多方探索与方案论证,终于找到了一条快速、便捷地构建全省档案网络的解决之道---"数字浙江"。
"数字浙江",是浙江省信息化重点工程项目,它为全省各地85%以上的机关单位提供了自助网站应用平台。这种自助式网站应用平台,可以让用户无技术障碍地建立网站,并轻松实现维护。每年只要缴付低廉的租金,就可获得充足的网络空间。这种低门槛的进入方式,使困扰档案部门已久的许多困难都能迎刃而解。
在全省的互联网建设会议上,省档案局要求各地以"数字浙江"为平台构建网站。已有网站的,也可以挂在"数字浙江"上,并且第一年租费全部由省局支付。这种简单、创新的运作模式,大大激励了基层档案部门的工作积极性,原先的畏难情绪也因此烟消云散。档案网站开始在浙江大地如雨后春笋般涌现出来。
巩固成绩,逐步实现从量的扩张到质的提高
截至目前,全省95个档案局(馆)中,已有94个档案局(馆)建立网站,其中除了8家单位保留原有的自建网站外,其余的网站都是依靠"数字浙江"网络平台创建的。
一个覆盖全省的档案网络体系已初具规模。
现在,只要通过省档案局(馆)的门户网站,就能搜索到全省各市、县档案局(馆)的信息,而且还能查到国内外主要档案网站的信息。从2002年11月起,省档案局无密信息和文件,都开始网上传输。
今后一个阶段,全省档案网站建设将调整工作重点,实现从量的扩张向质的提高的转变,这需要有大量内容充实网站,需要重点开发档案网站的核心功能,即要建设好开放档案信息查询与电子档案政务等栏目,积极拓展网站的辅助功能,让网上用户有档案资料可查,有档案工作信息可看,有历史知识可汲取,有档案文化可品茗,避免让他们成为匆匆过客,以此集聚档案网站的人气。2003年9月,全省组织优秀档案网站评比活动,推进各地档案网站质量与效益的提高。