首页 > 文章中心 > 关系型数据库

关系型数据库

前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇关系型数据库范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。

关系型数据库

关系型数据库范文第1篇

关键词:关系数据库 理论 实践

中图分类号:TP311 文献标识码:A 文章编号:1674-098X(2014)07(b)-0054-01

数据库设计(Database Design)是指根据用户的需求,在某一具体的数据库管理系统上,设计数据库的结构和建立数据库的过程。而关系型数据库则是创建在关系模型基础上的数据库,是借助于集合代数等数学概念和方法来处理数据,使之能够有效地存储数据,以满足用户的各种应用需求。

1 数据库的重要性

数据库设计是计算机软件设计的重要内容,同时也是支撑计算机软件系统运行的关键,是软件设计的起点,起着决定性的质变作用,必须对数据库的设计高度重视起来。

(1)数据库设计最起码要占用整个项目开发的40%以上的时间。数据库是用户需求的直观反应和表现,需求的要求和变化都要一一体现在数据库的设计中。

(2)数据库设计不仅仅停留在页面demo的表面,还有模块交互、表之间的联系、中转数据等所需要的字段。因此,在数据库设计中不仅包括基本的数据存储,还包括逻辑数据的存储。

(3)数据库设计完成后,项目80%的设计开发在脑海中已经完成了。在设计每一个字段时,已经考虑好这些字段的运用,在表中如何体现。当数据库设计完成后,程序中所有的实现思路和实现方式已经考虑清楚了,否则会造成一系列不可预测的问题。

由此可见,数据库设计在整个软件开发过程中起到了举足轻重的作用。

2 关系型数据库设计的基本步骤

关系型数据库设计的过程可大体分为四个时期七个阶段。

(1)用户需求分析时期,主要是了解和分析用户对数据的功能需求和应用需求,是整个设计过程的基础,事关整个数据库应用系统设计的成败。

(2)数据库设计时期,主要是将用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的数据模型,可用实体―联系模型来表示,然后将其转换为已选好的关系型数据库管理系统RDBMS所支持的一组关系模式并为其选取一个适合应用环境的物理结构,包括存储结构和存取方法。

(3)数据库实现时期,包括数据库结构创建阶段和应用行为设计与实现阶段,是根据数据库的物理模型创建数据库、创建表、创建索引、创建聚簇等。

(4)数据库运行与维护阶时期,最后一个阶段则是数据库应用系统经过试运行后即可投入正式运行。

3 关系型数据库设计的几个原则

在进行关系型数据库的设计过程中,要遵循以下几个原则,借此可以提高数据库的存储效率、数据完整性和可扩展性。

3.1 命名规范化

在概念模型设计中,对于出现的实体、属性及相关表的结构要统一。例如在数据库设计中,指定学生Sstudent,专指本科生,相关的属性有:学号、姓名、性别、出生年月等,及每个属性的类型、长度、取值范围等都要进行确定,这样就能保证在命名时不会出现同名异义或异名同义、属性特征及结构冲突等问题。

3.2 数据的一致性和完整性

在关系型数据库中可以采用域完整性、实体完整性和参照完整性等约束条件来满足其数据的一致性和完整性,用check、default、null、主键和外键约束来实现。

3.3 数据冗余

数据库中的数据应尽可能地减少冗余,这就意味着重复数据应该减少到最少。例如:若一个部门职员的电话存储在不同的表中,假设该职员的电话号码发生变化时,冗余数据的存在就要求对多个表进行更新操作,若某个表不幸被忽略了,那么就会造成数据不一致的情况。所以在数据库设计中一定要尽可能存在少地冗余。

3.4 范式理论

在关系数据库设计时,一般是通过设计满足某一范式来获得一个好的数据库模式,通常认为3NF在性能、扩展性和数据完整性方面达到了最好的平衡,因此,一般数据库设计要求达到3NF,消除数据依赖中不合理的部分,最终实现使一个关系仅描述一个实体或者实体间一种联系的目的。

4 以具体实例设计的关系型数据库设计的实践

以大学教学管理软件开发中的数据库设计为例进行分析。

(1)重视系统的总体设计。总体设计不仅与软件项目顺利开展的进度有关,还与是否可以达到预期的项目开发目标有关。下面以大学教学管理数据库开发为例进行说明。

(2)首先对大学教学管理软件所涉及的数据进行详细的分析。按照上述的设计思想,共设计了如下表,例如,学生关系表、专业关系表等,然后创建视图和存储过程。

①学生关系表S:S#(学号),SNAME(姓名),SSEX(性别),SBIRTHIN(出生年月)等字段,主键为S#(学号)。②专业关系表SS:SCODE#(专业代码),SSNAME(专业名称)等字段,主键为SCODE#(专业代码)。③课程关系表C:C#(课程号),CNAME(课程名称),CLASSH(学时)等字段,主键为C#(课程号)。④设置关系表CS:SCODE#(专业代码),C#(课程号)等字段,主键为SCODE#(专业代码),C#(课程号)。⑤学习关系表SC:S#(学号),C#(课程号),GRADE(分数)等字段,主键为S#(学号),C#(课程号)。⑥教师关系表T:T#(教工号),TNAME(姓名),TSEX(性别)等字段,主键为T#(教工号)。⑦讲授关系表TEACH:T#(教工号),C#(课程号)等字段,主键为TEACH:T#(教工号),C#(课程号)。

数据库中的每一个表都建立了主键,部分表为了满足查询和排序的需要,还需要建立索引。例如查询学生信息时,除了按学号查询,有时还会用到按照班级查询。因此,在学生表中除了对主键“学号”建立主索引外,也对“班级”建立了次索引。同时,在数据库中,数据按照主键和外键的关系,建立起了关系。另外,根据查询需要,还建立了教学安排视图、课程成绩视图和学生平均成绩视图及相关的存储过程。

5 结语

通过前面的分析和研究,数据库的设计是非常重要的,为之后整个系统的稳定可靠运行提供了稳固的后台保障。数据库必须与应用程序的业务需求相辅相成,在设计过程中要严格遵循关系数据库的设计步骤,并灵活运用上述原则。

参考文献

[1] 潘博.计算机软件数据库设计的重要性以及原则研究[J].计算机光盘软件与应用,2013(8).

[2] 王晓军.数据库设计的理论和实践在软件开发中的作用[J].科技与生活,2012 (8).

[3] 孟志伟.管理系统的数据库设计[J].信息与电脑,2009(7).

关系型数据库范文第2篇

【关键词】Hadoop;非关系型数据库;安全技术;HBase

1.Hadoop云计算环境与HBase

Hadoop是一个分布式系统环境,能够运行于大型集群上。Hadoop主要包括两个方面:HDFS文件系统和MapReduce计算框架。在Hadoop中用户无需详细了解底层系统的实现细节,即可开发分布式应用程序。在云环境的实际使用时,用户的核心数据需要上传到云端,这就会使用户考虑云端是否能够保障这些数据的安全性、完整性以及可用性。作为典型的一种云架构,Hadoop环境的用户在连接服务器时无需验证即可与服务器进行通信,这就难免存在数据的安全性问题。

Hadoop上集成应用最多的非关系型数据库是HBase,HBase的架构是典型的主从结构,包括一个Master和若干个RegionServer,另外还使用Zookeeper作为其数据一致性的协调程序。HBase数据库底层存储数据时使用的是Hadoop的HDFS文件系统,客户端在借助HBase API访问存储在HBase数据库中的数据。

Zookeeper的作用是保证整个HBase集群中只有一个master节点,同时实时监控regionserver的状态,一旦regionserver不能继续提供服务,zookeeper会将其状态通知给HBase Master。

HBase数据库中有两张特殊的系统表:-ROOT-和.META.。-ROOT-系统表中存储的是.META.的分片(region)信息,.META.中则存储了所有的用户表的分片(region)信息,每个分片都可以存储到不同的regionserver上。这种类似B+树的三层结构,可以实现高效的rowkey查询,并保证HBase数据库是一个高可靠、高可伸缩的分布式数据库。

2.非关系型数据库及其安全需求

云计算技术及电子商务的兴起,使得互联网络上的数据量越来越大,传统的关系型数据库已经难以满足大数据环境中大规模数据处理以及高并发的需求,非关系型数据库应运而生,非关系型数据库具有高并发以及高扩展性等特性,并且具有和关系型数据库不同的存储结构。

与关系型数据库相比,非关系型数据库改变了其数据存储结构和架构设计,从而可以更好地处理高并发以及大规模数据的问题。关系型数据库存储的是结构化的数据,数据存储在行列组成的二维表中,所有行含有的字段完全相同;这样的存储方式虽然有利于表的连接操作,但当数据量很大时会占用大量的存储空间,这在一定程度上限制了其处理大规模数据的性能。非关系型数据库存储的是“键值对”,数据库中每一行的结构不必须完全一致,每行可以有不同的字段,这样的松散数据结构非常适合非结构化数据。非关系型数据库存储数据的结构如图1所示。

与关系型数据库利用SQL语言作为其访问接口不同,非关系型数据库由于没有固定的字段结构,其访问接口是键值对,这种结构设计使得非关系型数据库可以随着数据量的增加而横向扩展,即如果非关系型数据库所在的集群服务器数目增加一倍,则其负载能力也相应提高一倍。

横向扩展主要是通过数据分片(shard)和分区(partition)实现的,数据分片又可以分为垂直分片和水平分片两种;水平分片指的是把表中的行划分为多个子集,这些子集分布在集群中的多个节点上,以此提高整个集群的性能、降低数据出错造成的影响。非关系型数据库中水平分片上比传统的关系型数据库具有更好的扩展性,由于非关系型数据库一倍都是基于键值对模型的,很少对整个数据库进行扫描查询,所以能够简单地通过在集群中加入新的节点对方式来进行扩展。

非关系型数据库一般是分布式的,其数据分布在多个节点上,所以其安全要考虑内部安全和外部安全两方面。前者指的是非关系型数据库内部数据存储上的安全,主要满足的是数据库管理员的安全需求;后者指的是非关系型数据库客户端和服务器之间的安全,主要满足的是数据库用户的安全需求。

3.Hadoop中HBase的安全策略

HBase是非关系型数据库中安全性最完善的,对其安全机制进行研究有助于为其他的非关系型数据库提供一定的参考价值。HBase是集成在Hadoop云计算开发平台上的,所以Hadoop为其提供了访问安全机制。Hadoop的安全特性主要包括四个方面:“基于令牌的认证机制、基于Kerberos的安全认证方案、基于ACL角色控制的权限控制,以及HDFS数据存储的一致性保证和数据完整性验证”。

Hadoop中包含服务级和文件级两类权限验证,其中前者是系统级别的,后者是文件级别的。对于服务级别的安全验证,是通过ACL角色控制实现的,默认情况下hadoop中服务级别的安全验证是关闭的,要想开启服务级别的安全验证,可以将配置文件${HADOOP_CONF_DIR}/core-site.xml中的hadoop.security.authorization属性设置为true。

除了hadoop.security.authorization属性外,还有一组类似的属性可以控制哪些用户可以访问哪些资源。借助基于ACL的角色控制,Hadoop可以保证HBase的底层具备服务级别的安全访问策略,以此限制用户和组对资源的访问,从而防止了非法用户对数据进行恶意操作。

当HBase的底层文件系统对数据进行读写请求时,客户端可以指定访问的用户或用户组,如果不对用户进行认证,则客户端用户就可能伪装为其他用户访问HBase数据库中的数据,基于令牌的认证机制有效解决了此问题。Hadoop中有两种认证机制:基于MD5的令牌认证机制和基于GSSAPI的Kerberos的认证机制;令牌认证又分为两种:对HDFS文件系统的授权令牌认证和对MapReduce任务框架的任务令牌认证。Kerberos认证包括域内认证和跨域认证两种,其认证步骤分为以下几步:

(1)客户端程序首先发送相关信息到AS服务器,这些信息包括用户名IDc、认证域、随机数以及授权服务器TGS等;使用TGS的密钥加密后得到TGT。

(2)客户端程序获得AS的应答后,向TGS发送加密的用户名、认证域以及TGT、服务器名称等相关信息;TGS解密收到的信息,并根据解密的结果对比确定请求的用户、TGT票据的所有者等,并产生对应的TS返回给客户端。

(3)客户端解密收到的TGS应答,并发送TS、加密的用户名及认证域等信息到应用服务器,访问对应的应用资源。

HBase数据库底层的HDFS分布式文件系统具有高度容错性,不仅可以保证数据存储的完整性,而且能够保证数据传输的完整性。Hadoop集群中的DataNode定期检查其自身管理的数据库,并对其进行完整性验证,通过验证的数据块就满足数据存储的完整性;Hadoop的客户端在和DataNode进行数据传输时,会对数据进行传输完整性验证。

HBase协处理器(Coprocessor)是HBase数据库中的重要框架,它可以使用户在服务端插入其定制代码。HBase协处理器分为两种类型:系统协处理器和表协处理器,前者能够全局导入regionserver上所有的表,表协处理器允许用户指定一张表使用协处理器。为了更好地提供灵活得控制,HBase协处理器提供了两种不同的执行模式,分别是Observer模式和Endpoint模式,分别类似于传统关系型数据库中的触发器和存储过程的概念。HBase的协处理器框架允许HBase数据库实现聚合、访问控制等丰富的特性。

4.结语

本文结合HBase数据库的分布式特性,围绕非关系型数据库中数据的机密性、完整性以及一致性,分析了HBase数据库的安全需求。在此基础上,研究了以HBase数据库为代表的非关系型数据库的安全机制,包括基于ACL的角色控制机制、令牌认证机制、HDFS数据一致性机制以及HBase协处理器机制等。

参考文献

[1]蔡平.基于Hadoop的NoSQL数据库安全研究[D].上海交通大学,2012.

[2]张少敏,李晓强,王保义.基于Hadoop的智能电网数据安全存储设计[J].电力系统保护与控制,2013(7).

[3]朱敏.基于HBase的RDF数据存储与查询研究[D].南京大学,2013.

[4]刘河,陈宇.云计算环境下NoSQL数据库技术及应用研究[J].软件导刊,2013.

关系型数据库范文第3篇

关键词:SQL Server;Oracle;Transact-SQL;企业管理器;查询分析器

中图分类号:TP311文献标识码:A文章编号:1009-3044(2009)14-3614-02

Large and Medium-sized Database Management System Performance Analysis of Differences

ZHANG Qun-hui, WANG Cong, TONG Xin

(Hunan Information Science Vocational College, Changsha 410151, China)

Abstract: The article introduces the architecture, security model, database file management method, data conversion, backup, restore and replication as well as the Transact-SQL language design. Describes the application process and the flip-flop storage to ensure data integrity and consistency between the realization of the process. Focus on the underlying SQL Server database configuration, management data, performance optimization and security management in detail. Finally, the above study, the SQL Server 2000 and oracle database performance comparison, summed up the characteristics of their own. At present, the practical application in the database field, a lot of database management are some problems still exist, resulting in poor database performance. To study the subject for the selection and application of database systems have a certain significance.

Key words: SQL Server; Oracle; Transact-SQL; Enterprise Manager; Query Analyzer

1 引言

SQL Server 2000是微软公司最新版的大型数据库服务器,其性能指标在各方面都有赶超Oracle数据库的趋势。在经历了SQL Server 6.5和7.0两个版本的尝试之后,微软公司终于开始向大规模的业务领域进发了。微软公司聘请了世界上最优秀的数据库专家而且专门搭建了信息量可谓空前庞大的地理信息系统,励精图治。有了强大的性能和功能支持,并且彻底脱离了Sybase,它将数据库连接到Internet,并通过Web浏览器显示数据操作,具有客户机/服务器结构,并与Microsoft公司的其他产品及第三方产品具有良好的兼容性,能方便的实现无缝操作。此外,SQL Server 2000还提供了对分布式事务处理的支持,为大型数据库项目提供优秀的企业级的解决方案。再配合其一向为人称道的易用性,SQL Server可以说成为了开发者手中的一柄利器。

因此,在数据库需求日益增长的今天。学好SQL对于开发和维护数据库,以及研究其他数据库是非常重要的。

2 SQL Server体系结构

SQL Server是由一系列数量众多的数据组件组成。这些组件在功能上互相补充,在使用方式上彼此协调,以满足用户在数据存储和管理、大型Web站点支持和企业数据分析处理上的需求。从不同的应用和功能角度出发,SQL Server具有不同的系统结构分类。具体可以划分为:

・数据库体系结构

・客户机/服务器体系结构

・关系数据库引擎体系结构

・服务器管理体系结构

其中,客户机/服务器体系结构又可以划分为客户端组件、服务器组件和通信组件三部分。用户不用直接访问 SQL Server进行分析服务的,而是使用客户应用程序来访问数据的。客户端-服务器组件体系结构如图1。

3 SQL Server主要功能

SQL Server充分整合Analysis Services 和资料采集(Data Mining),因而可以调整资讯,掌握机会。领先业界支持XML、增强系统管理和调整等工具,以及在企业和电子商务等应用上有着可调适性和可靠性。其主要功能包括管理数据库文件,管理的安全性,执行管理任务等方面,具体如图2所示。

由于篇幅的关系,在这里主要介绍SQL Server在安全方面的管理特点。SQL Server的安全性机制分为4个等级。

・客户机操作系统的安全性

・SQL Server的登录安全性

・数据库的使用安全性

・数据库对象的使用安全性

每个安全等级就好像一道门,如果门没有上锁或用户拥有开门的钥匙,则用户可以通过这道门达到一个安全等级。如果通过了所有的门,则用户就可实现对数据库的访问了。这个关系用图3来表示。

4 SQL Server性能优化

数据库是企业信息的核心,其应用水平的高低直接影响到企业管理水平。选择了一个高性能的数据库产品不等于就有一个好的数据库应用系统,如果数据库系统设计不合理,不仅会增加客户端和服务器端程序的编程和维护的难度,而且还会影响系统实际运行的性能。

4.1 影响SQL Server性能主要因素及解决办法

影响SQL Server数据库性能的因素有很多。比如:在开发工具、数据库设计、应用程序的结构、查询设计、接口选择等发面都有多种选择,这取决于特定的应用环境和应用需求。平常在优化SQL Server性能,主要从以下几个方面着手:

・数据库设计问题

・应用系统设计

・操作系统相关优化

4.2 SQL Server优化器

SQL Server优化器通过分析查询语句,自动对查询进行优化并决定最有效的执行方案。主要是通过查询分析、索引选择、合并选择三个阶段完成的。完成以上三个过程后,优化器就会生成一个基于费用的查询执行计划,这个计划充分利用了可用的索引,并以最小的系统开支和良好的执行性能访问原来的数据。

4.3 SQL Server优化应用分析

在实际操作过程中,可以先使用SQL事件侦查器创建一个工作负荷文件,来跟踪一段时间内某个指定数据库的活动。然后根据跟踪记录,使用索引优化向导来对索引进行优化。

5 SQL Server与Oracle数据库的比较

5.1 SQL Server的优越性

SQL Server是当今最重要的数据库管理系统之一。之所以能够在现代数据库管理系统行列中立于不败之地,SQL Server有着他独自的优点。主要体现在以下以个方面:

1)非过程化语言

SQL是一个非过程化的语言,因为它一次处理一个记录,对数据提供自动导航。

2)统一的语言

SQL可用于所有用户的DB活动模型,包括系统管理员、数据库管理员、 应用程序员、决策支持系统人员及许多其它类型的终端用户。基本的SQL 命令只需很少时间就能学会,最高级的命令在几天内便可掌握。

3)是所有关系数据库的公共语言

由于所有主要的关系数据库管理系统都支持SQL语言,用户可将使用SQL的技能从一个RDBMS(关系数据库管理系统)转到另一个,所有用SQL编写的程序都是可以移植的。

5.2 Oracle数据库介绍

Oracle9i是业界第一个完整、简单的用于互联网的新一代智能化的、协作各种应用的软件基础架,其主要特点体现在:

1)支持大数据库、多用户的高性能的事务处理。

2)ORACLE遵守数据存取语言、操作系统、用户接口和网络通信协议的工业标准。

3)实施安全性控制和完整性控制。

4)支持分布式数据库和分布处理。

5)具有可移植性、可兼容性和可连接性。

5.3 两种数据库的比较结果

通过对SQL Server数据库的学习和Oracle数据库的查阅。总结出两种数据库大致区别,如下所示:

1)开放性

SQL Server:只能在Windows下运行,没有丝毫的开放性。

Oracle:能在所有主流平台上运行(包括 Windows)。完全支持所有的工业标准。采用完全开放策略。可以使客户选择最适合的解决方案。对开发商全力支持。

2)可伸缩性和并行性

SQL Server:并行实施和共存模型并不成熟,很难处理日益增多的用户数和数据卷,伸缩性有限。

Oracle:平行服务器通过使一组结点共享同一簇中的工作来扩展Window NT的能力,提供高可用性和高伸缩性的簇的解决方案。如果WindowsNT不能满足需要, 用户可以把数据库移到UNIX中。

3)安全性

SQL server:没有获得任何安全证书。

Oracle Server:获得最高认证级别的ISO标准认证。

4)性能

SQL Server:多用户时性能不佳,C/S结构,只支持Windows客户,可以用ADO,DAO,OLEDB,ODBC连接。

Oracle:性能最高, 保持WindowsNT下的TPC-D和TPC-C的世界记录。多层次网络计算,支持多种工业标准,可以用ODBC,JDBC,OCI等网络客户连接。

5)操作简便

SQL Server:操作简单,但只有图形界面。

Oracle:较复杂, 同时提供GUI和命令行,在Windows NT和Unix下操作相同。

6)使用风险

SQL Server:完全重写的代码,经历了长期的测试,不断延迟,许多功能需要时间来证明。并不十分兼容早期产品。使用需要冒一定风险。

Oracle:长时间的开发经验,完全向下兼容。得到广泛的应用。完全没有风险。

以上是SQL Server与Oracle数据库之间较为粗略的比较。具体要考虑该使用什么软件时,还要根据自己的业务需求和基础设施来综合考虑。

6 数据库系统回顾与展望

纵观当今的商用数据库市场,称之为群雄割据毫不为过。自20世纪70年代关系模型提出后,由于其突出的优点,迅速被商用数据库系统所采用。据统计,70年代以来新发展的DBMS系统中,近百分之九十是采用关系数据模型, 80年代和90年代是RDBMS产品发展和竞争的时代。各种产品经历了从集中到分布,从单机环境到网络环境,从支持信息管理到联机事务处理(OLTP),再到联机分析处理(OLAP)的发展过程;对关系模型的支持也逐步完善;系统的功能也不断增强。

Oracle9i已经出炉,它增强了针对电子商务的新特性,和对因特网应用的支持,提供了对大数据量的在线事务处理(OLTP)环境、查询密集型数据仓库以及要求苛刻的互联网应用的高效、可靠及安全的数据管理能力。

SQL Server 2000的下一代产品YuKon预计在今年推出。YuKon主要增强的特性大概是集群,每个服务器自己进行数据处理、管理内存、加锁和事务处理,与此同时保持与集群中其他及其的内部联系,能做到集群中一台机器不能工作,不会影响整个系统的工作。

7 结束语

在信息量日益增多的今天,数据的管理及安全问题已成为众多企业的“头等大事”。随之而来的,是众多大中型数据库管理系统相继推出,选择一个好的数据库系统能在某种程度上来弥补企业数据管理上的一些不足。有鉴于此,本文详细分析了SQL Server数据库管理系统的原理,无论是从其安全性能方面,还是从其操作方面来说,SQL Server数据库基本能满足多数企业用户的需要。特别是在安全等级方面,通过图文并茂的方式得以体现,让用户一看就懂,希望能对读者了解SQL Server数据库带来帮助。

参考文献:

[1] Microsoft.企业级数据库的安装、配置和管理[M].北京:高等教育出版社,2003.8.

[2] 李真文.SQL Server 2000开发人员指南[M].北京:北京希望电子出版社.2001.5.

[3] Microsoft.SQL Server 2000系统管理[M].北京:清华大学出版社,2001.11.

[4] 李晓,张晓辉,李祥胜.SQL Server2000管理及应用系统开发[M].北京:人民邮电出版社,2002.12.

[5] 刘耀儒.新概念SQL Server 2000教程[M].北京:北京科海集团公司出版,2000.9.

[6] 萨师煊,王珊.数据库系统概论[M].北京:高等教育出版社,2001.7.

关系型数据库范文第4篇

Abstract: There are more and more data produced in equipment management systems. For decision making, all kinds of data must be collected and integrated from different management systems. By analyzing the diversity and isomerous quality of the data resources, the architecture of equipment management data warehouse is proposed in this paper. We discussed important components of the data warehouse. From the macroscopic point of view, the needs of the equipment management system are described by UML and this will help manage and use equipment data more efficiently.

关键词: 数据仓库;数据管理;用例图

Key words: data warehouse;data management;use case diagram

中图分类号:TP302.1 文献标识码:A 文章编号:1006-4311(2013)26-0192-04

0 引言

随着大量信息化装备列装部队,围绕装备全寿命过程的保障数据日趋增加,繁冗的数据体系,给管理决策增加了难度。当前,装备部门按照各自的业务职能,在各个环节分别建立了相应的信息管理系统,如装备储备管理系统、装备使用管理系统、维修计划管理信息系统等。虽然各类应用系统能够满足相应业务部门需求,但各类数据库或文件系统是分散的、独立的子系统,时效性差,共享困难,无法从统一的角度为领导层的全局分析提供及时、准确的综合信息[1]。本文提出构建装备保障数据仓库的思路与方法,将装备保障数据及信息进行汇总,按照决策需求,以数据仓库的形式进行重新组织和存储,建设综合性的服务系统。通过使用UML用例图,对系统整体需求进行分析,为装备保障数据仓库的构建提供模型基础。

1 装备保障数据仓库框架模型构建

结构框架是构建装备保障数据仓库最基本问题,其主要目的是研究装备保障数据仓库的静态结构,利用合适的方法来描述装备保障数据仓库系统的结构框架与功能的实现。

1.1 装备保障数据仓库的总体设计方法 数据系统的设计方法通常有两种,一是依据需求构建的系统开发生命周期(System Development Life Cycle,SDLC)方法,这种方法以需求为驱动,由上层领导提出具体需求,通过设计人员加以实现;二是依据在已有数据构建的数据仓库环境下的系统开发生命周期(Cycle Life Development System,CLDS)方法[2],这种方法以数据为驱动,通过原有的业务系统与数据,设计上层数据系统。在分析型环境中构建装备保障数据仓库,上层分析需求不能像底层业务需求准确给出,存在不确定性,这就使得在构建装备保障数据仓库过程中,要使用CLDS的设计方法,从数据开始,结束于需求,将需求分析的过程贯穿在整个设计过程中,整体流程如图1所示。

整体流程中,始终伴随着需求理解,并逐步完善体系构架。从数据源获取的信息经过数据获取与集成,进入数据仓库中心数据库,通过DSS(Decision Support System)决策支持系统应用编程,使得数据仓库实现辅助决策功能。在系统测试阶段,对系统进行整体测试,并以反馈需求的方式,进行系统的更改和完善。

1.2 装备保障数据仓库的体系结构模型设计 装备保障数据仓库的建设,一方面要实现数据的集成,另一方面要实现对上层领导的决策支持,这就要求该仓库应具有良好的可扩展性和灵活性,能够适应复杂多变的需求。装备保障数据仓库主要以目前运行的业务系统为基础,包含从装备设计生产到使用退役的全寿命过程的数据内容[3]。这些数据分布于异构的数据平台,数据不易集成。我们尽可能地以最基本、最不可分割、最基础的可复用组件的方法来收集和储存数据,只有这样,才能高效地利用数据实现上层领导的管理决策。装备保障数据仓库的体系结构建立在传统的业务系统数据库之上,将这些数据以统一的格式,集成、存储在一起,向后通过数据分析技术,最终向各类用户提供包括辅助决策在内的各类服务。装备保障数据仓库体系结构模型如图2所示。

现有业务系统数据库是装备保障数据仓库的数据源,从各种数据源开始,通过数据管理与建模工具,对数据进行抽取、转换、装载,在元数据的同一规范下,各类数据按照不同的粒度需求,整合存储在中心数据库之中。根据用户需求的不同,建立各类数据集市,以满足不同业务部门的高效使用。中心数据库与数据集市通过OLAP(On-Line Analytical Processing)在线联机分析处理、数据挖掘等多种方式,对数据进行加工处理,最终满足不同用户对数据的需求。

2 装备保障数据仓库功能模型构建

功能建模是为了进一步细化和描述装备保障数据仓库功能的组成和逻辑关系,体现系统的实际需求,为装备保障数据仓库设计和实现提供支持[4]。这里主要采用UML用例图的建模方法对系统功能需求进行描述。如图3所示, “管理功能需求”、“控制功能需求”、“接口功能需求”四个层次的划分,从不同的侧面反映了数据仓库所应具备的功能需求[5]。根据实际使用情况,将装备保障数据仓库得功能需求进一步细化,其中“管理功能需求”分为“装备数据管理”、“用户管理”两部分;“控制功能需求”分为“项目运行控制”和“用户访问控制”两部分;“接口功能需求”包含“数据接口管理”和“外部系统接入”。

2.1 管理功能需求建模

2.1.1 用户管理 用户是数据仓库的使用者和操作者,用户管理主要是进行用户及相关信息的创建和维护,如图4所示。

在装备保障数据仓库中,参与者主要包括系统管理人员,上层决策人员、中层业务人员、基层保障人员。系统管理人员负责系统软硬件维护,根据用户需求实现系统功能;中层业务人员是系统的主要操作者,并配合系统管理人员保障系统的功能实现与日常维护;上层决策人员与基层保障人员是装备保障数据的主要使用者,前者侧重数据的辅助决策作用,后者注重数据对于保障活动的指导作用。主要用例包括:

①“创建用户”,对用户进行新建、修改、保存等操作。

②“编辑用户信息”,定义和修改用户的基本信息(如用户姓名、职务、所属部门等)。

③“信息上报”,用户对自身信息进行上报,完善系统用户信息。

④“用户分类”,按照用户所属类型的不同进行分类,以区别数据获取权限等。

⑤“用户权限管理”,为用户设置权限,使用户具备不同的操作内容,如读、写、修改、删除等。

2.1.2 保障数据管理 装备保障数据是数据仓库的核心内容,良好的模型的构建,有利于数据的便捷维护与高效利用。管理装备保障数据,构建数据创建、使用、维护活动模型如图5所示。

其参与者为中层业务人员与基层保障人员,中层业务人员负责装备保障数据的整体收集、维护,基础保障人员对权限内装备保障数据进行上报、查询。此外系统管理员配合中层业务人员,确保需求功能实现。主要用例包括:

①“增加装备保障数据” 、“删除装备保障数据”、“更改装备保障数据”,系统管理人员在中层业务人员的配合下,实现装备保障数据的增加。

②“数据查询”,可以按照给定的关键词来检索所需要的综合保障数据或系统数据。

③“数据上报”,基层保障人员在实际操作过程中,对错误数据的修正以及对新数据的添加。

2.2 控制功能

2.2.1 项目运行控制 系统控制功能伴随项目运行而产生,用户控制功能的实现,必须建立在项目运行的前提下。项目由中层业务人员创建,在实时跟踪的同时将现实情况及时向上层反馈,如图6所示。

其参与者为中层业务人员,同时需要基层保障人员与上层决策人员的配合,主要用例包括:

①“项目运行”,项目运行是项目控制的前提,各项控制活动,总是依托项目运行展开。

②“项目创建”,最基本的项目运行活动,由中层业务人员参与,创建项目。

③“实施跟踪”,主要根据相应的条件和规则来确定业务活动所处状态(准备、运行、结束、错误等),为控制活动提供依据。

④“反馈上层”,通过项目运行数据实现对上层决策的支持。

⑤ “决策交互”是对“反馈上层”的扩展,支撑“反馈上层”活动。

⑥“信息填报”,用户对自身信息进行上报,完善系统用户信息。

2.2.2 用户访问控制 装备保障数据仓库由于其业务活动的特殊性,必须严格控制访问,用户访问不仅与用户的身份和权限有关,还涉及相关的软件工具和业务活动,如图7所示。

其参与者为中层业务人员与系统管理人员,主要用例包括:

①“项目运行”,项目运行是用户访问控制的前提,对用户身份的验证、外部系统接入及业务系统的检查,伴随项目运行展开。

②“登陆控制”,主要检查用户是否注册、是否分配了相应的权限,以决定其是否能执行相应的操作。

③“外部系统接入”,主要检查外部系统接入数据仓库的情况,并根据授予权限的区别,实现不同数据内容的传输。

④“上层决策系统接入”,上层决策系统的权限与数据需求都存在差别,根据上层决策的实际数据需求,形成不容的系统接入与数据传输。

“登陆控制”、“外部系统接入控制”、“上层决策系统接入控制”都与“接入控制”形成泛化关系。

2.3 接口功能 当一些相对独立的现有或遗留软件应用系统需要与装备保障数据仓库进行交互时,通过项目运行,配合相关功能,实现外部系统管理与数据接口管理,如图8所示。

其参与者为系统管理员,主要用例包括:

①“项目运行”,系统、数据的接入围绕项目运行活动展开。

②“信息采集”,以采集信息为中心,通过基础数据上报,原始数据过滤、加载,实现系统与数据的接入。

③“基础数据上报”,基层保障人员将实际保障过程中产生的数据上报,充实中心数据库。

④“原始数据过滤加载”,将繁冗异构的原始数据,通过数据转换,具备统一标准,以完成数据的交换与共享。

⑤“决策信息交互”,当决策有数据需求或决策信息需要时,通过“决策信息”交互实现数据传输。

3 结论

本文描述了基于数据仓库技术构建装备保障数据管理系统的总体构架,并将系统的相关需求以UML用例图的形式给出。装备保障数据仓库在完成数据存储功能的同时,形成了全方位的保障数据服务体系,是我军装备管理工作发展的必然。在服务基层装备保障、支持业务工作的同时,装备保障数据仓库会对有效辅助领导层决策,大大提高装备综合保障能力,为提升我军装备保障水平发挥重要作用。

参考文献:

[1]吴小勇.基于数据仓库的装备体系数据建模方法[J].计算机工程,2006,36(1):76-78.

[2]张云涛,龚玲.商业智能设计部署与实现[M].北京:电子工业出版社,2004.

[3]单志伟,等.装备综合保障工程[M].北京:国防工业出版社,2007.

关系型数据库范文第5篇

关键词:数据仓库;飞行大学生;流转管理系统;应用;研究

1 数据仓库概念

数据仓库英文名称data warehouse,简称DW,数据仓库是随着信息高速发展而产生的一种概念。数据仓库是为了进一步挖掘数据资源,充分利用数据,它区别于静态数据存储,而是一种数据处理过程,在这个过程当中包含数据的收集、数据集中整理、数据加工等几个过程。数据仓库没有严格的数据库理论基础,更偏向于工程应用,按照关键技术划分为数据的抽取、存储以及数据的呈现三个方面[1]。

2 飞行学生流转管理现状

飞行大学生培养模式是两年内在校本部完成所有本科阶段的理论课学习,符合理论课结业后下分院进行飞行训练。两年的时间里完成二十多门课程。其他大学生而言,时间紧,课程重。在理学习阶段和私商仪考试时间是1.5年到2.5年(即18到30个日历月),飞行学生采用准军事化管理模式,学生要在相应的时限内必须完成40余门基础和专业课程的学习,并且只有考试通过后,并通过私商仪执照理论考试才能下分院。以飞行学院为例,目前学校有五个训练分院,学生在理论课程全部完成并且顺利通过考试后就要下分院进行训练,同时在中教训练完成后又要返回学校本部,其中中教在分院训练时间超过一年。由行大学生培养的特殊性,每个学生的训练进度情况都不一定相同,学生在下分院以及从分院返回校本部时每个学生的信息都不一样,为了加强对于学生的管理,数据流转显得十分重要。这其中学生的数据包括:学生基础信息(姓名、学号、性别等),学生课程信息(已经上了哪些课程,是否已经通过),学生执照及ICAO考试情况,学生体检情况等。

3 基于数据仓库的飞行学生流转管理系统分析

根据当前的数据情况以及目前飞行大学生管理现状,现有的学生流转数据主要是以EXCEL方式管理为主,随着学生数量增多,学生情况差异,原有的管理方式越来越繁杂,人力工作量越来越大,已经不能满足当前学生流转管理的需要。借助计算机技术,我们可以对于现有的数据进行加工,存储以及统计分析,这样可以充分挖掘数据价值,并且实现学生流转数据的科学高效管理。设计基于数据仓库的飞行学生流转管理系统通过ETL技术,达到数据抽取、数据清洗,数据转换,数据装载的目的。在此基础上导入学生基础信息、学生课程信息、学生执照考试信息、学生体检信息等,从而构建飞行学生流转仓库体系结构图,如图1所示。

设计飞行学生信息流转系统数据仓库的数据源通过使用ETL技术将数据放到数据库中去,在这个过程中首先要导入基础信息包括学生课程信息、学生执照考试信息、学生体检信息等。

(1)数据源。数据源是整个系统的基础,是存储和管理数据的核心所在。包括飞行学生的各类信息,比如学生基础信息,学生体检情况,学生执照考试情况,学生现实表现情况等等。(2)数据处理。数据存储在系统之后,会根据实际业务需要对于数据库进行操作,包括数据抽取、数据整理、数据组装。数据仓库在管理过程中遵循安全、备份、维护、修复等工作。(3)OLAP引擎。联机分析处理(OLAP)系统是数据仓库系统最主要的应用,针对实际使用需要对数据进行有效集成。这样就可以就行多方位多角度分析得到最终结果[2]。(4)前段展示。通过报表、查询工具等等对数据进行全方位的汇总分析,最后形成图标或者报表的形式可以直观得看到结果。

4 系统数据模型和功能结构

系统设计过程中采用“星型”模型,数据库中至少要包含一张“事实表”,事实表中的每一条记录都指向各个维表的外键,飞行学生流转管理系统建立学生基础信息表、学生体检情况,学生执照考试情况,学生现实表现情况表。具体示例如图2所示。

多维数据分析主要完成飞行学生信息流转数据仓库建立和数据展现部分的设计,以飞行学生现实表现为例,通过统计分析各学期,横向以及纵向比较,可以得出某一个学生同时期的现实表现比较或者同其他同学存在的差距或者问题。从而可以得到该生是否有进步,存在哪些问题,同时也可以给航空公司提供一个平台,了解学员在学生以及飞行训练阶段的情况。

5 结束语

建立飞行学生流转管理系统数据仓库是一个很复杂的过程,特别是数据搜集,数据处理,数据展示等等。随着飞行学生日益增多,数据量将会越来越大,传统人工数据管理显然已经不能满足需要。因此借助计算机软件系统,建立数据仓库,对于数据进行统一整理,统一管理,统一存放,使得数据合理规划和整合,搭建便捷的飞行大学生数据流转平台,为学校和航空公司管理者提供足够的信息支持,对于培养飞行员是大有意义的。

参考文献

相关期刊更多

国际关系研究

CSSCI南大期刊 审核时间1-3个月

上海社会科学院

闽台关系研究

部级期刊 审核时间1个月内

中共福建省委党校;福建行政学院

现代国际关系

CSSCI南大期刊 审核时间1-3个月

中国现代国际关系研究所