首页 > 文章中心 > 数据分析设计

数据分析设计

前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇数据分析设计范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。

数据分析设计

数据分析设计范文第1篇

关键词:商务平台;数据分析;电子商务

中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2015)30-0211-02

随着电子商务的发展,越来越多的实体商户转向网络虚拟网店,“淘宝网”的店铺数呈指数增长;消费者也越来越疲于花大量时间在海量的信息中寻找自己需要的商品[1]。由此衍生出以团购为生存方式的电子商务平台,如“折800”、“一淘网”等依赖于“淘宝网”的团购网站。这些团购网站经过通过“淘宝网”从中获取折扣商品[2]。但折扣的商品有质量质疑,团购网站需要重视上线商品的质量数据问题,对网站上线商品进行售后监控,优胜劣汰。商务平台商品数据分析系统基于此开发。

1 商务平台商品数据分析

商务平台商品数据分析系统集数据获取、数据统计和分析,系统设计有如下考虑[3-4]:

1)商品ID号:根据上线商品的ID号直接获取商品的评论,并对评论进行等级评定;

2)评论平均分:计算评论平均分,据此可判断商品是否合格;

3)评论分分布:计算评论的合格数及其比例。

等级评定时是多个操作人员同时对同一商品数据进行评论操作,评论评分定级是人工进行的,操作人员的主观对商品评论操作有一定影响。因此需要将所有操作人员的评论评分数据进行统计对比分析,以控制整个评定的有效性。

2 系统设计

本系统根据MVC的三层框架,利用JSP技术制作动态网页,通过JDBC技术访问数据库,使用JSP作为服务器端应用程序处理客户端的请求并在Web服务器中进行业务逻辑处理并返回客户端请求的结果。在JSP里嵌套HTML以及CSS对WEB页面进行设计,引入Bootstrap封装的样式,达到系统数据呈现的设计要求[5-6]。

页面数据呈现与后台数据交互是整个系统的核心,对数据进行归纳计算和整理并呈现到用户界面上。用户只需获取到公司平台上线商品的ID号就可以通过系统抓取商品评论数据;同时对数据进行整理分析得到评论平均分、评论分数比例等数据;同时可以系统整理分析出整体上线商品的整体趋势,通过饼状图直观地看出商品的品质分布。

2.1 系统功能结构设计

商务平台商品数据分析系统分为三个模块,八个基本功能,分别是管理员登陆、用户登陆、用户注册、商品评论抓取评分、商品评论数据的统计和分析、用户管理和修改密码等,根据分析,本系统的功能结构图如图1所示。

1)管理员登陆:管理员输入用户名和密码,数据经由UI Servlet传递给Controller Servlet,再到数据库中验证身份,将结果返回给JSP,成功登陆就可进入系统,不成功则重新输入。用户名只可能是字母,密码字母和数字皆可。管理员是系统指定的,不可以注册。

2)用户登录:普通用户输入用户名和密码,数据经由UI Servlet传递给Controller Servlet,再到数据库中验证身份,将结果返回给JSP,成功登陆就可进入系统,不成功则重新输入。用户名只可能是6-20位字母,密码是6-15位字母和数字组合皆可。若没有账号,可以在用户登录JSP页面点击注册,通过UI Servlet跳转到注册页面。

3)用户注册:用户注册需要输入Email、用户名、密码等信息,Email有格式判断,必须输入正确的格式,用户名必须是6-20位字母,密码是6-15位的字母数字组合皆可。输入正确后可以成功申请新用户,随后跳转到普通用户登录界面登录系统。

4)商品评论抓取评分:普通用户与管理员皆可操作,在输入框中输入商品的id号,点击查询,就可获取到“淘宝网”中商品的前一百条评论,并且按照评论时间顺序进行呈现。其后的评分框,按照规定只能输入1-5的数值,同时点击保存,数据就会存入数据库中。

5)商品评论数据统计:此功能方便普通用户清楚的跟踪自己的工作进度,对于管理员可以掌控平台上线商品的商品质量,会显示出该操作人员所操作的所有商品的平均分、合格率,可以看出该操作人员操作的商品评分状态详情。

6)商品评论数据分析:此功能为管理者观察网站整体上线商品的质量分布,点击查询,会统计所有使用系统的普通用户操作过的所有商品数的评论数据。如此管理者可以通过这些数据对网站上线商品进行调整。以操作人为条件,区分每个人的操作数据,可以控制一定的主观误差,还有整体的上线商品的趋势。普通用户可以看出自己的主观意见和其他用户的差别。

7)用户管理:管理员可以对普通用户进行增加和删除,用户管理界面对普通用户不可见。管理员有权限重置普通用户的密码。

8)修改密码:管理员和普通用户都可以自行更改密码。

2.2 系统数据库设计

数据库能够对商务平台商品数据分析系统的后台数据进行添加、删除、查询,修改。本系统采用MySQL数据库设计,分别是用户信息表、评论评分信息表、商品数据分析表和商品数据统计表。用户信息表主要保存管理员和普通用户的登录信息:用户的用户名、密码、级别还有Email。评论评分信息表主要保存评论内容、评论的时间、评论评分、商品id、操作人员、商品名称等。商品数据分析表主要保存操作人员、操作商品总数、平均四分以上的商品总数及其比例、合格率大于80%的商品总数及其占比、合格率大于60%的商品总数及其占比、不合格商品总数及其占比等内容。商品数据统计表主要保存商品id、操作人员、商品名称、评论平均分、评论合格率、评论不合格率等信息。其设计分别见表1-表4。

3 结束语

互联网电子商务企业需要处理大量的数据。商务平台商品数据分析系统基于JAVA语言和MVC设计思想,在My Eclipse的开发环境开发,完成了淘宝商品评论数据基于商品ID号抓取、评论五等级评分、针对不同操作人员评分的合格率、平均分4分以上商品总数、合格率大于一定比例的商品总数等数据统计和分析以及用户管理等功能;商务平台商品数据分析系统前台利用Bootstrap框架和BUI框架进行开发,将后台功能进行呈现。系统操作简单,界面简洁、美观交互速度快,有效降低了商品数据分析的繁琐度提高效率。

参考文献:

[1] 谢恩宏, 石宇良. 我国城市电子商务发展特点和趋势[J]. 电子商务, 2010(10): 13-15.

[2] 许小平. 大学生网上开店品牌建设研究[J]. 中国电子商务, 2012(8): 26-29.

[3] 崔志刚. 基于电商网站商品评论数据的用户情感分析[D]. 北京: 北京交通大学, 2014.

[4] 马广松, 方宇, 徐辉. 心电网络信息系统的设计及应用[J]. 中国医疗设备, 2009(7): 55-56.

数据分析设计范文第2篇

关键词: 数据分析课程 翻转课堂 教学设计

数据作为信息的主要载体,在当今“大数据时代”背景下扮演着重要的角色。对数据的分析和利用已经成为每个行业重要的生产因素,并广泛应用于各行业和领域。数据分析就是用适当的统计方法对收集的资料进行详细的研究,提取有用的信息并形成结论,以求最大化地开发数据资料的功能与发挥数据的作用。在我校,数据分析课程是信息与计算科学系的必修课程,对提高学生的建模能力及数据分析水平有重要的作用。

数据分析课程的特点就是要求学生具备较高的理论基础水平、综合应用及动手能力,还需要学生掌握必要的分析解释能力。将理论与实际案例结合,发挥学生的主观能动性,增加学生的动手实践和分析解释环节,是数据分析教学中必须遵循的原则。而翻转课堂正是通过对知识传授和知识内化两个环节的颠倒,实现学生对授课内容的理解和对知识点的内化,也就是理论结合实践的过程。因此本文针对数据分析课程特点和存在的问题,结合翻转课堂的教学理念,对数据分析课程各个教学环节进行设计研究,以期促进数据分析教学,使之更好地为专业素质的培养提供服务。

一、数据分析教学存在的问题

1.理论教学

数据分析课程的理论与方法内容丰富,涉及面广,应用范围大。在理论教学中,学生学习理解掌握理论基础具有一定的难度。如对各分析方法的理解掌握,必须建立在良好的数学基础上,综合运用所学数学知识才可以理解各种数据分析的理论分析原理。同时学生还需要理解掌握各分析方法理论的内在联系,并把握其不断发展的趋势,才能真正掌握数据分析的理论与方法。我校现在的数据分析课程教学理论课程授课方式单一,传统教学方式使学生只能对课程方法理论浅尝辄止,无法深入了解,综合运用。同时单一的课堂授课模式无法对学生的掌握程度进行有效的评价和检测。

2.实践教学

数据分析课程对学生的动手能力要求很高。学生在理解掌握各种分析方法的理论基础上,需要掌握一定的统计软件的使用方法,如SPSS,MATLAB。这需要将理论方法,如复杂的公式,与实际软件使用相结合。实验教学中,要求学生有较高的计算机编程能力,然后结合数据分析的理论方法,对数据进行分析,并应用于实践。现阶段我校数据分析课程中,学生实践课时偏少,而且传统授课模式让学生的学习处于被动状态。实践教学中只能根据老师和教材的指导,对课本上的例题程序进行练习,极大地限制学习广度和深度,且无法有效地将本课程与实际生活与应用联系起来,从而挫伤学生学习和动手的积极性。

3.学生能力培养

数据分析课程对学生能力的培养体现在综合运用能力和对结果的分析解释能力。理论课程传统的填鸭式教学,和实践课程拘泥于教材的例题程序的现状,将数据计算与数据分析分割开来,势必会限制学生综合运用能力和分析解释能力的发展,影响学生学习兴趣和课程教学效果。

二、翻转课堂教学理念

翻转课堂起源于美国林地公园高中,两位化学老师通过让学生在家观看视频,课堂进行练习的方式,完全颠覆传统教学模式。翻转课堂将传统教学模式中知识传授和知识内化两个阶段颠倒过来。与传统授课模式不同的是,知识传授不再是完全由课堂中教师的讲解完成,而是通过信息技术的辅助在课前或课后等业余时间完成,同时知识的内化不再是单一的由课后作业或者练习完成,而是通过在课堂中进行疑难解答、项目式学习、合作学习等方式进行。因此,对翻转课堂教学方法的实际有效利用可以将大学生学习时间最大化,并培养学生的自学能力、自我约束能力及分工合作能力。

在数据分析课程教学中,学生可以利用课余时间,结合教师提供的数据分析每一模块的课前学习材料,实现对数据分析课程基本方法和理论的了解,这样很好地利用学生的课余时间,培养学生的自学和约束能力。而对所学数据分析方法的具体应用、深入理解及综合分析等方面,学生可以通过课堂的各种活动和学习方式,以及和教师的及时沟通,和同学的合作交流等方式,在知识内化这一环节获得比传统课堂更好的学习效果。

三、翻转课堂在数据分析教学中的应用设计

近些年国内外很多对翻转课堂教学的研究,形成针对各个学科和地区的教学模式。如RobertKarplus提出的“探索-解释-应用”三阶段学习周期,RamseyMusallam提出的“探索-翻转-应用”模式,国内南京大学张金磊等人提出的由课前学习和课堂学习组成的翻转课堂教学模式等。

针对数据分析课程学科特点和本校学生基础水平及实际情况,本研究提出数据分析翻转课堂的教学流程:

课前――概念探索教学视频平台交流

课中――问题解决(经验交流,教师讲解)测试反馈项目创建协作学习及汇报

课后――平台交流,作业反馈

在课前教学环节中,概念探索是根据数据分析课程的学科特点设计的,由于学生初次接触数据分析,对很多基本概念及意义没有深入了解,意识不到社会意义和实践意义,在这一环节中学生可以通过教师给出的简单具体的实例演示,再加上信息丰富的网站、视频及博客等手段在教学交流平台上阐述自己对所学概念的理解,相互交流,以此实现对概念的初步正确理解。如对聚类分析的理解,学生可以概念探索这一过程中通过具体实例演示和对各种信息的阅读,了解到聚类分析作为数学工具的基本思想和在现实生活中的重要意义。

教学视频主要是微视频和幻灯片。对于教学视频的观看,要求学生针对自己的数学学习基础有选择地观看。教学视频中主要针对本单元学习内容进行讲解,同时还会提供与本单元学习相关的数学基础理论的教学内容。这种数学基础与数据分析内容相结合的教学材料可以让数学基础不完善的学生更有效地理解本单元的知识。在视频或者课前学习资料的制作中,需要结合每一章节的实际,主题突出,简短生动,而且有效。如在聚类这一章节中,对于各种聚类方法的介绍可以结合具体的实例,如与生活密切相关的人均家庭收入问题等,通过不同方法展示对比,从而做到对每一聚类方法的理解和融会贯通。同时需要介绍相关的Matlab编程方法,让学生结合理论和实际,通过编程过程实现对理论知识的理解和应用。

课前学习中,反馈是比较重要的一部分。教师可以通过平台交流得到课前理论学习的反馈信息,同时可以通过在线学习简单的作业练习,由此获得课前学习的反馈。

课堂教学仍然是很重要的一环。课堂上教师首先组织学生面对面交流,解决并了解课前学习中遇到的问题,对普遍性问题做详细解答。然后经过简单的例题让学生编程实现,并进行相应的解释,由此测试学生的学习效果。这样教师可以更好地掌握学生对每一章节数据分析理论的学习效果,以及学生对理论的应用构建能力。在保证学生对概念和理论的学习后,教师可以提供项目创建的基本信息和参考实例,如数学建模题目等。学生分组合作交流,选择自己感兴趣的问题成立合作组,结合本章节内容分析解决问题,寻找合适的数据处理方法,应用相关软件编程实现自己的想法,将理论应用于实践,并进行有效的分析,学生的问题解决过程和讨论过程可以在课下进行。在学生充分准备后,课堂上进行分组汇报,并进行自评和互评,实现学生对理论的应用和相互学习。

本章节教学内容结束后,教师组织学生在教学平台交流,并展示自己的作业和反思内容,巩固对本章节内容的理解。

四、教学设计效果分析

1.符合大学生学习特点

大学生作为已经独立的学习个体,拥有独立的学习和思考能力,同时具备独立学习时间和空间,而传统教学方式无法充分发展学生的独立学习能力,让学生的课余学习漫无目的,松散自由,无法充分利用课余时间。翻转课堂在数据分析课程教学中的应用让学生在课余时间的学习有的放矢,通过学习交流平台还可以相互交流督促,培养学生良好的独立学习和探索学习的习惯。

对于思想上已经独立的大学生来讲,个性化学习更符合学生的行为习惯和思想意识。在数据分析课程的学习中,学生可以根据自己的基础、学习习惯及自己的喜好等自由选择学习的材料、时间和方式,互不打扰,又可以相互交流。如对概念和理论的理解,学生可以通过网络资料,也可以选择图书馆的书籍,观看教学材料等方式进行,每位学生理解的深度和广度可能会有所不同,通过相互交流和共同知识构建和应用又可以相互弥补。这样的教学和学习方式极大地满足了不同学生对知识的需求,避免一刀切式教育,可以充分发挥学生的学习潜力。

2.增强学习效果

通过初步的教学实验,接受翻转课堂数据分析课程的学生无论在理论知识理解还是实践应用上都有明显提高。相对于传统课堂中的学生,在数据分析课程结束后,翻转课堂中的学生可以较好地阐述相关理论,通过Matlab软件编程实现对理论的应用,并给出合理的解释。通过测试对比可以看出,翻转课堂中的学生理论基础更加扎实,编程能力有很大提高。在翻转课堂试行后,学生在数学建模大赛中成绩有明显进步。

3.改善教学氛围

在数据分析翻转课堂中,学生学习积极性有很大提高。首先学生已经通过概念的探索阶段对所要学习的知识有初步了解和认识,能够较好地意识到所学知识的社会意义,增强学习兴趣和信心。其次,学习方式多样化,学生可以充分利用自己喜欢的现代信息设备,将手机、平板及电脑等学生喜爱的现代化信息设备变成学习的工具。避免学生与教师之间对手机等工具的对弈,改善学生将手机等单纯作为娱乐工具的现象。此外,学生在交流平台上的发言、总结和展示不仅乐意给学生带来成就感,而且可以激发其他学生的学习动力,形成你追我赶的学习氛围。

通过将翻转课堂理念初步运用于数据分析课堂,发现这一理念的运用可以有效解决目前数据分析课程教学中存在的一些问题,将理论教学与实践教学密切联系起来,并有效调动学生的学习积极性,取得较好的教学效果。在这一过程中,我们发现翻转课堂理念的实施不能拘泥于形式,需要根据具体问题和课程需要进行相应的调整。同时翻转课堂中需要教师付出更多精力进行探索,如更合适的教学资料和课堂活动设计。总之,翻转课堂理念的实施带来的不仅是教学形式的变化,更是对教师工作分工和角色的改变。

参考文献:

[1]宋艳玲,孟昭鹏,闫雅娟.从认知负荷视角探究翻转课堂[J].远程教育杂志,2014,(1):105-112.

[2]汪晓东,张晨婧仔.“翻转课堂”在大学教学中的应用研究[J].现代教育技术,2013,(8):11-15.

[3]张金磊.“翻转课堂”教学模式的关键因素探析[J].中国远程教育,2013,(10):59-64.

[4]周学刚.浅谈“数据分析”课程的教学[J].中国电力教育,2011,(7):110-111.

[5]窦建军.数据分析课程教学中的几点体会[J].徐州教育学院学报,2008,(3):146-147.

数据分析设计范文第3篇

关键词:质量管理,统计分析,船舶设计

中图分类号:U673.2 文献标识码:A

Data Analysis Method of Quality Control Applied for Ship Design Project

LI Lanjuan

( Guangzhou Marine Engineering Corporation, Guangzhou 510250 )

Abstract:Statistic and analysis for drawings which are censored by CCS with a new data analysis method of quality control. It can reflect technique level of each profession clearly, then we can adjust to achieve the aim of improve design according to requires.

Key words: Quality control; Data analysis; Ship design

1概述

在船舶设计项目质量管理中,对设计图纸的差错率进行统计分析非常重要,不仅可以总结经验,还可以找出设计环节中的薄弱之处,进而有针对性地采取改进措施,降低图纸差错率和图纸修改率,最终达到提高设计质量的目的。本文将一种全新的质量管理数据分析方法应用到船舶设计项目中,对某船送中国船级社(CCS)广州审图中心的各专业图样文件进行了统计和分析。首先对CCS审图意见类别及其导致修改的原因进行统计,然后对统计结果进行分析,最后针对产生原因采取相应的改进措施。

2专业审图意见类别和原因分析

对各专业分别进行统计和分析,有利于了解各专业本身技术力量的实际情况,以便专业负责人做出适时的调整,对薄弱之处加以改进和提高。根据CCS的审图意见类别,对某船各专业的图样文件进行统计,然后根据CCS提出的意见进行原因分析。

为了方便分析,设置下列不同的代码,表示不同的审图意见类别和原因分析含义。

(1)审图意见类别代码含义:

A-认可无意见;

AC-认可有意见;

N-备查无意见;

NC-备查有意见;

TS-转送现场验船师审核;

RS-不予批准,需修改后重新送审。

(2)原因分析代码含义:

B1-设计方案欠妥;

B2-设计接口不协调;

B3-不符合现行有效的规范、法规要求;

B4-标识不明或有误;

B5-其它。

下面对轮机专业进行举例说明:

该专业的意见类别统计见表1,原因分析统计见表2。

表1轮机专业CCS审图意见类别统计表

表2轮机专业原因分析统计表

由表1可清楚地看出某船轮机专业图样文件的退审意见分布情况。其它专业也分别如此进行归类和统计,便能了解本专业图样文件的退审意见分布情况,并且还可将各专业的退审情况进行比较。

由表2可清楚地看出某船轮机专业图样文件的差错分布较为集中在B3 (不符合现行有效的规范、法规要求),其次是B1(设计方案欠妥),说明轮机专业在这两方面需采取措施加以改进。其它专业也分别如此归类和统计,这样就能清楚地了解各专业自身的薄弱环节在何处,从而可采取相应的措施来改进和提高。

3全船审图意见类别和原因分析

为了使分析具有全局性,对各专业之间进行比较之后,需对全船进行统计和分析,这样有利于找出整体中的薄弱环节在何处。某船全船图样文件的CCS审图意见类别统计见表3;原因分析统计见表4。

表3全船CCS审图意见类别数据统计表

表4全船原因分析统计表

由表3可清楚地看出各个专业退审图样文件的总体情况。由表4可看出各个专业图样文件的退审意见主要集中在B3(不符合现行有效的规范、法规要求),说明在这一环节所有专业均比较薄弱,特别是电气专业,因此需专门针对这一环节制定改进措施。

通过对全船的退审图样文件进行统计和分析后,使项目负责人能清楚地掌握各专业的实际工作情况与整个项目组中的薄弱环节所在,以便采取改进措施,从全局出发对各专业的技术力量进行调整,进而提高产品项目设计质量。

4结论

在船舶设计项目中采用这种全新的质量管理数据分析方法,不仅能清晰地反映出各专业本身的优劣势,还能反映出各个专业之间技术力量的强弱差别。这样不但让专业负责人能了解本专业的问题所在,并采取相应的改进措施,同时也能让项目负责人掌控全局,根据需要对各专业进行协调,从而提高产品项目的质量,降低图样文件的差错率。

作者简介:李兰娟(1979-),女,工程师。从事项目管理与质量管理工作。

收稿日期:2013-07-05

国际动态

日本获得6艘灵便型散货船订单

近日,Sesoda公司表示,通过其子公司及合资公司(JV)订造了2艘34000DWT型及4艘38000DWT型散货船。相关散货船的新造船价分别为“每艘2500万美元以下”及“最高2600万美元”水平。

这些新造船将在日本Namura(名村)造船、Imabari(今治)造船以及匿名的其他日本造船厂进行建造,安排在2016-2018年交付。

南日本造船获4艘甲醇运输船订单

数据分析设计范文第4篇

关键词:试验数据分析 SPC 设计

中图分类号:TP274.2 文献标识码:A 文章编号:1007-9416(2016)11-0142-01

南京中车浦镇海泰制动设备有限公司是主要从事铁路客车、动车组、城市轨道交通设备制动系统及其零部件和试验装置的研发、设计、制造、销售、修理、租赁及技术咨询、试验检测和技术服务的高新技术公司。公司现有数十台各类非标设备用于产品的出厂试验,每台设备的试验类型、试验参数规格以及试验报告都不相同。

试验数据分析系统的目的就是需要将这些非标设备的试验数据进行集中统一上传存储,并提供统一的查询以及分析,使管理者或相关人员能迅速知晓产品性能参数,通过对试验数据的分析,了解产品的生产过程的结果,实时监控产品试验过程,对阶段性产品试验数据进行SPC分析。科学的区分出生产过程中产品质量的随机波动与异常波动,从而对生产过程的异常趋势提出预警,以便生产管理人员及时采取措施,消除异常,恢复过程的稳定,从而达到提高和控制质量的目的。

1 系统整体设计

系统整体框架结构包括三个部分:基于C/S的试验台应用配置系统 + 数据上传适配器中间件 + 基于B/S的试验台数据分析系统,如图1所示。

C/S的应用配置系统完成对不同类型试验台的应用配置,配置内容包括试验台的试验子项内容定义;试验子项的存储结构定义;试验子项的数据字典定义;试验子项的规格值定义;试验台试验报告单的报表格式及数据源定义。

数据上传适配器接口基于配置数据库中的配置实现将不同类型的试验台试验数据进行上传并存储。

B/S试验台数据分析系统基于配置数据库的配置,实现对不同类型的试验台试验数据进行显示以及分析。

2 数据上传接口设计

在试验过程中,每完成一个试验项目,则将当前试验项目的试验结果信息和参数信息通过调用Web Service接口上传并转储至服务器中的数据库中(如果遇到服务器故障的情况下数据本地保存)。

本地试验数据上传采用windows消息队列方式。原理如图2所示。

3 试验数据报表显示设计

由于试验数据分析系统需要显示不同试验平台下的试验数据报表。在设计中需要根据不同类型的试验台定义报表显示模版,定义模版中的数据源,最后将模版和数据源进行绑定并进行显示。设计结构如图3所示。

基于XML定义报表模版对应的数据源。XML文档格式设计如下:

4 结语

本文提出了多样性试验平台数据上传、集中存储、分析以及报表显示的设计解决方案,并对整体系统的构架做了详细的设计及实现,现系统正在稳定运行中。系统运行SPC分析图如图4所示。

数据分析设计范文第5篇

关键词:电子政务;数据库;数据挖掘

中图分类号:TP399 文献标识码:A 文章编号:1674-7712 (2012) 18-0014-01

2005年国家信息化领导小组第五次会议通过的《国家信息化发展战略(2006—2020年)》,提出紧紧围绕提高治国理政能力,推行电子政务。在此背景下,国家各级科技部门纷纷建立了具有各自特点的管理信息系统(MIS)、办公自动化系统(OA)以及科技政务网站等。随着这些网站、系统的运行,各级科技系统逐渐累积了大量的数字科技数据,如何应对数据保存、管理以及运用等日益成为科技部门关心的问题,建设基于数据挖掘的科技电子政务数据库将成为问题解决的关键。

一、建设科技电子政务数据库的必要性

在《国家信息化发展战略(2006—2020年)》的指引下,截止笔者调查,以全国副省级城市为例,哈尔滨、长春、沈阳、大连、济南、青岛、南京、杭州、宁波、厦门、广州、深圳、武汉、成都、西安等十五个副省级城市都已建立起比较完整的科技信息服务体系,内容既涵盖了科技法规、科技政策宣传、科技工作报道等新闻类信息、也包括了科技计划申报、科技成果申报以及相关的管理信息系统和科技统计、专利成果等信息系统,这些系统的建立为科技部门信息化管理和服务带来了显著的社会效益。建设科技电子政务数据库,一方面数据库可实现对科技数据的安全保存和管理;一方面引入数据挖掘技术可实现科技数据的分析和深层次利用,势必推动科技电子政务朝着更加有效的保存和利用科技数据的方向发展。

二、科技电子政务数据库系统构建

(一)科技电子政务数据库系统的构建思路

科技数据来源与应用的复杂性为数据库的规划设计增加了难度,在系统规划设计中涉及到的内容是不断变化的,需求也在不断增加,需要一种动态适应的方法来支持复杂应用环境下的系统规划设计。在科技电子政务数据库建设规划中首先应分清整体与局部的关系,可按照:系统构思——系统分析——整体规划——局部规划——建设实施——运行维护——升级的整体系统建设流程,从方案的酝酿到系统投入使用的完整的系统应用流程,层层推进,层层细化,并不断反馈修订原方案,最终形成整体规划方案。

(二)科技电子政务数据库系统的建设内容

科技系统的电子政务源数据主要涉及系统报表数据、汇总生成数据、分析结果数据以及各业务机关之间的办公数据。这些源数据的类型即包括各个企业的申报、审批信息,同时也包括各种社会、公众信息,因此在分类上存在较大的复杂性;同时在分布上受当前科技部门分工影响,科技数据的保存较为分散,一次性的整合利用即存在多部门协调合问题,也不利于源数据的管理。因此建议对科技源数据先实现分别建库,再进行跨库整合;例如:可分别建设高新技术企业和产品数据库、科技成果数据库、科技计划项目数据库、大型仪器设备数据库、科技查新数据库等,再通过建设统一信息服务平台实现综合利用。

三、科技电子政务数据库系统的功能设计

(一)数据采集

一个系统能提供科学客观的决策支持功能,数据的客观性、科学性是基础条件,因此数据的采集对于基于数据挖掘的科技电子政务数据库建设有着基础性作用。有效的数据采集方式应具备以下特点:①满足系统对于数据的需要;②符合下级数据源的填报习惯,最大限度地减少下级部门的工作量;③能有效地对数据进行校验,保障数据的质量;④满足采集标准不断变化的需要;⑤传输量较小,减轻网络负载。⑥能提供多种采集渠道,满足不同类型数据上传。特别强调项目申报审批与工作的流程化定制,科技电子政务主要涉及各类的申报审批工作,当前的科技政务申报审批系统,多设计简单、功能单一,大量源数据的保存和分析再利用都只能脱离已有系统、依赖人工处理。因此建议充分考虑用户需求和使用习惯,应用web service技术和B/C架构等技术设计良好的流程性数据采集系统,就能在完成申报审批政务的同时自动形成数据洼地和信息链,汇集起真实有效的源数据,即减少源数据的二次收集和重复劳动,又便于数据分析和挖掘工作的开展。

(二)数据应用

数据的分析与应用是一个数据库的核心功能,只有全面丰富的汇总数据,科学深入的分析结果,才能使数据库的决策支持功能发挥的更加科学和全面,才能让科技部门和公众通过数据库得到有价值的、能够辅助决策的信息。数据挖掘的维度应从多个角度设计,如时间、空间、项目专业类型等,数据挖掘的生成的信息产品可紧贴科技部门的管理工作。以建设高新技术产业数据库为例,可根据源数据,分析提取生成高新技术企业人力、财力、物力、科研状况等方面的横向或纵向汇总或比较信息,形成深度数据挖掘的信息产品。所形成的信息产品还应该呈现出丰富的表现形式,如:表格、结构图、柱形图、条形图、饼图、圆环图、折线图等,使信息产品即直观生动又便于利用。信息产品的外观设计要求和谐美观、对比鲜明、使用设计上要求方便简洁、注重用户体验。

四、结语

科技电子政务数据库的建设任重道远,在建设过程中可能会面临一些困难,笔者认为主要来自两方面:一是现行科技行政管理体制对数据共享的障碍。科技部门的分割管理使得科技系统各个部门自成体系,形成了从上到下的彼此隔绝的垂直管理体系。各部门的数据信息从行政管理上进行隔离,数据共享的行政阻力大于技术阻力;二是科技信息安全保密问题的障碍。由于科技数据库多涉及政务资料、企业税收、财务等信息,因此对业务处理数据应给予非常高的安全性设计,避免因信息泄漏、灾难等因素造成的损失和工作失误。

参考文献: