首页 > 文章中心 > 科学计数法的规则

科学计数法的规则

前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇科学计数法的规则范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。

科学计数法的规则

科学计数法的规则范文第1篇

关键词:抽样检验;抽样方案

一、抽样检验的概念及其发展

抽样检验在产品检验中能发挥重要作用,是统计质量控制的重要组成部分。以“用尽量少的样本量来尽量准确地评判总体(批)”为主线展开的,理论依据是概率论、数理统计、管理学和经济学。

抽样检验系统的设计应考虑以下特性:(1)科学性,抽检应能够有效地控制产品质量。(2)经济性,尽可能低的检验费用。(3)可靠性,对产品质量检验和评估的结论可靠。(4)操作性,抽样检验的实施应有较强的操作性。

抽样检验是从一批产品中随机抽取少量产品(样本) 进行检验,据以判断该批产品是否合格的统计方法和理论。它与全面检验不同之处,在于后者需对整批产品逐个进行检验,把其中的不合格品拣出来,而抽样检验则根据样本中的产品的检验结果来推断整批产品的质量。如果推断结果认为该批产品符合预先规定的合格标准,就予以接收;否则就拒收。所以,经过抽样检验认为合格的一批产品中,还可能含有一些不合格品。

抽样检验的优点:(1)只检验部分产品,较为经济合算;(2)抽样检验中,搬运损失小;(3)抽样检验所需检验员少;(4)由单件判定提高到批次判定,是一个改进;(5)适合于破坏性测试;(6)拒收整个产品批,而不仅仅是退回不良品,有力地促进产品质量的提高。抽样检验的优缺点:(1)存在接受“劣质”批和“拒收”批的风险;(2)增加了计划工作和文件编制工作;(3)样组提品情报较之于100%检验为少。

抽样检验始于20世纪20年代,应用于二战,1974年,国际标准化组织根据当时美国军标MIL-STD-105D的理论起草并颁布了抽样检验的国际标准ISO2859(其最新版本为ISO2859.1-1999《计数抽样检验程序 第一部分:按接受质量限AQL检索的逐批计数抽样计划》)。我国开始于20世纪60年代,1978年颁布第一个抽样检验标准SJ1288-1978《计数抽样检验程序和抽样表》。1981年上升为国家标准:GB2828-1981,1987年改为国家标准GB2828-1987,最新版本为GB/T2828.1-2003。

二、抽样检验的类型

抽样检验类型有计数型抽样检验和计量型抽样检验。

计数型抽样检验:把抽取样本后通过离散尺度衡量的方法称为计数抽样检验。计数型抽样检验分为计件和计点两种方案,计件针对不合格品数,计点针对不合格数。

计量型抽样检验:用抽取样本的连续尺度定量地衡量一批产品质量的方法。

三、计数调整型抽样检验

“调整型”抽样检验含义:在产品质量正常的情况下,正常抽检;当产品质量变坏或不稳定,加严抽检;当产品质量变化或稳定时,放宽抽检;抽样方案和转移规则一起使用。

一次抽样方案的检索方法。首先应规定质量指标接收质量限(AQL),规定检验水平(IL)。抽样方案检索:按照抽样方案检索表箭头所指位置数据,同行中是抽样方案参考值。

(一)接收与否的判断

1.一次抽样方案

一次抽样方案的形式为[n;Ac,Re],其中n表示样本量,Ac表示接收数,Re表示拒收数。

判断规则:若d≤ Ac,则接受此批;若d≥ Re,则拒收此批。d是样本中的不合格品数。

2.二次抽样方案

二次抽样方案的形式为{n1;A1,R1 / n2;A2,R2},其中n1 、n2表示第一和第二样本量,A1 A2表示第一和第二接收数, R1 R2表示第一和第二拒收数。

判断规则:若d1≤ A1,则接受此批;若d1≥ R1,则拒收此批。 A1

(二)严格度间的转移规则

1.从正常检验到放宽检验(条件都满足):①当前的转移得分至少30分;②生产正常;③负责部门同意转到放宽检验。

2.从放宽检验到正常检验(只要具备一条):①有一批放宽检验不通过;②生产不正常;③负责部门认为有必要到正常检验。

3.从加严检验到暂停检验:①累五规则;②加严检验开始后,不通过批数累计达到五批时,暂时停止按本标准检验。

4.恢复检验:当给与停止检验的企业,实施了有效改进措施后,可以提出恢复检验。恢复检验的产品一般从加严检验开始。

5.转移得分:除非负责部门另外规定,在正常检验一开始就应该计算转移得分。

(1)整数转移得分规则

①一次抽样方案

a.当接受数等于或大于2时,如果当AQL加严一级后该批被接收,则给转移得分加3分;否则将转移得分重新设定为0。

b.当接受数为0或1时,如果该批被接收,则给转移得分加2分;否则重设为0。

②二次(多次)抽样方案

a.当使用二次抽样方案时,如果该批在检验第一样本后被接收,则给转移得分加3分;否则将转移得分重新设定为0。

b.当使用多次抽样方案时,如果该批在检验第一样本或第二样本后被接收,则给转移得分加3分;否则将转移得分重新设定为0。

(2)分数转移得分规则

①当给定接受数为1/3或1/2时,如果批被接收,则给转移得分增加2分;否则,将转移得分重新设定为0。

②当给定接受数为0时,如果在样本中未发现不合格品,则给转移得分增加2分;否则,将转移得分重新设定为0。

四、检验不合格品的处置

(一)不合格及不合格品

不合格:是指单位产品的特性不符合规定。

不合格分类:(1)A类不合格:单位产品的关键质量特性(critical)不符合规定,或单位产品的质量特性极严重不符合规定;(2)B类不合格:单位产品的重要质量特性(major)不符合规定,或单位产品的质量特性严重不符合规定;(3)C类不合格:单位产品的一般质量特性(mineral)不符合规定,或单位产品的质量特性轻微不符合规定。

不合格品分类:(1)A类不合格品:有一个或一个以上A类不合格,也有可能还有B类不合格和或C类不合格的单位产品;(2)B类不合格品:有一个或一个以上B类不合格,也有可能还有C类不合格,但没有A类不合格的单位产品;(3)C类不合格品:有一个或一个以上C类不合格,但没有A类和B类不合格的单位产品。

(二)不合格品的再提交

凡是在检验时发现的不合格品,检验方有权拒绝接受。被拒绝的不合格品可以修理或校正,经检验方同意后,可以按照规定方式再次提交检验。被判为不通过的批,在可能的情况下,经过交验方百分之百的检验,将发现的不合格品剔除或修理好以后,允许再次提交检验。

参考文献:

[1]周友苏.质量管理统计技术[M].北京:北京大学出版社,2010.1.

科学计数法的规则范文第2篇

(延安大学物电学院,陕西延安716000)

摘要:竞走在实际训练、比赛中队员有犯规嫌疑就会被警告,但没有什么可靠的依据。运动员如果满足竞走定义,有犯规嫌疑,就被裁判警告并罚下场,这样有时就会对有些运动员不公平。根据竞走的定义和核心规则,分析竞走在比赛、训练中存在的问题,并结合实际情况,采用555时基电路设计了一种多功能的竞走技术检测器,并介绍了安装方法。该设计主要针对双脚离地犯规进行检测,如果运动员双脚同时离地犯规红外线检测仪就能检测到,同时计数器计数1次,蜂鸣器也发出声音提示运动员犯规。

关键词 :竞走;步频;红外线检测仪;犯规警告

中图分类号:TN602?34 文献标识码:A 文章编号:1004?373X(2015)18?0119?03

收稿日期:2015?03?29

基金项目:陕西省自然科学基金赞助项目(2014JM2?5058);延安大学青年项目(YDQ2014?38);2015年陕西省大学生创新创业训练计划项目(1425)

0 引言

竞走是田径比赛中具有特殊规则的比赛项目,也是我国在世界大赛中具有很强竞争力的项目之一[1]。竞走是改变正常走路动作的一种快速走[2],主要目的是通过改变身体正常走路动作来使走路的速度达到最大化,其比赛的特点在于对技术的严格限制和特定的裁判规则[3]。竞走运动自产生和发展以来,伴随着运动技术的发展、运动成绩的提高,以及世界各国的教练员、运动员和科研人员付出的艰苦努力和精心钻研,竞走运动在规则的严谨、判罚的公正、技术的合理、识别的精细方面,一步步地向着更加科学、更加精尖的方向蓬勃的发展起来[4]。竞走是在普通走的基础上发展起来的,是运动员与地面保持接触,连续向前迈进的过程,没有(人眼)可见的腾空[5]。前腿从触地瞬间至垂直部位应该伸直(即膝关节不能弯曲),两者的动作结构相同,都是由单脚支撑和双脚支撑交替反复进行[6]。但竞走有它的特点,骨盆前后转动大,腰部有一定的扭动,两臂积极摆动,脚触地时腿充分伸直,步幅大,频率高,前进速度快。竞走单脚迈进分解过程如图1所示。

竞走有两个核心规则:竞走运动员使用与众不同的步法,看起来很特别,但这种步法是规则规定的。首先,一个竞走运动员必须始终保持至少有一只脚与地面接触。其次,从前进脚落地的一刻起直到腿部达到垂直的姿势,腿部必须保持直线,膝盖不能弯曲[7]。有9名裁判分布在比赛线路上监督任何运动员的犯规动作。当裁判看到竞走运动员有犯规嫌疑时就警告他1次。警告一般是通过在道路两边向犯规者出示白色标志来表示的,此后裁判员会通知主裁判。

在平时训练、正式比赛中队员如果有犯规嫌疑就会被警告,没有什么可靠的依据,运动员如果满足竞走定义,有犯规嫌疑,就被裁判警告并罚下场,这样有时就会对有些运动员不公平。本设计主要针对双脚离地犯规进行检测,如果运动员双脚同时离地犯规红外线检测仪就能检测到,同时计数器计数1次,蜂鸣器也发出声音提示运动员犯规。

1 设计思想

1.1 双脚离地违规检测

本设计的基本思想是若运动员在比赛中双脚同时腾空,安装在竞走鞋掌上的红外线发射电路同时发出脉冲信号,信号就会被红外接收电路接收,计数电路计数1次,蜂鸣器也发出一声提示音。从而提醒队员犯规一次。双脚腾空检测设计思路图如图2所示。

1.2 步频检测

运动员每走1步,都会发出1个红外脉冲,被计数电路接收,计数1次。让队员们在训练过程中,知道自己的最佳步长、步频,从而提高训练效率。步频检测设计思路图如图3所示。

2 电路设计

2.1 红外发射电路

红外线[8]属于不可见光,与一般的可见光线不一样,其电磁波长在950 nm 范围内,广泛应用于遥控和传输设备上。其优点主要有:

(1)有较高的传播速度,不会产生,空间反射以及全折射等作用而出现的干扰;

(2)传播中不会产生畸变噪音;

(3)在高峰值功率情况下所需要的功率较小;

(4)采用一定的调制方法可以有高的抗干扰性;

(5)在仅有的一个载波频率的情况下,可以有高的稳定性。

电路中红外发光二极管,采用的是砷化钾红外发光二极管LD274[9],其属于光角发光二极管,光角是指其管芯制作的发射锥体(抛物面)的角度较大,角度小于160°。其截止电压为4 V,导通电流为30 mA,t=10 μs内允许的冲击电流为2.5 A,损耗210 μW,损耗极小。

空气热阻中为Rt=350 K/W。阻挡层温度为100 ℃。考虑到竞走专用鞋的实际情况——轻便,这里用的红外发射电路,具有体积小,重量小,损耗少的优点。

由于在竞走过程中,两脚不能同时离地,主要辨别的是脚掌,所以发射电路的开关按钮装在鞋掌部分,发射电路的其他部分安装在鞋面上,当把开关DR 按下,作为能源的电容器C1 将通过由发光二极管VD 发射放电,形成由555[10]组成的时基电路和晶体管VT控制,其峰值电流可达1 A ,持续时间可有0.1 s。这个电路时间延迟只有0.5 ms,也就是说该电路有足够的时间判断出队员是否违规。图4是红外线发射电路。

2.2 接收发声模块

采用的红外接收器具有很高的接收灵敏度,其接收红外线波长近900 nm,超过人体的热释红外线的波长。红外接收元件采用一种现在常用的一体化红外接收头(JST)来接收红外发射模块所发射的红外信号,一体化红外接收头(JST)在电视遥控器中应用最广泛,内置有前置放大、限幅放大、检波、稳压等电路,红外电路发射的信号,经过(JST)处理后,输出脉冲信号,再经R2,VD1的控制,通过555时基电路的调制,最后由555时基电路的3 脚输出放大的脉冲信号经运算放大器VT2 放大后,在CP输出并在蜂鸣器上发出声音。红外线接收和蜂鸣器电路如图5所示。

2.3 计数显示模块

电路采用显示组件CL002(内部无计数器)和同步加计数器CC4518[11?12]组成,CC4518接成3位串行BCD码计数器,在脉冲信号CP 作用下进行十进制计数。CL002的I?IV显示对应的3位计数值。计数脉冲由555振荡器电路产生,经VT2放大,送入计数显示电路,记录并显示出来。十进制计数显示电路如图6所示。

3 元器件的选择与安装

元器件的选择,关键是红外线发射、接收二极管的选择,红外线发射二极管有窄角红外线发射二极管和光角红外线发射二极管之分,窄角红外线发射二极管是指在制作工艺,管芯制作时,其反射锥体(抛物面)的角度较小,但其方向性较强,作用距离远,约遥控距离是15 m,角度小于30°。光角发射二极管相对的发射锥体的角度就较大,由于竞走是一个运动过程,笔者采用的是一个光角发射二极管。砷化钾红外发光二极管LD274,发射范围大,发射强度大,作用范围8 m。红外线接收二极管采用的是一体化红外接收头(JST),这种接收头简单、常见、功能强大,内置前置放大、限幅放大、检波、稳压等电路。

红外电路的安装:小型按钮开关DR安装在竞走鞋的鞋掌中,红外线发射二极管安装在鞋头,红外接收模块的一体化接收头(JST)安装在鞋跟部位。计数显示电路安装在鞋的侧面。

4 结语

经过对基于555的多功能竞走技术检测器的测试,大量测试结果表明此检测器能有效地针对竞走过程中双脚离地犯规进行检测,同时计数器计数一次,蜂鸣器也发出声音提示运动员犯规。此设计能一定程度上减少教练误判的行为,无论是对竞走队员还是教练都提供了一定的依据。

参考文献

[1] 朱兴涛,贾谊,于芳.基于足底压力对竞走运动员跑鞋的研究[J].体育研究与教育,2014(1):96?98.

[2] DINGWELL J B,CUSUMANO J P,CAVANAGH P R,et al.Local dynamic stability versus kinematic variability of continuous over ground and treadmill walking [J]. Journal of Biomechani?cal Engineering,2001,123(1):27?33.

[3] 纪仲秋,余锋,李旭龙.我国20 km女子优秀竞走运动员竞走技术的生物力学研究[J].北京师范大学学报:自然科学版,2013,49(6):645?648.

[4] 张勇.我国竞走技术的运动学特征与发展趋向[J].成都体育学院学报,2009,35(7):34?36.

[5] 刘涛,张世浩.我国优秀女子20 km竞走运动员竞走技术三维摄像解析与研究[J].广州体育学院学报,2009,29(1):99?102.

[6] 光.我国优秀男子竞走运动员技术判罚影响因素与技术特点分析[D].呼和浩特:内蒙古师范大学,2013.

[7] 孔宽容.竞走比赛中如何判定运动员技术犯规[J].体育科技,1990(1):18?20.

[8] 栗鹏辉,王萧吟,杨炳吉,等.红外对射的无线发射新型智能红外报警系统简[J].辽宁工程技术大学学报:自然科学版,2015,34(3):428?432.

[9] 杨旭东,刘行景.实用电子电路精选[M].北京:化学工业出版社,2004.

[10] 廖先荟,郝军.电子技术实践与训练[M].北京:高等教育出版社,2000.

[11] 彭介华.电子技术课程设计指导[M].北京:高等教育出版社,2003.

科学计数法的规则范文第3篇

关键词:Apriori算法;数据挖掘;关联规则;食品安全

中图分类号:TP311.13

食品质量与安全是一个专业性很强的问题,其标准的制定和抽样检测及评价都需要科学有效的方法。本文即结合实际数据,在改进Apriori算法下,对该问题进行详细分析与说明。

1 基于矩阵的Apriori改进算法分析

改进的基本思路在于:由于在常规意义上,Apriori算法建立模型过程中需要多次扫描事务数据库,耗费时间过多,当数据量庞大的时候运算效率低,于是裁剪数据集以减少I/O开支显得尤为重要。而FP-Tree通过合并一些重复路径,实现了数据的压缩,从而使得将频繁项集加载到内存中成为可能。

常规Apriori算法得以实现的关键在于:对事物数据库进行多次扫描,在扫描过程当中,计算得出事物数据库当中所包含的每个项目出现的次数,并生成候选1项目集合,删除支持度在预期数值以下的项集,最终得出频繁1项的基本集合。此过程中,往往需要对事物数据库进行多次,且重复性的扫描,因而运算效率较低,值得改进。

本文所提出的改进方法主要在于:将整个事物数据库压缩为一个频繁模式树的形式,借助于频繁模式树,生成相应的关联规则。先设定数据挖掘中最小支持度的阈值,在对事物数据库进行一次完整扫描的基础之上,生成对应的1频繁集,按照由大至小的方式进行排列,并将支持度计数数值小于设定数值的方式集合项予以排除,生成结果集合L。按照集合L描绘FP-tree树,当中对所涉及到的关联信息予以了保留。在此基础之上,再对事物数据库进行一次扫描,采取自下而上的方式进行挖掘,删除相关子节点,最终产生与需求契合的频繁模式。

举例来说,假定前期所设置的最小支持度为2。第一步需要完成对事物数据库的扫描,获取相应的频繁1项集合。此步骤的操作示意图如下图所示(见图1);第二步则需要按照支持度计数大小,由大至小进行频繁项的排序;进而,对频繁项集进行支持度计数的排序,获取相应的结果集,如下图所示(见图2)。在构建FP-tree的基础之上,对事务进行扫描,生成相应的分支。每次扫描事务需要增加相应节点的计数,同时增加新的节点;最后还需要对事物数据库进行一次完整扫描,采取自下而上的数据挖掘方法,对所存在的子节点进行删除,获取频繁模式(见图3)。

2 实例分析

本文从2010年、2011年和2012年深圳市的食品抽检数据入手,探求如食品产地与食品质量的关系;食品销售地点(即抽检地点)与食品质量的关系等;为解决上述问题,本文引入了以上改进后的Apriori算法,望通过对关联规则的应用,以达到良好的效果。

2.1 对数据进行处理:选取附件中的检验不合格的数据1作为样本,其中以每年的80%的样本数据作为建模的训练样本,20%作为检验模型的检验样本;然后对样本数据进行分类,以[不合格,食品种类、抽检地点,食品产地,型号规格,季节]为格式输入数据库中。

2.2 模型准备:以2012年第2期检验不合格数据中油炸食品为例,则频繁模式为[不合格、油炸鸡翅,盐田区,一线城市、散装、春季],所有的频繁模式即为频繁集。算法的基本思想是:在第K趟扫描过程中,只生成长度为K的频繁项目集。以前一趟生成的所有频繁项目集为基础,生成新的候选项目集,然后扫描数据库,计算这些项目集的支持度,按照给定的支持度确定频繁项目集。

(1)首先计算所有的候选 1-项集的集合

(2)扫描数据库,删除其中的非频繁项子集,生成频繁 1-项集的集合

(3)将 与自己连接生成候选 2-项集

(4)扫描数据库,删除 中的非频繁子集,生成频繁 2-项集

(5)以此类推,通过 k-1-项频繁项集 与自己连接生成候选 k-项集 ,然后生成频繁k-项集 ,直到不再有频繁项集产生为止。

2.3 Apriori算法关联规则模型建立:将每个特征的范围划分为相应个数的等间区间,如产地为3个等间区间,将特征值的不同取值映射到得分高、中、低的三个区间,用1、2、3标记。不同的特征值也用数字标记,并跟得分组合。与此同时,将不同的样本数据也用数字标记,至此频繁项集便构造完毕。进而需要生成相应的关联规则。在初始化频繁项集合后,设定最小支持度,由Apriori算法得出最终的频繁集:

首先设定最小置信度阀值 ,然后对每个项集I产生所有非空子集S,对任一个 ,如果:

则输出规则:

其中 表示 的支持频数。

2.4 Apriori算法关联规则模型求解:利用Microsoft Visual C++6.0软件,根据Apriori算法思想,建立简单软件,设置门槛值后,在Result.txt文件中可以查看哪些因素相关联。最终生成以下部分关联规则(见图4):

3 结束语

在上述生成的众多关联规则中,可以找出与关联规则一样或者最为接近,并且置信度、支持度最高的一个关联规则,从而确定食品质量受哪类因素影响最大。即食品质量与食品规格,食品产地,食品种类相关联,与季节相关性不大。

参考文献:

[1]王晗,孔令富.一种新的增量式关联规则数据挖掘方法研究[J].仪器仪表学报,2009,30(2):438-443.

[2]刘红岩,陈剑,陈国青等.数据挖掘中的数据分类算法综述[J].清华大学学报(自然科学版),2002,42(6):727-730.

[3]朱玉全,孙志挥,季小俊等.基于频繁模式树的关联规则增量式更新算法[J].计算机学报,2003,26(1):91-96.

[4]宋余庆,朱玉全,孙志挥等.基于FP-Tree的最大频繁项目集挖掘及更新算法[J].软件学报,2003,14(9):1586-1592.

科学计数法的规则范文第4篇

关键词:数据挖掘;关联规则;Apriori算法

中图分类号:TP311文献标识码:A 文章编号:1009-3044(2008)36-2561-02

Apriori Improved Algorithm and its Application in Course Correlation

DONG Cai-yun1,LIU Pei-hua2

(1.Open college,Shan Dong Broadcast TV University, Jinan 250014,China;2.School of Information Science & Engineering, Jinan University, Jinan 250022,China)

AbstraCt: By analyzing and studying Apriori algorithm, this paper finds problems. Thus, this paper presents a new method which can effeCtively reduce the number of data. This paper also offers a particular description of the new algorithm. At last the new algorithm is used to course correlation, by this we can get some useful result which is helpful to decision making of course setting .The results show the algorithm can improve the data mining performance and is excellent.

Key words: Datamining; Association rules; Apriori algorithm

1 Apriori算法及其存在的问题

1993年,Agrawal[1]等人提出关联规则挖掘算法后,给出了经典关联规则挖掘算法Apriori,它是一种找频繁项集的基本算法。利用该算法进行关联规则的挖掘是一个两步过程[2]:1) 找出所有频繁项集:这些项集出现的频繁性至少和预定义的最小支持计数一样。2) 由频繁项集产生强关联规则:这些规则必须满足最小支持度和最小置信度。挖掘关联规则的总体性能由第一步决定,算法的核心也主要在寻找频繁项目集上。主要是基于Apriori性质:频繁项集的所有非空子集都必须也是频繁的。利用这个性质可以有效地压缩搜索空间。算法主要思路如下:为找Lk,通过Lk-1与自己连接产生候选k-项集的集合,该侯选项的集合记作CK,依次下去直到CK+1为空。在产生Ck,k=1,2,…,K时,利用剪枝策略压缩Ck。利用任何非频繁的(k-1) -项集都不可能是频繁k-项集这一Apriori性质,删去那些(k-1)-子集不在Lk-1中的k-候选项目集。

使用Apriori算法进行关联规则挖掘,可以比较有效地产生关联规则,但在运行时却由于运行效率问题难以推广使用。主要原因是:

1) 数据库扫描的次数太多;2) 另外,当模式太长时产生的候选项目集太多。导致数据库或K太大时,算法的时耗太大或无法完成。本文主要讨论的是算法的效率问题。特别是目前,随着数据仓库中数据的持续增加,在数据挖掘过程中,进行一次数据挖掘的时间越来越长。

2 改进算法

2.1 改进依据

针对于Apriori算法为了确定每个侯选项的计数,需要反复扫描事务数据库的弊端,本文从减少扫描事务数的目的出发,提出了一个改进的算法来得到频繁项集,该算法仍基于支持度和可信度。

算法依据:1) 所有侯选项集Ck是Ck-1项的超集;2) 如果某一事务中不包含侯选项集,则删除该事务后不会影响频项集的产生。

2.2 算法改进的思想

算法思想:给事务数据库中的每一项增加一个标志位delete,初值为false。在每次计算侯选项集Ck出现次数的过程中,若不包含Ck中某一项的事务,则将该标志位的值置为true,若包含某一项,则将值置为false,并给该项的计数加1,且标记不再改变。若最终该项标记为true,即事务不包含选项的任一项,则将其从事务数据库中删除。这样计算侯选项集支持度所涉及的记录数目将小于事务数据库中实际记录数,并且随k值的增大,这一差值也不断增大,因而有效降低了侯选项集的计数速度,提高了整个算法的效率。

2.3 改进算法的实现

算法:改进后的Apriori.

输入:事务数据库D;最小支持度阈值min_sup

输出:D中的频繁项目集L。

Method:

(1) L1=find-frequent_l_itemsets(D);

(2) For(k=2;Lk-1≠Ф,k++){

(3)Ck=apriori_gen(Lk-1,min_sup); //扫描D,对侯选项计数

(4)for each transaCtion t∈D{ //取得事务t的侯选项集合

(5) Ct=subset(Ck,t); //设置删除标记

(6)Ift.delete=false then {

(7)If ?埸Ctthen {

(8) t.delete=true;

(9) break;}

(10) elsec.count++;

}

(11)elseifc∈Ct then{

(12)c.count++;

(13)t.delete=false }

} //若t中不包含任何侯选项,将其

//从D中删除

(14)ift.delete=true then

(15)delete t from transaCtion

(16)Lk={c∈Ck|c.count≥min_sup}

}

(17) return L=∪kLk;

procedure apriori_gen(Lk_1:frequent(k-1)-itemsets;

min_sup:minimum support threshold)

(1) for each itemset l1∈Lk-1

(2) for each itemset l2∈Lk-1

(3) if(l1[1]=l2[1])∧ (l1[2]=l2[2])∧ l2[k-2]) …∧(l1[k-2]=l2[k-2]) ∧ (l1[k-1]=l2[k-1])then{

(4) c=l1 join l2; //join step;generate candidates

(5) if has_infrequent_subset(c,Lk-1) then

//prune step:remove unfruitful candidate

(6) delete c

(7) else add c to Ck;

}

(8) return Ck;

procedure has_infrequent_subset( c: candidate k-itemset; Lk-1:frequent(k-1)-itemset);

(1) for each (k-1)-subset s of c

(2) if s Lk-1 then

(3) return TRUE;

(4) return false;

2.4 改进算法的验证

采用了如表1的事务数据库,对该算法进行了验证。设置最小支持度数为2。

采用改进的Apriori算法进行找侯选项集,频繁项集的过程如下所示:

L1 C2

一次扫描修改后的事务数据库D1 L2 C3

二次扫描修改后的事务数据库D2 L3

其中事务T5由于不包含中的C2中的任何项集,在第二遍扫描后可以删除;同样道理,事务T1在第三遍扫描后可以删除,使得扫描数据库的规模减小,提高了算法的效率。而得到的频繁项集与经典Apriori算法的相同。由此可见算法是可取的。(下转第2565页)

(上接第2562页)

3改进算法在教学中的应用

目前各高校都积累了大量的学员成绩信息,管理人员很难从这些信息中找出有用的规律。因此将数据挖掘用于发现课程之间的关系对科学设置课程指导学员选课是有意义的。

笔者采用关联规则算法对某学院的学员成绩数据库进行采掘,目的是得到课程的相关性信息,以期发现课程之间的关系,更合理的设置课程和指导学员选课。算法重点研究和设计了“学员”、“课程”为主题的数据集市,为数据挖掘提供集成的数据源。在预处理阶段,为保证数据的准确与完整,对学员成绩进行了以下处理:1)学员补考的问题。按照学校的有关规定,学员考试不及格必须补考,为了合格证挖掘结果的准确与合理,按他们的原始成绩为准。2)由于其它原因有科目未参加正常考试者,参考其补考成绩及其其它科目的成绩给予一个适当的成绩。3)对学员成绩进行分档处理。将成绩分为A(85-100)、B(70-84)、C(60-69)、D(0-59)。

由于在数据挖掘阶段,笔者采用改进的Apriori算法根据学员的考试成绩进行分析,设置支持度为0.1,置信度为0.8,得到了有关课程的关联规则。现将挖掘结果中的部分关联规则在采用表格形式表示各项分别为(no,front , rear,C),其含义分别是(产生关联规则的序号,关联规则前件,关联规则后件,可信度),其中关联规则项需要通过查询组合第二列和第三列得出来。部分结果如表2所示。

通过分析挖掘结果可以得出加强《高等数学》《数字电子技术》的学习有助于对《计算机组成原理》及《微机原理》课程的学习,其他规则同样可按照这种方式分析。如果分析人员对结果不满意,可以调整支持度,可信度及兴趣度阈值,重新执行挖掘过程,直到满意为止。用户根据挖掘结果做出决策,合理的设置课程,同时该也可以指导学员选课,有利于学员更好的学习各门课程。

4 结束语

本文给出的减小事务数据库的规模求得频繁项集的方法,能够提高算法的效率,特别是随着事务数据库的增大,侯选项集的增大,此算法的效率更加明显。但在挖掘的过程中也出现了一些问题,比如有些新开设的课程信息是用户所关心的,但在挖掘过程中由于其出现频率低,而不能得到其关联信息,因此影响了挖掘的结果,下一步的工作是为各课程增设权值以期发现新增课程与原课程之间的联系,得到更为合理的用户更为感兴趣的挖掘结果。

参考文献:

[1] Agrawal R, Imielinski T, Swami A. Mining Association Rules between Sets of Items in Large Database[M]. In SIGMOD’ 93,Washington,DC, May 1993.207-216.

[2] 范明, 孟小峰,等译. 数据挖掘概念与技术[M].北京: 机械工业出版社. 2003.3.150-221.

[3] 贾彩燕, 倪现君.关联规则挖掘研究述评[J]. 计算机科学, 2003, 30(4):145-148.

[4] 朱明. 数据挖掘[M]. 北京: 中国科学大学出版社. 2002.5.129-140.

[5] 马光志, 龙硕柱. 基于聚类和分类的自学习系统模型[J]. 计算机工程与应用, 2003, 39(10):83-84.

科学计数法的规则范文第5篇

关键词:入侵检测;基于规范的入侵检测;URL过滤技术;Web服务器

中图分类号:TP393文献标识码:A文章编号:1009-3044(2007)12-21581-02

Research on an Intrusion Detection Model to Protect Web Servers

GE Hong,YAN Ling

(Qinghai Oilfield Company,Qinghai 736202,China)

Abstract:This paper took the character of Web server into consideration, combined the Specification-based intrusion detection which was used to detect vulnerabilities based on Web servers and URL filter technology which was used to protect URL attacks, and designed a web-based intrusion detection system model WIDS, then explained the realization of some key part in WIDS detailedly, and analyzed the working process of WIDS through examples in the end.

Key words:Intrusion detection;Specification-based intrusion detection;URL filter technology;Web servers

1 引言

Web应用是运行于Internet和TCP/IP Intranet之上的基于Client/Server的应用。由于Web服务器必须具有固定并且公开的IP地址和域名,以对外提供服务,所以Web服务器最容易受到攻击。随着Internet规模的不断扩大,Web应用也日趋广泛,对入侵攻击的检测与防范、保障计算机系统、网络系统及整个信息基础设施的安全已经成为刻不容缓的重要课题。

2 保护Web服务器的入侵检测模型

2.1 入侵检测方法

入侵检测通常分为异常检测和误用检测[1][3]。误用检测收集非正常操作的行为特征,当监测的用户行为与库中的记录相匹配时,系统就认为这种行为是入侵。异常检测总结正常操作的特征,当用户活动与正常行为有重大偏离时即被认为是入侵。基于规范的入侵检测是介于异常检测和误用检测之间的入侵检测技术,由手工定义程序的正常行为规范,并监视程序执行,不需要维护大量的特征库,也无需历史数据的训练,并且能检测未知攻击,误警率低。

基于规范的检测技术可以检测针对Web服务器应用层的漏洞,对于通常的脚本类型的攻击,URL过滤也是一项重要的检测方法。现有检测URL攻击方法都是基于规则的,针对每一种入侵行为,提炼出它的特征并按照规范写成检验规则,从而形成一个规则数据库,然后将捕获的数据包按照规则库逐一匹配,若匹配成功,则认为该入侵行为成立。

2.2 WIDS模型设计

保护Web服务器的入侵检测模型WIDS(Web-based Intrusion Detection System)模型结构如图1所示。

图1 WIDS模型结构

控制器,接受来自URL检测引擎和安全规范检测引擎的检测结果,将检测结果转化成特定格式,作为响应模块的输入,同时结合来自响应模块的响应结果回馈信息,输出给系统管理员。

入侵响应模块,接受来自控制器的数据,根据一定的响应策略对入侵行为进行相应的响应,保护Web服务器。响应策略是根据系统的容忍性、响应的代价和预测入侵损失为每个入侵行为赋予相应的权值,最后根据权值执行相应的响应机制。

嗅探器,用来获得网络数据。

URL检测引擎,作为Web Server保护的第一道防线,直接进行URL攻击的检测,以减少系统资源的消耗。工作时,将检测规则组织成决策树,对每一个URL请求数据搜索此树,一旦搜索到匹配的特征则返回,并将检测结果提交控制器。

规范检测引擎,利用结合了异常检测和误用检测两种技术的规范检测技术对入侵进行检测,包括管理器、操作系统审计数据收集器、数据分发器、分析器,模型如图2所示。工作过程[2]为:管理器监视审计数据中的系统调用,检查是否存在与主体表达式匹配的记录,当存在时启动相应的分析器,分析器利用管理器中相应的安全规范执行。分发器通过处理数据收集器传送的数据,将有关的审计记录输入到分析器数据队列中,分析器通过检查审计记录中是否与已定义好的安全规范相一致来判断是否发生入侵,如果发生入侵,由控制器对数据进行整理后,提交到响应模块,执行相应的响应。

图2 规范检测引擎模型

3 模型关键模块实现

3.1 管理器的实现

当入侵检测系统启动,管理器作为守护程序对系统调用exec进行监视,作相应的处理,直到入侵检测系统关闭,管理器才退出。在管理器中,不仅要管理一个特权程序的安全规范数据库,并且每一个安全规范对应一个选择表达式,实现的流程图如图3所示。

图3 管理器的流程图

3.2 数据收集器的实现

审计数据的获取,是通过一个审计数据状态指示变量Audit_state实现的[4],其作用是跟踪当前数据收集器的工作变化情况。当启动数据收集器时,该变量取值为START;若需要打开审计数据文件时,取值为NEXT_FILE;当数据收集器从文件中读取审计记录时,取值为READ_FILE;当关闭当前审计数据文件时,值为CLOSE_FILE。图4为该模块的实现流程图。

图4 数据收集器的流程图

4 WIDS应用实例

4.1 Code Red worm检测

当用户的输入在URL中存在/default.ida时,URL检测引擎通过将URL中的内容与规则库中规则进行匹配,匹配成功时,将会检测出Code Red worm,并将检测结果交给控制器,由响应模块给出相应响应。

4.2 httpd缓冲区溢出的检测

当用户访问Web时,通常是先通过GET向HTTP发出请求,而GET没有对输入的大小进行限制,所以HTTP后台监视进程httpd存在缓冲区溢出漏洞。如果攻击者利用此漏洞则会造成缓冲区溢出,令系统挂起,而执行攻击者的代码,这样攻击者最终将获得管理员权限。在正常情况下httpd是在收到请求之后执行http目录下的文件,因此,可以通过限制httpd在收到请求后必须执行http目录下的文件的方法,编写httpd安全规范。通过检查httpd在接收到请求之后是否执行http目录下的文件,就能判断出是否发生了入侵。

4.3 WIDS模型的检测过程

首先,将GET的请求数据先在URL规则库中进行匹配,检测是否存在URL攻击,如果存在,将检测结果提交给管理器。同时,管理器监视审计数据中的系统调用execve,当检查到GET时,通过匹配主体表达式,启动httpd分析器,然后,httpd分析器调用并执行管理器中httpd的安全规范,分发器通过对数据收集器传送的数据进行处理,将有关httpd的审计记录输入到httpd分析器数据队列中,httpd分析器通过检查审计记录中的系统调用read,通过判断其是否执行http目录下的文件来判断是否发生入侵,如果发生入侵,由控制器对数据进行整理后,提交到响应模块,执行相应的响应机制。响应模块随后将处理结果回馈到处理器,由处理器负责向管理员输出结果。

5 结论

本文设计了用于保护Web服务器的入侵检测模型。根据Web服务器的特点,首先采用基于规范的入侵检测技术来检测针对Web服务器漏洞的攻击,基于规范的入侵检测技术结合了异常检测和误用检测,并能克服两者的不足。然后应用URL过滤技术来检测针对脚本类型的攻击。结合两者建立起一种保护Web服务器的入侵检测模型WIDS,并对关键模块的实现加以说明,最后通过实例分析了该模型的工作过程。

参考文献:

[1]唐正军,李建华.入侵检测技术[M].北京:清华大学出版社,2004.

[2]寺田真敏,萱岛.TCP/IP网络安全[M].北京:科学出版社,2003.

[3]Paul E. Proctor.入侵检测实用手册[M].北京:中国电力出版社,2002.