前言:本站为你精心整理了交通设施评测系统的应用范文,希望能为你的创作提供参考价值,我们的客服老师可以帮助你提供个性化的参考范文,欢迎咨询。
作者:王天瑞王环华健记閤成国单位:上海电科智能系统股份有限公司
提高运维精细化管理水平交通设施管理和故障处理一般都有一定的流程和制度,但没有配套的技术手段的支持,流程和制度往往难以真正地得到高效贯彻执行。系统将规范交通设备的管理,实现交通设施设备从购买、入库、使用、维修、报废的全生命周期管理,降低设施的养护成本;规范交通设备运维工作中故障处理流程,规范交通设施故障发生、故障恢复、故障维修、修复确认、维修完成后故障单信息完善、故障延期修复报备等环节;落实养护相关的制度,并可针对各个环节进行考核,从而提高交通设施的运维管理水平和效率。提高运维效果评价科学性怎样评价运维系统使用后的效益?需要看它给正在运行中的系统和设备带来哪些改变,这些改变是积极的还是糟糕的。系统从不同用户所关注的问题入手,依据需求结合实际数据设计相关的考核指标。考核指标从三个角度来进行评价分析:从系统设备健康水平,从运营方和养护方的管理服务水平,从系统产生的经济效益角度。通过运维管理系统自动记录的过程数据来多角度统计分析,量化表达各种考核指标,能够提高运维效果评价的科学性。智能交通设施管理系统集成了中间件、GIS、FLEX和视频识别等先进技术,实现了三个层次共32项主体功能,下一章节将会对系统设计和实现进行简要阐述说明。
设施运维系统及评价体系的设计和实现
1系统架构设计
智能交通设施综合管理系统分为状态信息采集层、智能分析报警层和人机交互界面三层,对应的系统软件架构分三层设计:信息采集、智能报警分析、平台系统。如图(1)所示。信息采集层负责设施运行信息的自动化采集,向智能报警分析和平台系统提供基础数据。它直接或间接通过设施提供的标准接口或系统接口采集相关状态、性能、配置等运行数据,数据内容包括:服务器告警信息、服务器性能、应用软件状态、网络设备运行信息、网络拓扑信息、机房动力环境监控信息、外场设备状态和采集信息等。信息采集方式可集中和相结合,使采集软件灵活部署。智能报警分析层负责分类汇总信息采集层采集到的数据,通过报警阀值和报警规则预处理后生成基础事件,不同来源的事件经过过滤,同类事件经过压缩,相关联的事件经过根源分析,获得用户所需的根源报警,根据报警事件重要程度进行分级,整个过程实现了向平台系统提供设施的智能报警。平台系统层围绕设施运维应用,实现各种业务功能,具体业务功能包括:资源管理、日常养护、日常监控、应急保障、业务报表、系统评价。系统的用户角色分为养护公司、运维管理人员、运行管理人员和部门领导四类。各角色主要业务职责如下:(1)养护公司:综合报警监控的确认巡检;故障报修登记、设备报修签收、设备维修结果登记等;(2)运维管理人员:设备报修签发、设备维修结果审核、设备报修搁置列表管理、设备停用管理,设备生命周期管理;设备基础信息采集入库及维护、机房设备位置、端口、接线、IP、VLAN等资源信息采集入库及维护;(3)运行管理:内外场设备报警查看处置;(4)部门领导:对各岗位操作情况进行统计考核。
2设施信息采集
状态信息采集层主要实现外场设备状态信息采集、内场设备状态信息采集、机房环境监控信息采集,所有采集的信息会接入消息总线中间件并存入历史数据库,为进一步智能报警分析提供数据支持。(1)外场设备状态信息采集:系统通过接口协议,实现对信号机、电子警察、监控摄像机、卡口、情报板、车检器等外场智能交通设备运行状态信息采集;(2)内场设备状态信息采集:通过IBMTIVOLI智能基础设施管理软件实现对服务器、交换机、数据库、应用软件等内场设备运行状态信息采集;(3)机房环境监控信息采集:通过接口协议采集机房温湿度计、UPS、配电柜、空调、消防、门禁和地漏报警信息。
3智能报警分析
智能报警分析层根据采集的状态信息,经过压缩过滤和算法分析,可以综合判断故障根源,为快速处置和问题诊断提供参考。(1)报警事件压缩过滤:根据采集到的状态数据和维护人员指定的报警规则,生成基础事件。对于同一种设备的同一种事件,由于事件产生的渠道不同,会生成多条重复的报警信息,比如通过交换机主动上传的trap事件,和根据交换机的状态数据生成的事件可能会出现重复报警的情况,对这种事件进行过滤。对于某种瞬间发生或者处在报警边界值的事件,可能会频繁的生成和消失,这样就会产生很多重复无用的事件。为了避免这种情况,通过设置平滑周期,对这种事件的生成进行压缩。(2)事件根源分析:通常情况下,在生成的众多单点事件中,往往是由其中的某几个根源事件导致的,根据单点事件之间的逻辑关系和被管对象之间的物理拓扑关系,依次递归查找,根节点对应的事件,即为根源事件。(3)事件分级:报警事件级别分四级普通事件:需要养护人员关注,事件作用一般为预防提醒非关键设备某些指标工作异常,但设备还能工作,不影响其他设备。警告事件:需要设备管理员和养护人员关注,事件作用一般为提醒非关键设备工作异常或不能工作,但不影响其他设备。严重事件:需要值班员关注,告知设备管理员。事件作用一般为关键设备工作异常或不能工作,影响分系统内局部设备。致命事件:需要值班员关注,及时电话通知设备管理员和养护人员。事件作用一般为关键设备工作异常或不能工作,影响全局设备或全系统正常运行。智能报警分析应用场景示例,如图(4)所示。
4运维管理应用
运维管理应用主要实现日常监控、日常养护、应急保障、资源管理、生命周期管理和业务报表分析统计等功能。(1)日常监控:通过机房模拟图、二维或三维地图监控外场设备,以列表和图表的形式展示设备运行的实时信息,报警事件产生,自动定位故障设备,按照报警级别,启动关联预案,监控人员按照预案处置。如图(5)所示。(2)日常养护:日常养护工作通常有设备定期巡检、临时故障维修、抢修,养护中要遵循养护制度,养护过程需要规范,设计了养护流程管理。它支持多岗位跨网络协同工作流程化管理,包括故障报修登记、故障签发管理、任务签收管理、维修结果登记、维修结果审核、搁置列表管理和归档列表管理等。如图(6)所示。为养护更加便捷和使用系统更方便,引入了手持终端。如图(7)所示。图(7)(3)应急保障:在突发重大事故或灾害的情况下,保障各系统正常运行,需要应急保障手段,系统提供一些辅助,主要有各类灾害事故预案模型演练、培训,应急设施资源的查询,预案相关人员组织。如图(8)所示。(4)资源管理:基于自主开发的GIS支撑管理平台和Flex机房管理功能对内外场设备位置、端口、接线等空间和属性信息进行协同维护管理。(5)生命周期管理:对设备安装、建设交付使用、每次维护、到最终报废进行全生命周期过程记录和管理。(6)业务报表:对系统资源情况、设备资产保值、监控设备性能、设备故障、养护记录数据、各职责岗位绩效考核、等多方面进行综合统计分析。
5系统评价分析
系统相关的用户大致分为三类:投资方、运营管理方、养护公司。三者都有对使用该系统期望和诉求。投资方的诉求:建设这套系统后,今后的运维养护能否更省钱,能否为运维养护提供长久支持;运营管理方的诉求:养护效率、质量、养护水平得到提高,人均台班费用得到控制,自身的管理改进和提高,运营管理取得的成绩可以量化,能更好的为业务部门提供系统保障;养护公司的诉求:能更省时省力的完成工作,能更好的响应运营方的要求。针对这些诉求,结合运维的信息,制定了对应的评价指标,指标从三个方面回答用户的诉求:资金成本、运维服务水平、系统健康水平。(1)资金成本=节省的养护人工成本+节省的设备成本,节省的养护人工成本核心指标是人均的费效比和设备养护率。设备养护率随着养护的年限逐年增长,可以根据实际设备使用环境,同行业水平,结合系统记录的养护记录制定,一般第一年0.4,保修期内,每年增长0.1,过保修期每年增长0.2,以3年保修期计算,到第5年设备养护率达到1,这意味着过保的设备5年后的养护频率要大于1。人均的费效比=人工总花费/(人均出工时间×养护团队人数)。节省的养护人工成本=(今年的人均费效比-上年人均费效比)×(今年设备养护率/上年设备养护率)×上年人工总花费。节省的设备成本的核心指标是过保设备每年的折旧价值和当年设备过保的备件花费。过保设备每年的折旧价值根据设备的使用环境和it设备折旧值制定,it设备一年质保,5年报废,一般过保设备每年的折旧价值为:设备采购价格×0.2。设备过保的备件花费是指设备过保后,维修的备件花费。节省的设备成本的公式:Σ(单个过保设备每年的折旧价值-当年单个设备过保的备件花费)。(2)运维服务水平=运维管理绩效×50%+养护服务水平×50%,运维管理绩效的核心指标是养护任务的完成率;养护服务水平的核心指标是养护任务质量平均得分、养护任务规定时间完成率和养护培训成绩。养护任务质量得分最高不超过100分,每次养护任务由审核人员根据养护制度要求和养护结果综合评分。养护培训成绩由运营公司组织养护人员学习和考试评分。运维管理绩效=养护任务的完成率×100。养护服务水平=养护任务质量平均得分×40%+养护任务规定时间完成率×100×40%+养护培训成绩×20%。(3)系统健康水平=设备总完好率×100,设备总完好率是指所有设备完好工作时间的比率。设备总完好率=Σ(单个设备实际完好工作时间/单个设备理论要求完好工作时间)。评价的指标结果通过图表的方式直观表现,如图(9)所示。
系统项目实施效果
(1)使用这套系统后,可量化从养护资金使用效率、养护成本、养护运营绩效、系统运行稳定等多方面带来的改变。(2)通过设定指标,从管理绩效、成本核算等方面量化考核运营公司。(3)设施全生命周期的管理,对设施质量评估提供了数据支持,对设施资产进行了优化配置。(4)以规范的方式管理养护数据,在管理过程中能方便的统计分析系统的不稳定点,排查系统隐患,保障系统运行稳定。(5)综合的智能报警,提高了故障排查效率;报警预案、报警联动,加快了故障的响应速度。(6)强化了养护制度的管理,对养护安全、养护纪律起到规范、督导作用。(7)应急抢修的管理、手持设备应用、各种应急养护预案的培训和演练,为应急保障提供了技术支持。(8)手持终端设备的应用,使得养护全过程信息直达、高效、迅速,系统提供更有力信息支持。(9)规范的管理养护数据、落实养护制度、养护应急预案的培训等,使得养护知识、养护经验共享,提高养护服务水平。
总结
设施运维的自动化和智能化,大大节省了人力,减少了人工错误判断,使得运维设备的范围、数量,管理的深度、精细化程度大大提高。设施运维的一体化,实现了多部门对设施的协调管理,使设施运维可持续适应各业务部门的应用要求。科学的、可量化的评价,让用户能更好的实践运维方法,改进工作,今后,可不断丰富和细化评价指标,让我们每一项工作的改进都能体现价值。下一步可以考虑把建设的施工方案、施工检查纳入管理,使得施工过程可追溯、设备接入更安全,运维信息更完整。