前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇产品运维管理范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
但这并不令人感到奇怪,因为在IT运维领域,吴凯和他所在的联华信就是保障IT系统安全运行的医生。
监控从基础设施转向应用
IT基础架构库(ITIL,Information Technology Infrastructure Library)这一IT服务管理理念被引入国内已有十几年了。在吴凯看来,迄今为止ITIL的核心内容没有变化。ITIL有两大核心内容:第一是围绕IT系统日常运维的管理,比如事务管理、故障管理、安全变更、问题管理等,以及在这之上延伸出的投入和产出关系平衡的处理;第二是ITIL虽然已经升级到了第三版,但实际上也只是将IT运维向整个IT系统的建设范畴进行了延展,增加了系统开发、测试的管理内容。
既然核心内容没有变,在一线服务客户时,联华信认为自己只关注客户关心的内容就好。以联华信多年服务的邮政集团公司、邮储银行来讲,这两个客户最典型的特点就是规模大。比如邮储银行,在业务集中管理后,就难免会涉及大数据的概念。而邮政集团公司既有全国中心也有省中心,对一个包裹从北京到广州的运送过程中产生的监控数据,现在又新增加了云计算的处理方式。“从IT运维管理本身来说,真正的内涵没有发生特别大的变化,而只是客户的关注点发生了变化。”吴凯表示,“原来客户只是关心基础设施的综合监控,比如几年前更关注网络和服务器,但现在他们关注的是应用的监控。因为底层的数据库、服务器一般情况下都是非常稳定的,但有很多应用是依据个性化开发出来的,对客户来讲是非常核心的部分,一旦出现问题会影响业务。”
在ITIL理念推行中,部分企业很容易进入一个误区,认为实施了ITIL就会解决一切问题。但实际上ITIL实施的基础,第一是来源于底层CMDB(Configuration Management Database 配置管理数据库)的构建;第二是来源于底层监控系统的构建。ITIL确实让运维人员在流程配合上更规范了,但对系统出现问题后能不能尽快解决,推动意义不大。“监控系统或者运维系统的正确实施,取决于对系统的深度理解,这个理解是基于CMDB的。做好系统运维的前提是,首先必须理解系统,在这个基础之上,进行有效的监控,才能让流程更有效。”吴凯建议,“对于客户来说,IT系统的建设应分两步走:第一步构建CMDB、构建监控。第二步是实施ITIL。”
安全管理:事件、变更、流程
IT运维实际上仅属于系统安全的一部分,而不是系统安全的核心。企业在配置好安全设备后,才会从运维的角度,针对系统的安全管理提出需求。这时,运维部门主要面对的就是对安全事件、安全变更、安全问题的管理。
企业对于安全事件管理最主要的需求是,一旦出现安全事件,企业需要第一时间知晓。安全事件一般会分为两大类:第一类是系统运行不稳定或者出现故障;第二类是运维人员出现高危操作,比如误删文件。“我们会对安全事件进行集成监测,一旦安全设备有什么事件,可以通过监控系统展现出来。”吴凯对记者表示,“根据ITIL理论,一旦系统出现安全问题,就需要有一个类似服务台的功能做出初步响应。我们的监控系统会配置一个集中的告警服务台,客户在打进来电话前,服务台就已经知道系统出问题了。服务台后面会有一个知识库,用来判断哪类问题应当转给哪个部门去解决,这个知识库也是在为客户服务的过程中积累形成的。”
所谓安全变更,是指企业IT系统配置的修改。而变更的前提是要预先对变更结果做出判断、分析。以应用为例,假设一个应用具有100个功能点,每个功能点内部使用了哪些服务的构建,每个构建会对数据库的哪个部分、哪个表进行访问,这种关联关系必须要梳理出来。吴凯也向记者举例称:“以联华信的银行类客户为例,客户的某一个转账操作变更,可能会影响到省分行或地方支行。所以在前台系统出现这些变更前,如果没有进行全景的关联分析,风险会很大。”
而对于系统安全问题的管理和系统安全问题的彻底解决,都被归于IT运维工具对安全问题的管理,在联华信的产品或解决方案中,是通过流程的方式来推动进行的。
国产化替代新机会
IT运维管理是指对企业IT 运行环境(如软硬件环境、网络环境等)、IT 业务系统和IT 运维人员进行的综合管理,涉及对企业IT底层架构的信息安全监控。当前在IT运维管理领域,实现高度安全可控和国产化替代也被证明是可行的。包括联华信在内的一些国内IT系统运维服务商正在依靠自己的技术、产品、解决方案,力求实现IT运维管理的国产化替代。
吴凯表示:“此前一些规模较大的企业客户比较关注国外产品,一是因为品牌,二是因为国外产品规范性比较好。而现在,对于倾向于选择国产产品的客户来说,他们更关注ITIL理念在落地的时候,是不是符合自己的需求。相比之下,国产产品更适合国内企业的需要,也适合分期建设。再加上近期国际上各种信息安全事件的发生,也促使国内出现扶持国产产品发展的趋势,这对国内IT运维厂商是个机会。”
只有打造自主可控的IT运维工具,才能满足当前政府、企业对于信息安全保障的切实需求,才能真正实现国家安全。鼓励发展国内IT运维产业,加快国产化替代进程,是保证政府、企业信息流通安全、操作运维安全的有效手段。
而对于国内IT运维厂商在产品和解决方案方面的不足,吴凯归纳说,IT运维既涉及流程,又涉及底层架构的运行监测。在运行监测领域,国内的产品做得还不深入。据吴凯介绍,很多做ITIL实施的IT运维厂商,原来都是做OA(办公自动化)的,虽然做流程得心应手,但做底层监测就不会很深入。这个时候,一部分客户实施了他们的产品和解决方案后,就会发现不能解决运维监测的问题。而对于运维部门来说,核心职能就是发现问题、定位问题、解决问题。如果发现问题的工具不能达到客户的要求,就会让客户缺乏安全感。“所以对国内IT运维厂商来说,在ITIL 理念与产品的结合上,以及底层架构的监测上需要多下功夫。”吴凯向国内IT运维厂商建议。
畅想全面运维
对于运营商来说,一旦信息系统建设达到一定规模,其整体信息系统资源的监控和管理就成为必须考虑的问题。其中涉及基础网络设备、安全设备、网络优化设备、网络加速设备,以及网络管理设备等,称之为信息系统的全面运维。从长远考虑,用户需要一个全面运维的解决方案,来帮助他们加快信息化的建设。
据悉,神州泰岳软件股份有限公司日前在京了基于IT运维管理的全线产品,共八款新产品。这一事件表明:在中国运维管理市场,具有自主版权的全面运维管理解决方案已经诞生。
这八款新产品诠释了神州泰岳的业务方向――专注于运维管理领域的系统网络管理、服务管理、安全管理和数据管理四大业务,它们分别是服务管理流程方面的电子运维管理系统、IT服务管理支撑平台、统一投诉管理系统;系统网络管理方面的综合监控管理平台、系统管理软件和服务水平管理系统;信息安全管理方面的安全运行管理中心、统一身份及访问安全管理系统。
坚定业务方向
早在1998年3月,当国内用户对“网络管理”还不太了解的时候,神州泰岳就开始从事高端系统网络管理软件的研发与服务。随着企业的逐步壮大,神州泰岳得到了客户的广泛认可。IBM、BMC、CA、HP等领先的软件公司陆续与神州泰岳合作,共同拓展这一市场。
2002年5月,羽翼渐丰的神州泰岳在了完全自主版权的系统网络管理平台Ultra-NMS1.0之后,董事长王宁决定走自主研发的道路,同时也确定了公司的定位――专注运维管理领域,做中国的运维管理专家。基于运维管理的定位,神州泰岳在确定了网络管理、服务管理、安全管理和数据管理四大业务方向之后,相继组建了系统网络事业部、信息安全管理事业部、服务流程管理事业部和数据应用管理事业部,进行自主知识产权产品的研发,形成了具有自主产权的运维管理产品。
在运维管理界耕耘多年之后,神州泰岳在国内运维管理市场上拥有最广泛的客户群.成功实施了数百个运维管理项目。比较典型的电信行业应用包括:中国移动五省BOSS网管项目和十四个省数据网管项目;中国移动总部电子运维管理系统(EOMS)项目;中国联通三十一个省综合数据网管项目;中国网通总部EDC综合网管和DCN网络的安全运行管理中心项目等。
主导中国市场
在实施运维管理项目的过程中,神州泰岳的技术水平和服务水平不但得到了客户的认可和高度评价,还得到了业界的一致好评。
【关键词】自动化运维 PAAS ESB DevOps 故障自愈 SAAS
为实现信息化引领企业发展,原有的系统将不断通过迭代和扩展功能来达到健壮和完善的目标,而与此同时,外部的互联网技术、云计算、大数据技术也在不断的为各个行业创造新的价值。不断增长的IT规模,以及各类技术栈在广州供电局的应用,和日益增高的安全及可用性需求,都对运维工作提出了更高的要求。如何进一步提高业务稳定性,提升IT对业务的敏捷响应,甚至辅助业务运营分析,都是未来很长一段时间需要不断对运维进行思考的问题。
自动化运维是一种运维模式的创新,这种模式会结合平台系统、运维流程、运维人员能力、以及业务辅助来规划和建设。它既能从实际层面解决运维的重复性工作执行效率、提升运维的安全性和准确性,以提升业务的可靠性,也能帮助将运维模式朝新型的DevOps模式进行转变,运维可自定义运维工具来满足多变的场景,提升运维的创造力,提升IT敏捷效率,以及为业务辅助提供数据与平台。
本文通过技术研究与实践后,对自动化运维体系的理解,包括自动化运维框架体系、平台逻辑设计、建设阶段与路径、最佳实践等内容,参考了当前主流的IT技术:Consul、Netty、Nodejs、Tornado、Nginx、Docker等,以及DevOps运维理念,再深入结合广州供电局的具体运维场景和现状,进行了分析和规划,并探索出可落地的自动化运维规划。
1 IT运维自动化推动背景
随着业务模式多样化的需求,以及IT技术飞速的发展,广州供电局对IT系统的运维,已进入一个“新常态”。在这个“新常态中”,广州供电局IT运维有一些显著的变化:
1.1 规模大
广州供电局平台规模呈快速增长趋势,新业务规划需要更庞大而又灵活的IT架构来进行支撑,服务器数量、运营数据、安全风险种类日益增多。
1.2 技术栈复杂
各类操作系统、虚拟化平台、应用中间件、业务配置选项等加大了管理复杂度,软件定义数据中心、容器技术、大数据、云计算等高效技术的引进增加了IT人员技术储备的压力。
1.3 新的开发模式
业务系统的开发运维,从单体、瀑布架构,向Devops、微服务架构演进。
1.4 IT敏捷性的要求
应用、更新比以往更频繁,应用可用性要求为永久可用等等。
电力的信息系统整体运维也面临着从旧运维模式到新运维模式的转变,传统运维模式的三个重要特征:
(1)依赖于运维人员的运维管理技能与经验;
(2)以脚本作为配置管理的主要手段;
(3)各个系统之间没有打通,运维管理需要在不同的系统与平台间手动切换。
而探索新的运维模式需要具备三个方面的特征:
(1)运维管理不再依赖运维脚本,而是基于场景化的运维工具;
(2)运维平台强调自动化,能够进行自动化巡检、故障恢复等;
(3)强调可编排(编程)性,能够通过编排等手段支持复杂的运维场景。
2 IT运维自动化设计方案
2.1 IT运维自动化设计思路
广州供电局在自动化运维的过程中也做过很多的探讨,除了积累大量的自动化脚本外,也考察过Ansible、Saltstack、Puppet、Chef等自动化运维工具,但是遇到过很多的难点,而从难点中提取出来的经验就是,自动化运维不应以技术和平台为驱动力,而是要以运维场景为驱动力。
这也是自动化运维落地的难点所在:自动化运维需要满足且持续不断满足业务定义的运维场景,而运维场景有着变化、灵活、跟企业运维模式紧密相关的特点。并且还需要应对运维组织、运维技术能力等带来的一系列变革和冲击。
在这种前提下,我们首先需要定义自动化运维的场景并且认识它的特点。运维的场景是指:一系列运维活动与管理活动的联动,并遵循流程进行满足业务需求的运维设计。例如:软件安装,是一个运维活动;而业务部署,则是一个运维场景,除了软件安装的活动外,还有配置、验证测试、上线切换等运维活动,并且还需要遵循企业业务部署的流程和安全规范。这个场景里面,需要用到资源驱动力、流程集成性、自动化执行、流程编排等一系列技术,而这还只是一个场景。
通过详细的调研,广州供电局典型的运维场景部分列举如下:
业务部署:完成业务软件的安装、配置、验证测试、上线切换等动作。
配置变更:修改平台、软件、用户等的配置信息以及配置基线管理。
状态巡检:对系统运行状态进行常例化巡检,评估系统运行状态。
容量分析:实时分析系统容量信息,输出容量报表,管理阈值,触发容量告警。
故障响应:能够基于故障类型、业务类型等信息自动化对故障M行分析处理。
自动化运维框架建设的原则应充分考虑场景化运维的复杂性、扩展性和灵活性。并应该具备如下几种能力:
(1)自动化运维平台应具备PAAS的能力,它能驱动企业各个IT组件,包括新的技术如互联网组件、大数据平台等,旧的如已有的一些各个厂商的设备,它的扩展性要比以往的要求更高,而不是局限在厂商自己软硬件产品的自动化运维工具上,要脱离工具上升到平台级别;
(2)平台能高效集成企业运维流程,将ITSM和ITOM高度联动,实现流程真正的自动化;
(3)运维应具备运维开发的能力,运维IT需要从传统产品化运维人员,走向开发运维,自己能通过运维开发的方式实现自己的个性化运维需求,并帮助业务实现敏捷交付。
2.2 自动化运维框架
参考ITOM理念和主流自动化运维技术架构,从打造IT运维能力角度出发(IT运维能力是指企业信息化运维的一套效能体系),围绕IT运维能力持续的建设,将不断丰富和优化企业的运维模式。设计的自动化运维框架如图1。
在这一套体系里面,有两个概念非常重要:
2.2.1 PAAS平台
自动化运维的运维对象驱动能力至关重要,这也是自动化运维场景得以实现的最大技术阻碍,PAAS的能力在于可以通过Agent、接口、协议等多种模式来驱动运维对象,无论是硬件还是软件;并且PAAS提供了企业可以定制自己运维SAAS的能力,只有按这种模式走,才能去覆盖企业定制化的、庞大复杂的运维需求。
2.2.2 \维能力的落地
运维能力不能仅局限于单个产品的功能便捷,它应该是从运维需求和规划出发,多个运维SAAS应用来组装成运维能力,如图2。
2.3 自动化运维技术关键-运维ESB
如何高效驱动各个自动化运维的对象,以及并保留持续的扩展能力,将是自动化运维技术关键所在。这里参考业务系统的ESB(企业服务总线)模式,建设一套企业运维的服务总线,并采取如图3所示。
运维ESB的模式将解决核心问题:运维流程调度。脚本原子可以实现对资源驱动,原子可以相互组合成服务组件,应用API可以直接注册到ESB。这种模式的价值体现在将各个IT对象的操作原子化,不仅可充分利用已有对象开发的API和通用协议,还可以将企业已有的脚本沉淀并导入;原子组装成服务组件,服务组件将具备更大的灵活性,这对场景的支撑将会覆盖度更完整;服务组件的积累将丰富运维ESB的能力,并可以快捷方便的支撑各类工具和运维应用。
2.4 自动化运维落地模式-运维SAAS
如果定义运维自动化需要一系列的运维工具及产品来满足各个场景,那在自动化运维平台上,比较完美的方式则是建设一个开放的SAAS应用环境。基于SAAS运维APP形成企业的运维应用商店,满足各个运维人员的多场景运维需求,并以此为可落地的方式建设企业运维能力;SAAS应用统一调度平台的底层驱动能力,从而构建一个可快速、便捷和扩展的整体运维体系与能力;SAAS应用的来源可来源于真正的一线运维人员,让他们具备运维开发的能力后,能真正积累出属于自己的运维应用,并助力IT运维转型;运维的SAAS应用将会是从运维场景需求出发,而产生的运维工具,如图4所示。
3 IT运维自动化建设规划
冰冻三尺非一日之寒,自动化运维的建设也不仅仅是一套产品、一个项目可以达成的,自动化运维需要按不断满足业务场景,不断抽象出运维能力的模式来实现。要实现成熟的自动化运维要分三个阶段:
(1)梳理阶段,进行需求调研,含运维场景梳理,运维需求整理。这个工作是自动化切入的重中之重,调研要覆盖运维班助的各个运维领域,而且需要了解运维工作、运维自动化需求等运维人员的诉求,以及管理上的需求。以广州供电局的数据库运维为例,梳理出来的内容有日常工作,巡检(查看服务状态、数据库用户状态、性能状态、表空间使用率、CPU、磁盘使用率)、物理备份和逻辑备份检查;周期性工作,周报(故障、优化项工作、处理的告警)、月报(关键系统运行情况(CPU、内存、服务状态、性能情况));非周期性工作,安装数据库、账号管理、数据管理-导数等、安全加固、性能调优、表空间扩容、后台日志清理(监控平台给出)、数据库迁移(1年7-8次)、版本升级。运维人员提出自动化需求含数据库用户管理,巡检、部分报告,数据库日志管理,表空间自动扩容,自动导数,数据库环境交付,安全加固,后台日志清理。
(2)阶段规划,包括运维对象接入、运维APP开发、运维能力集成,定义3-5年的运维SAAS应用建设规划,并围绕持续的运维能力建设展开,如图5所示。
(3)持续改善与运营,包括APP集成、DevOps建设、故障自愈建设,持续优化等;
以DevOps为例,代码构建、自动化测试、代码检查、版本持续交付,标准化企业流程,实现自动化。
4 结语
本文针对目前广州供电局和电网信息系统的运维现状,结合新型的互联网技术架构,提出的自动化运维的理论、自动化运维架构、自动化运维的规划建设。主要集成了运维PAAS、运维ESB、运维APP商店等技术概念,并充分结合电网信息系统运维的特点,提出整体的自动化运维建设模式。随着政府十三五信息化指导意见书明确提出打造智能化运维体系,同时随着企业内外部IT环境的变化,自动化运维将为企业的运维效率、敏捷业务支撑、提高业务可用性带来全新的局面,然而自动化运维的建设的确不容易,且会对企业运维的整体架构带来巨大的改变,所以需要以步步为营、逐步建设的思路来带动电力信息系统自动化运维建设。本文提出的部分架构和思路,已逐步开始应用于广州供电局的运维场景,并在提高效率、提高运维质量、提高安全度上取得了不错的效果,后续将持续的建设,使企业持续获得IT的有效支撑与价值呈现。
参考文献
[1]李亚琼. 场景化运维―平台、引擎与自动化,2016 全球运维大会,2013.
[2]毛承国,张卫华,张进铎,等.大规模集群运维自动化的探索与实践[J].信息安全与技术,2014(02).
[3]温超.电力信息系统运维管理自动化解决方案[J].山东电力技术,2012(01).
[4]杜成武.IT运维综合管理平台实现科技管理信息化[J].金融科技时代,2012(08).
[5]王庆霞.浅谈IT运维管理的应用与实践[J].信息安全与技术,2012(11).
[6]戚伟强,沈潇军,洪建光,等.基于ITIL的电力信自动化运维体系研究[J].现代电子技术,2012(02).
[7]闫龙川,刘军.企业信息系统自动化运维工具研究与应用[J]. 供用电,2015(08).
[8]李磊.IT自动化运维平台建设和应用 信息技术与标准[J].信息技术与标准化,2016(10).
作者简介
赵静(1982-),女,湖北省武汉市人。硕士学位。广州供电局运维工程师。研究方向为信息运维。
设管理阶段和运维管理阶段。相关研究表明,电子政务生命周期符合“二八”现象,规划、建设阶段约占20%时间,运维阶段约占80%时间。
可是,当前对这80%的运维工作却有待进一步清晰其职责。我们狭义上解释“运维”似乎就是纯粹负责信息系统的“运行和维护”,工作范围仅负责到设备故障维修、系统能够运行的层面,不涉及对信息的内容管理,更不涉及信息技术与业务工作融合的问题。
笔者文中所谈论的,是广义上的运维,是指在保障信息系统正常运行的前提下,以服务信息化应用为目标,促进信息技术与业务工作深度融合,推进信息资源共享,实现“提高行政效率、降低行政成本、改进政府工作、方便人民群众”的电子政务运维工作。
目前,电子政务运维工作中存在的主要问题主要表现为: 一是仅从硬件故障的角度考虑运维问题,认为处于保修期内的设备损毁由承建公司承担,不需要运维工作;二是认为建设了信息系统就实现了电子政务,信息应用意识不强;三是缺乏科学规范的信息化运维管理体系,运维工作处于无序状态;四是缺少信息化运维费预算,科目运维费用难以审核;五是没有建立统一运维管理平台体系的理念和设计目标。
明白了现有的电子政务运维体系存在的不足后,我们需要从以下几方面进行建设。
建立信息资产基础数据
建立信息资产基础数据、梳理业务流程,既是电子政务运行维护预算编制的基础,也是开展电子政务运行维护管理的前提。按照业务部门、项目来源、信息资产要素等内容指导客户建立了信息资产分类目录和信息资产基础数据库。在业务流程上结合运行维护管理工作要求,开展业务流程梳理工作,明确了各业务流程的岗位及职责。同时,从业务对服务需求出发,梳理运维需求和目标、细化运维服务内容,并形成运维服务目录,明确运维服务级别,从源头上平衡业务部门对服务需求和服务供给之间的平衡。另外,结合客户的组织架构,重新建立科学的运维组织架构,以及自行运维和运维外包相结合的管理模式,做到职责清晰和任务明确。信息资产分类目录和信息资产基础数据库的建立,以及业务流程的梳理,为电子政务运行维护预算编制提供了重要的支撑。
在上述基础上,根据实际情况制定服务管理系统需求说明书,针对流程平台产品和体系架构各功能点进行详细的定义与说明,对目前业内流行的平台产品进行评测分析,并对产品选型决策提供支持;对项目的各个功能点的技术和开发风险进行评估和提供相应的解决措施,降低实施过程中的风险。另外,对集成实施和产品选型进行专家审定和把关,并对各项投资进行预期的绩效评估,保证把资金用于项目的关键点上,降低实施成本。
加强运维外包管理的认识
近几年,政府信息化建设一般能够得到资金支持,但由此增加的机构和人员受到了编制等原因的限制,难以配套落实。纵观发达国家电子政务运维服务外包已成为发展趋势。《关于推进国家电子政务网络建设的意见》中指出,技术支持和运行维护要坚持社会化、专业化的方向。实践证明,服务外包是促进应用的有效途径,随着信息需求不断增长、业务融合不断深入,电子政务运维服务外包也是我国电子政务由发展阶段进入成熟阶段的必然选择。
信息化运维服务外包具有多种组合模式,可分为部分服务外包和全服务外包两种方式。前者是被动式服务,后者是基于职责的主动式服务。两者的区别在于前者主要是利用了人力资源,后者是人力资源与智力资源并用。
同时,规范服务管理流程。管理流程是指为达到既定的服务管理目的而组织起来的逻辑上有关的、有规律性,并可重复的活动,借鉴服务管理最佳实践ITIL,将服务管理分为服务支持和服务交付两大部分。通过规范服务管理流程,可建立快速反应、优质服务的长效工作机制。
模块化设计运维管理系统平台
借助监控工具和流程管理软件,建立统一高效的运维管理平台,运维管理平台的设计采用模块化、分层次的结构。系统采用多层架构、信息总线技术,具备良好的性能和扩展性,系统为用户提供了C/S和B/S的两种展现模式,为关注不同层面的用户服务,以方便管理人员使用C/S对网络进行专业管理,运维人员使用B/S对网络进行值班监控。
在组织管理技术上,基础构架管理是单位内部已存在的各种监控管理工具,面向网络一体化管理,采集基础构架中各种管理对象的配置、性能、事件信息,再将这些信息按统一格式分类并处理,信息统一后的被发送给业务转换管理平台。
管理平台对来自基础构架平台的信息进行分析、过滤、筛选,再转化成运维所需的业务信息发送给流程管理平台。流程管理平台接收来自用户或客户的事件报告信息,将这类信息自动转化为业务信息,并和来自基础构架的业务信息一起传送给上一级请求处理。
服务器运维工程师需要负责客户产品的应急、售后,解答客户在使用过程中遇到的技术问题,帮助客户排除故障。下面是小编整理的服务器运维工程师工作岗位职责,欢迎查阅。
01
职责:
1、 负责服务器VPC网络的规划、可用性维护,以及混合云环境下的VPN网络的配置;
2、 负责本地服务器上架、本地服务器资源和云服务器资源的管理,负责备份策略的制定及执行。有zstack和云服务商(阿里云、腾讯云等)的使用经验优先;
3、 负责服务器的脚本管理、基础监控、磁盘管理、容量规划、应急响应等;
4、负责Linux环境下常用软件的搭建和维护,比如时钟、DNS、SLB、TOMCAT、JENKINS等。
5、 探索、研究自动化运维技术方向,有编程兴趣者优先(可培养)。
任职要求:
1、3-5年运维从业经验,熟悉常见的自动化配置管理工具,100台以上服务器运维经验者优先;
2、精通Linux系统基本操作及配置,熟悉至少一款主流Linux服务器发行版。有红帽认证者优先;
3、熟悉zabbix,falcon等主流监控系统的部署和配置;
4、熟悉shell和python,可以独立完成常用的脚本编写;
5、熟悉Tomcat、Nginx、DNS、时钟、JENKINS等常见软件的配置、以及常见问题处理方法;
6、 熟悉网络基础知识、熟悉TCP/IP的工作原理,会配交换机或路由器,能熟练的对网络情况进行分析
7、具有团队合作意识、良好的学习能力、沟通能力和亲和力、良好组织能力和协调工作能力,具有高度的工作责任心和良好的职业道德。
02
职责:
1、负责公司客户站点的上线与维护,能够与国外机房进行有效沟通;
2、负责linux和windows下大型网络服务的部署与维护;
3、负责各个系统网站的规划,对服务器构架进行优化和改进;
4、负责服务器系统的日常维护、数据库备份,服务监控和常规系统健康检查、突发事故处理;
5、编写相关系统环境部署文档和培训文档;
6、对服务器及安全故障能够及时有效地响应并解决。
任职资格:
1、5年以上web服务器的管理维护经验;
2、熟练掌握Linux系统的操作和维护,具有一定的Shell等脚本编程能力,熟悉常用开源项目;
3、精通Apache, Nginx和Tomcat等主流 Web 服务器配置,熟练使用各种网络维护相关的指令与熟练使用服务器管理分析工具,能独立配置与维护管理;
4、精通数据库服务器的维护和优化,包括:备份恢复,数据库调优,数据迁移,异地同步,安全防护,熟悉使用相关操作的指令;
5、熟悉通过LVS/Keepalived/Hearbeat等技术实现负载均衡;
6、精通Cacti/nagios/Zabbix等至少一种开源的服务器监控方案。
7、具备良好跨部门沟通协调能力,自我学习能力。
03
职责:
1. 负责App、公众号服务平台的服务器日常运维,包括:App产品后台、应用系统、数据库、操作系统的部署、迁移,及运行异常状况排除;
2. 新产品/服务、功能模块的部署上线,日常运维状况监控、优化工作;
3. 执行服务器系统的例行检查测试,并分析运行数据,提供系统使用、维护的建议;
4. 配合产品研发部门,参与整体系统的架构规划、性能优化。
任职说明:
计算机相关专业大学本科以上学历,具有扎实的计算机基础理论知识;
熟练使用Linux/windows等常见操作系统,熟悉zabbix、nagios、cacti等开源监控工具,熟练使用shell、python其中一种脚本语言,熟悉虚拟化技术xen、kvm;
熟悉JAVA环境及nginx、tomcat、jboss、redis、memcached等常见常见应用服务,熟悉MySql及Oracle数据库的安装、配置、灾备等;
熟悉各种云架构服务(例如阿里云、腾讯云、AWS等云部署环境)
04
1、对服务器进行日常维护,确保各项服务连续正常运行。
2、负责服务器存储网络等基础平台的技术维护和问题处理 ;
3、负责执行大客户服务项目的定制化服务配置和硬件安装等处理工作;
4、了解操作系统安装与配置;
5、具备一定的网络相关故障解决能力;
6、熟悉主流厂商PC服务器硬件安装与配置;
7、Windows、Linux、VMware等日常管理、维护;
8、负责服务器异常或故障的受理、跟踪、解决以及统计分析;
05
职责:
1、负责公司各生产服务器、测试系统服务器系统部署及日常运维;
2、负责公司虚拟化平台及云平台专用网络,数据库,云存储等日常运维工作;
3、使用主流监控软件,监控生产/测试系统的硬件、系统、网络、数据库运行情况,分析并排除相关故障;
4、制定生产、测试系统的运维规范及流程并进行优化,提升工作效率和服务质量;
5、建立和完善大规模分布式集群的运维工具,提升运维效率和质量,协助公司的日常IT事务。
任职要求:
1、 精通TCP/IP、HTTP/https,DNS,VPN等协议,具备较好的网络知识及运维能力;
2、熟悉LinuxServer的运维,熟悉shell/Python中的至少一种主流脚本语言;
3、精通WindowsServer的运维,擅长分析系统日志,及时发现系统问题并处理;