本文作者在电力企业从事信息化工作近6年,深知IT系统建设和运维工作的繁琐和不可控性,经常有这样的疑问,“看看别人家是怎么做的呢?”。此次有幸到世界100强华为公司质量与流程IT管理部亲临现场进行调研,颇有收获,现在发挥简书的风格,跟大家一起分享讨论下!
华为的信息化规模
类型 | 数量 | 单位 |
---|---|---|
IT员工 | 7500 | 人 |
业务应用 | 800 | 个 |
数据中心 | 70 | 个 |
VM虚拟机 | 400,000 | 台 |
网络带宽 | 185 | Gbps |
数据总量 | 320 | PB |
内部用户 | 100,000 | 人 |
机柜数量 | are neat | $1 |
机房面积 | 13,000 |
供应商合作模式
1. 人员外包 供应商只提供人力,不参与项目管理,建设工作全部由甲方负责完成;这种模式的关键在于招聘和人员管理;缺点是供应商附加值低,人员流动性大
2. 项目外包 供应商负责独立交付,甲方负责交付质量的把关和验收;此模式的关键在于项目交付的质量把控;需要和供应商共建质量保证体系和项目管理体系来改进交付质量
3. 服务外包 供应商的绩效由SLAs、里程碑、交付成果质量、业务价值等来度量,是产品级别的外包、运营和维护的外包;此模式的关键在于管理创造客户价值;供应商可以负责整个产品的支持和维护,有助于供应商在本领域内的知识积累和保留,有利于促进供应商致力于长期的投资和持续改进。
华为公司信息化建设
华为公司内部的信息系统建设,均采用基于项目的外包模式。
- 按照业务分类 IT实施开发、测试、维优;IT产品分析设计;IT解决方案分析设计;软件包类
- 按照供应商分层 将供应商划分为5个等级的信任度,建立供应商资源池地图,推动供应商聚焦领域,提升供应能力,提高交付质量)、
- 按照领域分蛋糕(基建网安、IT技术与架构、办公IT、解决方案、IT应用实施-BI、IT应用实施-PLM、IT应用实施-ERP)。
华为公司的项目外包模式更注重自身对产品质量的管控,华为的IT部门(负责内部信息系统建设)有2500名员工(其中500多需求和开发人员),另外有5000名外包人员,每个项目经理带领一个团队。甲方人员负责需求分析、制定解决方案、系统规划、系统架构,负责与系统用户交互,乙方负责详细设计、代码开发、测试,甲方技术人员掌握核心开发技术,掌握系统代码,具备对乙方代码质量的鉴别能力。将项目划分等级,不同等级的项目对项目经理、任职要求、工作年限有不同要求。其IT部门成立了公司的专家团队(应用、数据、技术、业务)。
IT产品实施流程
IT产品的实施流程包括6个阶段:
- 概念阶段
- 方案阶段
- 实施阶段
- 验证阶段
- 执行阶段
- 关闭阶段。
IT产品参与人员角色及职责如下:
- 项目经理:制定项目管理计划、采购需求、招投标、合同履行、验收付款、版本监控/进度管理/问题风险管理、试运行、版本评价、总结关闭等;
- 系统工程师:产品架构设计/优化、产品设计指导等;
- 业务分析师:产品需求分析、产品需求定义、产品需求管理及验证等;
- 实施工程师:开发;
- 测试工程师:测试;
- 质量保证工程师:负责交付件检查;
- 配置管理员:系统配置管理、配置审核及建立基线。
- 质量保障工程师和配置管理员:从项目概念阶段即开始参与项目,直至项目关闭。
全流程中设置了5个关键检查点(KCP):确认需求分析报告、确认需求规格、合作分包执行、准入验收、验收审核。
华为IT需求管理
1. 组织管理
- IT投资决策:华为成立跨部门团队统一负责IT投资决策,保证流程IT集中化管理,为虚拟组织。公司层面以“变革指导委员会”、“变革项目办公室”为领导机构。
- IT需求管理:公司IT需求管理团队覆盖公司各个业务部门,负责需求评审和授权范围内的小额投资决策。公司层面成立“公司业务变更与IT管理团队(C-3T))”,各业务域设置“领域需求管理团队(Sub-RAMT)”,各地区设置“区域需求管理团队(R-RAMT)”。一个RAMT成员一般是6-8人,由IT人员牵头,包括IT专家和业务代表。
- 需求全生命跟踪管理:每个需求管理团队有一名端到端负责人,负责需求的全生命周期管理,负责提醒、通报当前处理人。
2. 流程管理
下图为华为公司BT&IT需求管理流程图,目标是快速解决业务在使用IT过程中的痛点和诉求。每年编制年度需求规划,占全年工作量的80%,另外20%为日常零星需求、临时需求。
- 需求收集:需求提出包括两种情形,一是用户直接在需求管理平台中直接提出,适用于日常零星需求;另一种是需求管理团队主动收集,包括访谈、调研、领导讲话、社区等渠道中发现的IT需求,适用于年度规划或IT项目需求收集。年度规划由业务部门使用《需求跟踪矩阵》主动收集需求,作为规划输入,规划结束后归入IT项目,由各业务部门的需求接口人导入需求管理平台。IT项目由项目组使用《需求跟踪矩阵》主动收集需求,经过业务主管确认后,由项目组的需求接口人导入需求管理平台。
- 需求评审:由各需求管理团队(RAMT)中的业务代表、解决方案专家主导对需求进行分析评审,主要包括:确认需求合理性,决定需求是否要做,决定应由哪个项目承接等。对于一些负责重要需求(包括跨领域或跨产品、流程/IT综合、有争议的需求等)可以发起有RAMT团队评审决策,把分析结果和建议提交RAMT例会进行评审。【SLA时限要求:需求分流2天,需求确认15天】
- 需求实施:分为两个阶段,a、解决方案分析阶段,主要输出需求规格说明书;b、IT实施开发阶段,交付IT系统,包括待排版本、启动开发、开发完成、测试、发布等环节。【SLA时限要求:需求解决方案分析15天】
- 需求关闭:主要是用户对需求交付的实际结果给出满意度评价,对不满意的需求指明原因,以指导需求处理人员不断改进。
3. IT支撑
上述流程(需求收集、需求评审、需求实施跟踪、用户反馈)均通过需求管理平台在线填报、审批、流转,整个过程均可视化,做到可跟踪、可提醒。需求单关联到项目、关联到系统版本。
应用系统监控
从2015年开始,华为对内部的IT系统启动做产品运营,通过产品运营报告展示应用系统的使用情况,建立了产品运营平台(用户分析、行为分析、实时运营、关键业务量、产品质量分析)。
数据指标体系:
- 用户数据(用户量、访问量、用户活跃度);
- 产品使用数据(页面参与度、页面停留时间、跳出率、弹出率、访问轨迹、各功能/资源使用、按钮提交成功率、按钮平均处理时长、用户满意度);
- 产品健康度(访问性能、事件分析);
- 业务数据(业务量、转化率、业务流程效率、办公效率提升、审批通过操作时长、驳回操作时长、业务提交成功率)
系统开发管控
- 敏捷开发与交付 将需求自上而下分解为业务问题、问题解决方案、实现版本、敏捷迭代不同的颗粒度及关注点,通过专题看板的形式进行流水线式的开发,流水线中包含“待确认、需求、分析、待排发布版本、启动开发、开发完成、转测试”等环节,通过看板中任务的拖拉形式来调整当前任务所在的阶段。敏捷开发一般以5-12人为一个团队,大小视项目或任务复杂情况而定。看板的管理应由项目组长或技术经理完成,通过每日例会等形式布置工作并调整任务阶段。
- 开发平台 华为的系统开发平台是统一的,外包无论是项目还是人员均是到华为指定的时间地点,在指定的平台上进行开发。通过统一的平台可以便于统一开展优化,也可以能降低运维的工作量,临时性的任务也便于调集资源进行处置。
- 项目工作量评估 主要还是采用基于功能点的工作量评估方式。在开发工作量上,主要基于对代码量的方式开展评估:通过工具统计代码的部分特征(包括代码行、分支情况、嵌套情况等),评估代码的复杂度,通过复杂度评估出工作所需要的人天,并根据成本基线核算成本,在验收的时候检查成本与工作量的符合程度。
信息系统运维
华为公司有15年以上的IT运营实践,其运维遵循ITIL3.0标准 ,开展以IT服务为导向的运维,采用全球运维理念提升运维效率和质量。目前正在建设统一的运维操作平台,构建故障自动监控及自愈平台。结合云计算、大数据提升系统监控和运维效率也是下一步待解决的问题。
华为公司在处理故障过程中,按照故障的严重程度进行等级划分,其中一级/二级事件工作日要求1h内解决,10min响应;三/四级事件要求8h内解决,非工作日24h内解决。监控人员24小时值班,夜间采用手机接收告警或通知值班。华为公司在重大业务上都会做好保障一级临时处置措施,除非有非常紧急且必要的故障需要到现场。
华为公司基于HP ITSM的运维工具进行了修改,形成一套完善的自动化运维工具平台。事件管理方面,运维过程中若发生故障,采用尽快恢复正常IT服务,使业务负面影响减到最少,保证服务水平。运维安全方面,运维人员通过专门的运维通道和运维工具保证,运维过程有详细的审计日志记录,并通过大数据实时分析日志,判断是否出现运维权限的异常行为如拷贝了机密资料等,极大提升了内部人员的安全隐患。
故障处理经验积累:华为同事认为运维主要还是要靠经验,只有通过不断的积累,才能增加快速定位故障的能力。建议在日常运维过程中应增加知识库管理,充分发挥技术骨干、专家的经验,要把知识的传承工作固化到工作过程中,并设立相应的知识积累检查点,便于知识的积累与传承。对系统的每个模块定责任人CIO,根据事件级别通知人员到位,快速恢复业务,并注意将事件处理和问题处理分开。运维过程中遇到的最大故障问题一般为采用了新技术的系统,因此,为了系统的安全稳定运行,应尽量避免过多使用新产品新技术,待技术成熟后再做引进。