01 引言 新型基础设施(简称新基建)它包括七大领域:5G基站建设、特高压、城际高速铁路和城市轨道交通、新能源汽车充电桩、大数据中心、人工智能、工业互联网。
2020年4月20日,国家发改委明确【新型基础设施】主要包括三方面内容:信息基础设施、融合基础设施、创新基础设施。其中信息基础设施是本文所研究的重点,也是所在业务运维的主要对象:包括以人工智能、云计算、区块链等为代表的新技术基础设施和以数据中心、智能计算中心为代表的算力基础设施等。 基础设施的发展一直是互联网、大数据、AI等技术领域的驱动力。在大型企业中,基础设施的技术研究与体验设计占有一定比例。对设计师而言,面向后台运维产品的体验设计存在一定门槛,尤其现实中设计师为非运维领域的用户,对运维知识理解度不高、认知感差,很难用“同理心”去分析和映射,所以,需要提出一套体系化的设计方法,指导设计师更好地理解用户的行为,并且提出更优的设计策略,让设计形成有效思路,而绝非是个人喜欢或灵光闪现。 本文围绕云计算领域的数据中心基础设施进行体验设计研究,探索新基建场景下,数据中心平台化、智能化、高效化的服务体验,挖掘决定设计决策实现的关键因素,并在设计原则、设计流程的指导下,对关键要素进行分析、提取、串联,从而衍生出最终的设计方案。
02 数据中心运维特征 2.1 运维对象 云计算领域的基础设施,包括计算、网络和存储三大类,涵盖了数据中心、网络、服务器、运维中心、容器、数据库、存储、中间件等多个领域。除了设施硬件,数据中心的工作人员、后台运维人员、服务器供应商等也是运维管控的对象。因此,运维对象可以概括为以下三个: (1)人:基础设施的使用者及被管控者 如数据中心驻场工程师、机房经理,服务器的供应商等。“人”具有角色类型多样、多企业背景混杂、权限划分粒度细等特征。 (2)机:设备及其设备上的服务应用 数据中心的基础设备达上百种,实体的如服务器、机柜等,虚拟的如服务器上部署的应用、数据库等。“机”是数据中心场景下人机交互的高频对象,设备的状态直接影响运营环境和人的行为。
(3)场:基础设施运维的场景和环境 如在电力系统和暖通系统设施下运行的数据中心的动力环境;以及为确保动环的稳定,进行的定期巡检、随工维修等运维场景。“场”具有关联性,当出现异常需要多维度排查;“场”还具有特定性,不同场景下的运维对象和操作都具有一定差异。 下图2对数据中心的运维对象及其关系进行说明,“人”一方面对设施设备进行操作管控,但同时所有人机交互的场景下,数据中心的人员操作也都受到监控、记录。“机”是“场”构成元素,共同搭建起数据中心环境,同时环境的好坏也影响其中的设施设备,“人”“机”“场”三者相互影响共同作用。
2.2 运维特征 运维是对机房、网络、服务器、服务等生命周期各个阶段的运营与维护,使其在稳定性、效率、成本上达成一致可接受的状态。运维覆盖了产品从设计到发布、运行维护、变更升级至下线的全生命周期。作为基础设施的运维,需要确保服务可以7*24H不间断地为用户提供服务。其特征主要有以下5点: (1)大规模 基础设施服务器规模在大型互联网企业一般具有百万级别;除服务器外基础设施还有多种设备类型,规模巨大;随着全面上云时代的要求,规模在逐步加大。 (2)高复杂 运维体系庞大,大量不同维度的运维事件同时进行,相互影响,如设施运维、服务器运维和服务器上的服务发布升级。同时,运维支撑的业务具有多样性,不同业务对运维要求存在差异,如操作系统、设备型号、升级方式的差异,越来越多定制化高级功能给运维带来了复杂性。
(3)高安全 云计算领域下的新型基础设施最关心的就是安全、稳定。因为基础,所以根本,牵一发而动全身。基础设施的运维故障产生的后果会被无限放大。如机房内空调故障导致温度升高,会影响该机房所有的服务器散热异常,进而导致服务器上的服务无法正常运行,影响客户使用。 (4)重效率 基础运维具有较高的时效要求,对异常、报警的处理有很强的时间约束,如3分钟不处理故障将面临升级后果,每一秒级延误都可能造成不可逆风险;由于规模化和复杂度,导致操作流程、环节增多,效率显得尤为重要。 (5)控成本 成本是门槛,也是考量技术竞争力的最后一项标准,在基础设施领域谁能降低成本,谁就可以从价格上占领先机,赢得更多的市场机会。成本最终会成为业务能否生存、能否吸引到客户的关键因素。
2.3 设计挑战 运维产品的体验设计,在技术专业性和用户高水平上都有自己的明显特征。同时运维体验某种程度上受限于技术和业务,无法像C端产品那样完全的从以人为本的用户角度出发,完全的贴合用户的心智模型。在面对业务难度与专业要求的情况下,需要平衡和满足双方诉求,这也给设计师带来一定挑战: 首先,业务理解难度大,专业词汇多。基础设施运维领域覆盖面广,具有较高的专业技术门槛,对设计师来说上手难度大。同时由于运维产品多为企业内部产品,很难找到参考与借鉴。 其次,用户群体专业性强。设计师不是用户,采用同理心&假装用户的方法会略显苍白,真正的用户大多为专业性较高的高级用户,且大多为企业内部人员,很难进行对外用户研究;用户基数也较C端少。
再者,体验需求层级存在差异。受到权限差异、用户运维对象数量级的差异和习惯差异的影响,设计中需要多维度思考,明确低量级和高量级信息对设计的影响,考虑用户不同的诉求。 最后,基础设施技术迭代快。云计算领域的技术在不断突破与发展,新的技术带来运维方式的革新,也会进一步影响产品体验的设计。基础设施的快速发展,需要设计不断的迭代并考虑延展性和扩展度。 近几年,有越来越多的设计师参与到后台产品的体验设计中,面对后台运维产品,没有接触过的设计师可能很难理解它的复杂性和技术性,行业中也没有关于“运维体验”的相关研究。在面对以上挑战时,如何体系化的开展设计工作,通过科学的、有效的分析与方法指导,设计出满足用户需求的产品体验是后台运维产品设计师所要解决的难点。
03 基于操控感的运维体验模型 3.1 运维体验设计模型 在运维体验设计模型中,共包含三层:第一层是设计原则,它向下指导作为设计表现的牵引;第二层是设计表现,即用户可以感知和操作的界面,第三层为用户心智与系统实现。 设计中仅有设计原则的牵引,是无法满足用户使用的真正诉求,因此将用户心智与系统实现的因素纳入设计表现,共同构成有效的设计模型。 中间层的设计表现是核心,是用户使用产品的媒介。在基础运维场景下,梳理分析系统实现显性要素,调研挖掘用户心智隐形要素,这样设计出来的产品才能解决目标用户的问题,即便我们设计师无法运用“同理心”,但依旧可以设计出满足用户需求的产品,提供满足运维工程师所需的工作体验。
3.2 数据中心系统分析 在数据中心基础设施运维中,各要素都不是孤立地存在着,每个要素在系统中都处于一定的位置上,起着特定的作用,共同构成了一个不可分割的整体。分析各要素之间的关系,以及系统与要素、环境之间的关系,便于我们从整体来了解系统实现的规则,从而梳理和分析已经存在的显性要素,确保技术层面的正确性,满足业务的基本诉求。 面对数据中心复杂的数据关系,我们按系统的思维进行信息拆解与梳理,如下图所示,梳理了环境、系统、结构、功能、要素分别对应的信息,明确不同层级下用户关注的信息以及系统可以收集的指标。 围绕数据中心从全球视角>设备视角的拓扑链路将数据信息分层展现,除了单个系统,还要考虑数据中心与环境的关系,外部的自然风能,可以给数据中心的新风系统提供能源;外界温度越高会直接影响数据中心内部暖通系统的耗电。这些系统逻辑的关联在界面设计表现中也需要体现出对应的数据依赖。
04 总结与展望 在基础设施运维体验设计中,通过“操控感”模型的分析与设计流程的指引,帮助设计师更加体系化的思考,使设计表现更能满足业务和用户的需求。本文提出的模型帮助参与这类产品的设计师,快速找到解决对策,在面对产品“谜团”的时候,尽可能快速梳理思路,设计出满足产品功能、用户需求且思考全面的运维产品。 随着“新基建”的发展,相信也会有更多的人投入到云计算基础设施的体验研究中来,同时技术上也会有更加智能化的突破。 随着运维的复杂度不断增加以及智能化、自动化运维技术的辅助,相信运维“操控感”的体验模型也会不断变化,去满足新时代下运维体验的需求。怀揣着现阶段的思考与理解也会一直探索,随着深入,期望有更全面的理解和认识。