中国蓝云自动化管理运营系统建设

中国蓝云自动化管理运营系统建设

摘要:本文阐述了“中国蓝云”自动化管理体系在运营中的建设实践,在系统技术实现、建设运营框架、自动化运营的实现、应用及资源管理等几个方面给出了设计思路和实现要点,以供广电云计算业务相关从业者参考。

关键词:中国蓝云自动化管理运营DevOps模型

1引言

浙江广播电视集团“中国蓝云”以运营服务为理念进行设计,目标是为集团下属单位和区域媒体机构提供以用户体验为导向的服务,实现以一套管理软件即可将存储、网络、服务器、安全设备等系统进行有效管理。“中国蓝云”设计之初就是面向台内外众多用户的不同办公生产业务需求,系统如何让使用单位能自我管理是设计重点和初衷,通过管理体系建设,提高自我服务能力并实现“平台”和“租户”间的二级管理。

2系统总体设计

“中国蓝云”自动化管理运营系统基于云平台统一的底层资源和支撑服务,利用租户“独立运营,资源共享”的理念构建自服务运营体系。自服务运营体系需要满足云平台的总体服务和运营需求,需要向租户提供自选超市货架式服务,并提供自动计费和完善的混合云资源管理能力。系统主要包括两大模块,即系统运营平台与系统运营支撑平台。系统运营平台主要是一套面向用户人机交互操作的门户,实现工具、服务、应用的管理,以及商品订单的管理和交易;系统运营支撑平台主要负责运营平台功能的支撑实现,使用工作流技术完成操作的装配和串接,并负责调用PaaS服务、应用服务、基础架构服务,实现平台系统接口的相关功能。系统框架结构图如图1所示。租户可通过运营平台中云平台门户查询服务资源及价格、申请云平台自服务门户账号、账号充值、申请云平台服务资源,通过自服务门户可以进行云平台服务资源管理、监控服务资源状态、查看操作日志等工作。运营人员可以通过运营门户完成对服务资源的统计、查询,掌握服务资源余量信息,制定不同服务规格、业务套餐,并确定相应的价格,进行审批服务资源申请,掌握服务资源消费、收益情况,处理问题单,对账号、角色权限进行统一管理等。运营支撑平台作为自服务运营平台的后台,主要解决运营层面的问题,完成运营后台支撑工作,例如将工具或商品等信息到门户、费用信息统计等。自动化管理云平台可直接调用设备管理接口,也可以调用管理二级控制平台(Vcenter),实现资源自动化管理。可提供资产可视化管理能力,实现资源有效聚类,帮助管理人员对资源定位、进行虚拟资产的有效管理、提供虚拟资产管理决策支持等。

3主要业务单元

3.1运营平台设计。运营平台是一个个包含IT资源、IT服务、媒体服务及工具的服务门户,通过自服务支撑平台实现用户订购的各类产品的自动装配和交付。云平台自服务门户应该提供多层级用户管理,提供灵活的权限分配策略,支持服务流程自定义的能力。自服务门户具有多租户管理能力,各租户具有自己独立工作区,用于申请、管理和回收相关资源。门户能提供良好的管理功能,帮助租户更好地实现资源可视化管理。首先,通过虚拟化管理软件形成云计算资源管理平台,实现对数据中心内的计算、网络和存储等硬件资源的软件虚拟化管理,对上层应用提供自动化服务,其功能包括虚拟计算、虚拟网络、虚拟存储、高可用性(HA)、动态资源调度(DRS)、虚拟机管理、文件系统、交换机策略等。其次,通过云业务的管理中心,我们对融合资源池、生命周期管理、业务中间件管理、租户管理、身份认证、安全管理、计费与账务、服务运营、服务水平管理、业务流程自动化管理等云资源中的各个模块进行调度并实施精准管理。

3.2基础架构和应用服务平台。基础设施主要是指云计算平台的IaaS层设备,如防火墙、交换机、服务器和存储等硬件设备。计算资源采用虚拟机和容器,用于部署上层业务应用与所需要的核心服务以及媒体处理服务、数据服务和其他相关资源。在存储方面,采用分级存储设计,在线存储区域采用读写速度快的硬盘存储设备,用于保存较热的数据;待数据达到生命周期后,迁移至读写速度较慢的硬盘存储设备。这些硬件设备的基本信息和彼此的关联信息通过自动化管理体系收集,保存在元数据中。对这些硬件进行设备的开发得到IaaS中间件统一接口,再根据门户的需求实现功能模块接口。基础资源架构方面,依托“中国蓝云”现有IaaS资源池,选用计算、网络、存储等相关资源作为底层资源进行构建。运营平台中的虚拟机、存储、VPC等基础资源需求下发时,调用公共功能模块层接口,公共功能模块层调用IaaS统一接口,IaaS统一接口层再调用AgentPool中的计算资源、存储资源、网络资源接口等。系统接口调用关系如图2所示。

3.3运营支撑平台设计。为接收运营平台下发的工具、服务及应用管理指令,需要借助工作流引擎执行已定制完成的工作流,实现工具、服务及应用的自动化部署、监控、启停、回收和元数据统一管理。工作流仓库是一系列工作流规则集合,一个工作流就是对某个工具/服务的业务流程规则的定义,例如定义了转码工具的工作流(先创虚拟机,再装转码软件,再加配置数据等)。工作流引擎是根据工作流仓库定义的规则去实际完成业务部署和执行业务运转监控。工作流的执行需要先选择模板实例,再根据选择的模板实例系统自动生成对应的Ansible脚本,最后通过Ansible脚本去部署各种不同的Role(服务)。工作流规则执行过程中需要用到IaaS、PaaS中间件,完成对IaaS、PaaS的操作。自服务运营平台接口调用关系如图3所示。实际使用过程中我们发现,具体的业务应用系统都或多或少有些内部参数需要根据业务具体情况进行适配和调整,并不如我们预想的那样完全自动化地创建使用,个别事例也可以通过人工创建的方式纳入管理,但是整个框架保持了对业务的良好兼容性,平台适配了多种类型的业务应用环境,例如呼叫中心的桌面应用、办公桌面应用、云盘应用、云非编应用。

4结语

在“中国蓝云”项目中,采用了基于DevOps模型的广电混合云平台自动化管理运营系统建设,DevOps模型集开发、测试、部署和运营为一体,促进了开发、运营等部门之间的沟通协作。浙江广电混合云平台运行维护体系提供的服务虚拟化的方案,将开发测试中的一些不可用环境,通过技术手段虚拟出来。服务虚拟化不仅能够帮助虚拟出测试人员想要的真实环境,还能提供一些不可预测的环境,进而通过足够广泛的测试,保证应用的质量和稳定性。“中国蓝云”平台采用多租户方式推广业务使用,目前服务集团和有关租户已经超过60家,平台进入快速迭展,但项目建设和维护团队力量没有明显增加,这证明此自动化管理运营系统发挥了用户实现自我管理的实际价值。目前,浙江广播电视集团正在规划进行多数据中心的建设,这对于“中国蓝云”的自动化管理运营系统来说,需要补充多平台协作、交互式管理、用户交互认证、资源管理和冗灾等新课题。我们认为任何一套管理运营系统,对实际业务需求必须形成良性迭代,期待这套自动化管理运营系统逐步完善,以助推“中国蓝云”获得跨越式发展。

参考文献

[1]聂艳龙.云计算在广电行业内的应用与发展[J].有线电视技术,2014(4):94-98.

[2]陈观林,罗列异.面向广电行业的资源管理平台设计与应用[J].广播与电视技术,2008(10):101-104.

[3]刘敬刚.有线电视云服务的发展与思考[J].广播电视信息,2015(1):36-39.RTN

作者:陈向东 单位:浙江广播电视集团