ZStack Cloud云平台为某直辖市交警提供能够同时支撑CPU通用计算和GPU异构计算的私有云方案。客户可以根据应用需求实现灵活、可弹性伸缩的GPU资源分配,充分利用宝贵的GPU算力。
一、需求背景:支撑城市交通底层海量数据的分析和处理
面对庞大的城市体量,某直辖市交管部门面临人多、车多、路少的困难程度,是其它城市所无法比拟的。在交通整治过程中,单靠一刀切地行政限制是不能解决问题的,把维护交通秩序放在首位,切实考虑到市民的实际需求,方能取得良效。在某直辖市交管部门治堵的成功实践中,“智能信号灯系统”功不可没。智能信号灯不是简单示意停止或通行的,而是通过多渠道感知和收集交通数据,给出信号控制和交通组织的较佳方案。
客户此次建设的智能信号灯系统,其原理是综合利用物联网技术实现多维感知和收集交通数据,将数据统一汇聚到数据中心,然后利用大数据、人工智能技术对感知端返回的海量数据进行实时处理和分析,并给出实时的交通态势分析结果和下一时段交通态势的预测研判,为交管部门分析和决策提供参考依据。
而这其中的关键,对海量数据的实时处理和分析,均基于云计算平台完成,包含大量的图像、视频分析等非结构化数据处理,并且整个数据采集和处理的过程非常强调实时性,因此需要云计算平台具备超高的资源调度能力,为多种实时分析算法、应用提供强大的算力,同时由于交通信号灯业务的特点,底层云平台必须具备超强的稳定性、可靠性,确保上层应用高可用。
二、方案规划:ZStack Cloud私有云解决方案
针对上述需求,ZStack Cloud提供能够同时支撑CPU通用计算和GPU异构计算的私有云方案。
1、针对图像、视频分析等深度学习、AI推理类场景应用提供GPU型云主机,每台物理服务器配备若干张NVIDIA Tesla T4卡,根据推理算法和应用系统对云主机GPU数量的不同需求,每台物理机可提供若干台高性能GPU云主机,较大提高视频图像分析的效率,并且能够根据应用需求实现灵活、可弹性伸缩的GPU资源分配,充分利用宝贵的GPU算力。
2、由通用X86服务器和全闪存SSD硬盘构建分布式存储池,为云主机提供高性能云硬盘,消除IO瓶颈。
3、针对CPU密集型应用提供通用型云主机,可以与GPU型云主机部署在相同的物理机上,云平台根据物理机的负载进行动态的资源调度,在确保云主机性能的前提下提高物理机资源利用率。
三、客户收益:轻量化云平台,业务无间断扩展
1、ZStack Cloud具备超轻量化设计,资源开销较小,虚拟化后云主机的性能损耗低于5%,能够为客户的高性能计算场景提供健壮、稳定的基础架构支撑。
2、在云平台界面即可轻松完成GPU透传/虚拟化的配置,实现GPU资源的灵活、弹性分配使用,支撑深度学习、AI推理类应用,充分发挥GPU算力的价值。
3、支持基于通用的X86服务器和全闪存SSD盘构建分布式存储,提供低时延、超高I/O的存储空间,支撑实时分析、交易类业务,无需购买昂贵的全闪存储阵列,避免厂商锁定。纵向和横向扩展均可在线完成,业务无需停机,扩展时存储集群的性能和容量亦可趋近于线性扩展。