上海财经大学借助ZStack Cloud建设大数据AI实训云平台,利旧原有FC SAN资源,并新购GPU服务器组建GPU计算集群,以更弹性、更灵活的新一代实训云平台代替传统的教学实践平台,支撑大数据分析处理以及深度学习、人工智能模型训练/推理等高性能计算业务,实现资源的集约化使用、动态调度、精细化管理,提高了教学实训效率。
一、构建大数据AI实训平台,提升财经教学效率
上海财经大学(以下简称学校)源于1917年南京高等师范学校创办的商科。1921年学校迁至上海,创建上海商科大学。1932年独立建校,定名为国立上海商学院。1950年,学校更名为上海财政经济学院。1985年,学校更名为上海财经大学。
上海财经大学信息管理与工程学院的前身是成立于1982年初的经济信息管理系,2005年撤系建院。学院开设信息管理与信息系统、电子商务、计算机科学与技术、数据科学与大数据技术4个本科专业。
二、高性能运算需求,遇上低门槛运维成本
为了给学生学习和实践大数据、人工智能相关课程提供便利,学校基于ZStack的私有云技术建设大数据AI实训云平台,以更弹性、更灵活的新一代实训云平台代替传统的教学实践平台,实现资源的集约化使用、动态调度、精细化管理,提高了教学实训效率。
1、建设学院统一实训云平台,支撑大数据、AI人工智能相关课程教学和实践
大数据、AI属于典型的计算密集型应用场景,需要云平台具备高性能资源的管理和调度能力,可以提供高性能的CPU和GPU算力。项目中涉及到T4、V100等不同型号的GPU设备,云平台需要支持多种不同型号GPU设备的透传/虚拟化功能。
2、满足连续、长时间、高负载的运行场景
在大数据、AI的使用场景下,云主机的CPU与GPU往往连续、长时间处于高负载状态,要求云平台能够具备超强的稳定性,支撑长时间高性能计算的业务需求。
3、要求云平台使用门槛低、易于管理和运维
学院的IT管理工作由老师兼职,老师同时还要负责教学工作,因此能够投入到云平台管理工作的时间相对有限,需要云平台易使用、易运维,管理省心。同时,云平台需具备高可用设计,防范各类异常故障的发生,提高业务可用性、保障数据安全,能够提供丰富的资源监控和告警手段,以便及时发现问题和潜在风险并快速处理。
三、集中式存储结合弹性调度,充分发挥IT资源价值
1、采用ZStack Cloud的集中式存储部署方案,利旧客户原有的FC SAN存储阵列,提供存储资源;结合新购部分GPU服务器,配置NVIDIA T4、V100等GPU卡,组建GPU计算集群,提供通用计算和GPU异构计算资源,批量、快速发放实训课程所需IT资源,支撑大数据分析处理以及深度学习、人工智能模型训练/推理等高性能计算业务。
2、借助ZStack Cloud提供弹性、灵活的资源调度能力,在实训课程结束后快速释放和回收资源,提供给其他业务使用,实现资源的高效共享、复用,充分发挥IT资源的价值。
四、灵活易用与高效能兼备,最小损耗较大效益
1、ZStack Cloud部署灵活,对各种硬件的兼容性好,无需担心厂商绑定,建设成本和后期扩容成本可控;交互逻辑友好,云平台功能完善,负责IT管理的老师无需经过长期的培训学习,也能快速掌握操作技能,管理省心、维护成本低。
2、通过ZStack Cloud,用户可批量、模板化发放云主机、云硬盘、虚拟网络等资源,相比物理资源,具备弹性伸缩、动态调度、快速部署和回收等优势,同时性能损耗较小,能够支撑用户的大数据、AI等高性能计算场景使用需求,通过弹性分配、高效调度,节约硬件投入达到50%以上。
3、ZStack Cloud具备一键无缝升级特性,用户可持续通过版本升级获得新功能、新特性,升级过程耗时小于15分钟,升级过程无需停机中断业务,较大程度的简化了云平台的运维管理工作。