返回
方案上新 | ZStack GPU解决方案
2019-08-15 17:53



在之前发布的ZStack 3.5.0版本中,ZStack新增了对于NVIDIA及AMD vGPU方案的支持,从而在云中实现支持GPU透传、vGPU两种GPU方案的完善GPU云平台解决方案,能够帮助用户在云中实现工业设计、图形渲染、教学科研、深度学习等更为丰富的GPU应用场景。


前言


随着虚拟化与云计算技术的快速发展,越来越多的用户将应用迁移到云上。在这个过程中,用户希望一些特定的业务场景既能够在云环境中获得灵活、高效的资源交付能力,又能够获取与物理机无异的资源计算性能。GPU作为一种资源设备,近几年来随着大数据、人工智能等深度学习相关应用的深入,这一技术在云中的应用需求日益加深。

本文旨在以通俗易懂的方式让各位读者对于云中的GPU方案有一定的概况性了解。



一、了解GPU


在了解GPU之前,我们需要先了解GPU与我们熟悉且常用的CPU区别:虽然两者都为了完成计算任务而设计,但各有侧重。

CPU 由专为串行顺序执行指令而设计的几个核心组成,主要是面向通用计算场景;


1.png

如:8个计算核心,每个计算核心计算力都相对较强


 GPU 则是拥有一个由数以千计的更小核心组成的大规模并行计算架构。更侧重用于面向并行计算场景;



2.png

如:1000个计算核心,单个计算核心计算力相对一般,综合计算力强大


举一个比较容易理解的例子:


CPU可以比作一个数学教授,当解答一道或几道高难度数学问题时,效率更高;


GPU可以比作100个中学生,当解答数百上千低难度数学问题时,效率更高。


因此在实际应用场景中,GPU非常适合用于需要大量简单、重复、并行、矩阵等计算能力的场景。下面通过以下两个典型的GPU应用场景来进行需求说明。



二、GPU应用场景



1. 重GPU计算力需求场景


某市交管部门构建城市大数据智能交通调度系统以缓解绕城高速交通拥堵情况,建设规划将系统构建在云环境中,以解决部署在物理机环境中所存在的安装周期长、运维效率低下等问题,因此,如何将物理GPU设备交付给部署在云环境中人工智能应用以使用是项目的关键技术需求。



2. 轻GPU计算力需求场景


某制造型企业期望为工业设计人员部署云桌面以保护企业数据安全,还要简化桌面运维管理。但这需要依赖GPU的图形计算力以实现在云环境中运行工业设计软件这一需求。

在以上场景中,分别通过GPU透传及vGPU技术在云中交付GPU资源是满足用户需求的主要技术手段。

下面我们来进一步介绍以上两种云中GPU实现方案。




三.GPU云化方案

1. GPU透传


3.jpg


GPU透传主要技术原理是通过将宿主机(物理机)上GPU设备的PCI内存地址映射给云主机,从而能够绕过云环境中的虚拟化管理程序,将GPU设备直接加载给云主机进行使用。


透传后对比在物理机上使用GPU设备的优缺点如下:


  • 优点:性能损耗<5%、功能兼容性好(如2D/3D/图形渲染/CUDA等功能)、技术实现简单(对GPU厂商无依赖)、运维成本低;


  • 缺点:无法将GPU设备与其他云主机共享、已挂载GPU的云主机不支持热迁移;


  • 场景:深度学习、人工智能、高性能计算等;


2. vGPU(GPU虚拟化)

在vGPU实现方案上,由于目前市场上GPU厂商分为NVIDIA、AMD,因此在对接不同品牌GPU设备时所采用的vGPU技术方案也不一样。


3. AMD vGPU方案


首先我们来看一下AMD vGPU的方案,其设计遵循了SRIOV规范,这个规范定义了以标准化的方式支持实现多个云主机共享一个PCI设备:可理解为一个PCI设备在物理层面上被切分为多个,并且每个都是符合PCI标准的PCI设备。而由于这个能力,切分后的每个单元都可以再通过PCI透传的方式分别提供给多个云主机使用。GPU作为一种典型PCI设备,自然也支持以上技术的实现,AMD vGPU方案就是如此。


在了解完原理之后,我们来看一下这种GPU虚拟化方案的优缺点:


  • 优点:与GPU透传方案相比,性能损耗较小;功能兼容性好(如2D/3D/图形渲染/OpenCL等功能)、支持加载vGPU设备的云主机热迁移(技术上支持,云厂商各自实现情况不同);


  • 缺点:硬件设计相对复杂同时硬件更新周期长、云平台无法有效获取设备监控信息;


  • 场景:在虚拟桌面中运行工业设计、图形渲染,或人工智能教学科研环境中;




4. NIVDIA  vGPU方案

4.png


区别于AMD vGPU所使用SR-IOV方案,Mediated Passthrough(分片透传)是NIVDIA vGPU方案所使用的关键技术。Mediated Passthrough是一种完全软件定义的GPU虚拟化解决方案,其技术原理主要为:对于与GPU性能相关的访问直接透传给云主机,把与性能无关功能的相关访问在Mdev模块中来模拟实现。Mdev是此方案的关键技术,简单解释一下,Mdev即mediated 设备框架,能够驱动VFIO框架及接口支持虚拟PCI设备,因此也就能够完全基于软件实现,将宿主机上的物理GPU切分成为多个虚拟GPU设备并进行共享。


同样,我们也来看一下此方案的优缺点:


  • 优点:与GPU透传方案相比性能损耗较小;软件定义更灵活(如更新迭代速度更快不受限于硬件);云平台可以获取到vGPU设备监控信息;支持加载vGPU设备的云主机热迁移(技术上支持,云厂商各自实现情况不同);


  • 缺点:依赖于GPU硬件厂商开发Mdev驱动;功能上由于是Mdev模拟,所以有所取舍。




总结


1.   区别于CPU面向通用计算场景,GPU侧重于简单、重复性、并行、矩阵等计算场景,如图形渲染、视频编解码、并行计算场景;


2.   在云中使用GPU设备主要有两种技术实现方案,GPU透传与vGPU(GPU虚拟化);


3.   GPU透传方案将GPU设备透传给云主机使用,云主机独占该GPU资源,性能好、功能兼容强,适合深度学习、人工智能、高性能计算等重负载场景;


4.   vGPU是一种GPU虚拟化方案,GPU资源能够被切分后分配给多个云主机共享使用。vGPU方案中NIVDIA/AMD技术实现方式有所不同,NIVDIA是软件虚拟化方案、AMD是硬件虚拟化方案,两种方案性能相当;vGPU典型场景适合应用于虚拟桌面中运行工业设计、图形渲染或人工智能教学科研等轻负载场景;


5.   ZStack 3.5.0版本开始对以上GPU方案均支持;



视频演示如下:https://v.qq.com/x/page/n0904rzzd2i.html?pcsharecode=FGPCS08Y&sf=uri

升级提醒

若您选择升级至4.0.0及之后版本,请注意以下功能调整:

1. 云路由器全面升级为VPC路由器,云路由网络全面升级为VPC网络,不再单独设云路由器页面。升级全程无感知,相关业务不受任何影响。

2. 企业管理账号体系取代用户组与用户,不再单独设用户/用户组页面,不可再使用用户/用户组账号登录云平台。升级前,请先将“用户组与用户”纳管的账号数据妥善迁移至“企业管理”纳管,再执行升级操作。注意:对于admin创建并具备admin权限的用户账号同步取消,如有需要,可使用企业管理账号体系中的平台管理员实现相同功能。

3. 调整AD/LDAP与账户的对接管理方式,统一由企业管理纳管,不再单独设AD/LDAP页面。升级前,请先将“账户”对接纳管的AD/LDAP账号数据妥善迁移至“企业管理”纳管,再执行升级操作。

如对上述升级提醒有任何疑问或需要升级帮助,请联系ZStack官方技术支持

下载ZStack企业版

您已填写过基本信息?点击这里

姓名应该不少于两个字符
手机号格式错误
验证码填写错误 获取短信验证码 60 秒后可重发
公司名称不应该少于4个字符
邮箱格式错误

下载链接将会通过邮件形式发送至您的邮箱,请谨慎填写。

同意 不同意

我已阅读并同意云轴科技 《法律声明》《隐私政策》用户管理规则及公约

下载ZStack企业版

还未填写过基本信息?点击这里

邮箱或手机号码格式错误
同意 不同意

我已阅读并同意云轴科技 《法律声明》《隐私政策》用户管理规则及公约

验证手机号
手机号格式错误
验证码填写错误 获取短信验证码 60 秒后可重发
同意 不同意

我已阅读并同意云轴科技 《法律声明》《隐私政策》用户管理规则及公约

登录观看培训视频
仅对注册用户开放,请 登录 观看培训视频

业务咨询:

400-962-2212 转 1

售后咨询:

400-962-2212 转 2

其他(漏洞提交、投诉举报等)

400-962-2212 转 3
ZStack认证培训咨询
姓名应该不少于两个字符
手机号格式错误
验证码填写错误 获取短信验证码 60 秒后可重发
公司名称不应该少于4个字符
邮箱格式错误

同意 不同意

我已阅读并同意云轴科技 《法律声明》《隐私政策》用户管理规则及公约

业务咨询:

400-962-2212 转 1

商务联系:

channel@zstack.io
申请ZStack多机版
姓名应该不少于两个字符
手机号格式错误
验证码填写错误 获取短信验证码 60 秒后可重发
公司名称不应该少于4个字符
邮箱格式错误

同意 不同意

我已阅读并同意云轴科技 《法律声明》《隐私政策》用户管理规则及公约

业务咨询:

400-962-2212 转 1

售后咨询:

400-962-2212 转 2

其他(漏洞提交、投诉举报等)

400-962-2212 转 3
立即咨询
姓名应该不少于两个字符
手机号格式错误
验证码填写错误 获取短信验证码 60 秒后可重发
公司名称不应该少于4个字符
邮箱格式错误

同意 不同意

我已阅读并同意云轴科技 《法律声明》《隐私政策》用户管理规则及公约

业务咨询:

400-962-2212 转 1

售后咨询:

400-962-2212 转 2

其他(漏洞提交、投诉举报等)

400-962-2212 转 3
培训认证合作伙伴申请
姓名应该不少于2个字符
手机号格式错误
验证码填写错误 获取短信验证码 60 秒后可重发
邮箱格式错误
城市名称不应该少于2个字符
公司名称不应该少于4个字符
职位名称不应该少于2个字符

同意 不同意

我已阅读并同意云轴科技 《法律声明》《隐私政策》用户管理规则及公约

业务咨询:

400-962-2212 转 1

商务联系:

channel@zstack.io
ZStack&工信人才联合证书申请
已获得ZStack原厂证书
未获得ZStack原厂证书
请填写您的基本信息
姓名应该不少于2个字符
手机号格式错误
验证码填写错误 获取短信验证码 60 秒后可重发
邮箱格式错误
城市名称不应该少于2个字符
公司/学校名称不应该少于4个字符
证书类型
ZCCT
ZCCE
ZCCA
ZCPC-ISP
申请ZStack&工信人才联合证书须支付工本费,是否可以接受
同意 不同意

我已阅读并同意云轴科技 《法律声明》《隐私政策》用户管理规则及公约

业务咨询:

400-962-2212 转 1

商务联系:

channel@zstack.io

下载链接已发送至您的邮箱。

如未收到,请查看您的垃圾邮件、订阅邮件、广告邮件。 当您收到电子邮件后,请点击 URL 链接,以完成下载。

下载链接已发送至您的邮箱。

如未收到,请查看您的垃圾邮件、订阅邮件、广告邮件。
或点击下方URL链接 (IE内核浏览器请右键另存为), 完成下载:

感谢您使用 ZStack 产品和服务。

成功提交申请。

我们将安排工作人员尽快与您取得联系。

感谢您使用 ZStack 产品和服务。

信息提交成功。

我们将安排工作人员尽快与您取得联系,请保持电话畅通。

感谢您使用 ZStack 产品和服务。

预约沟通

联系我们

业务咨询
400-962-2212 转 1
售后咨询
400-962-2212 转 2
其他业务(漏洞提交、投诉举报等)
400-962-2212 转 3

联系我们

回到顶部

产品试用申请
请选择您要试用的产品
ZStack Cloud 企业版
ZStack Cloud 混合云版
ZStack Cloud 基础版
ZStack Cloud 标准版
请填写您的基本信息
姓名应该不少于两个字符
手机号格式错误
验证码填写错误 获取短信验证码 60 秒后可重发
公司名称不应该少于4个字符
邮箱格式错误

商务咨询:

400-962-2212 转 1

售后咨询:

400-962-2212 转 2

商务联系:

sales@zstack.io

成功提交申请。

我们将安排工作人员尽快与您取得联系。

感谢您使用 ZStack 产品和服务。