近日,2019阿里云峰会·北京站上,阿里云发布了GPU云产品vGN5i。
据介绍,该产品针对轻量级GPU计算应用场景,可大幅降低AR/VR、云游戏及轻量级AI推理等GPU计算场景下用户的使用成本,在提高业务弹性的同时减少运维复杂度。51VR作为产品的重要合作方,为该产品提供51Cloud 5G实时VR云渲染下的虚拟驾驶全场景演示,引起业内广泛关注。
在VGN5i实例发布之前,业内均采用以单颗物理GPU为单位的云端异构计算服务。而这在不少使用异构计算服务的场景中,会出现“计算资源过剩”问题。
以云游戏为例,企业通常仅需要一颗物理GPU几分之一的计算能力即可流畅完成图形或视觉计算;人工智能领域也存在类似问题,深度学习推理场景对GPU的计算资源消耗可能仅仅是训练阶段的数十分之一,甚至更少。对于这类应用场景而言,轻量级计算异构产品可以提升系统灵活性,并大幅降低成本。
而阿里云本次首家提供云上轻量级GPU实例,意味着用户可以用更细粒度的计算资源开启业务。该产品基于NVIDIA Tesla P4 GPU,支持多种规格,企业可以按需选择实例规格或者在云市场选择NVIDIA Quadro虚拟工作站,适用于云游戏、AR/VR以及图形处理等随需应变的GPU计算场景。
阿里云表示,5月还将发布基于NVIDIA T4的GPU异构计算产品VGN6i实例,NVIDIA T4采用最新的Turing架构,在虚拟化环境中更为灵活,可加速深度学习和推理工作流程的Tensor Core,以及可加速光线追踪和批量渲染的RT Core。
据了解,该产品由阿里云与NVIDIA合作研发,集成了阿里云智能资源调度技术,用户可以按需选择适量的计算资源。此外,该产品还采用了安全隔离技术,实现不同用户之间的强隔离。
除此之外,QoS控制技术保障了每个用户的GPU资源不被其他租户抢占。