扩大合作旨在使企业更容易运行GPU加速的人工智能应用程序。
VMware和Nvidia已扩大了联盟,以支持基于VMware新vSphere 7 Update 2的Nvidia GPU应用程序。vSphere 7的升级版本将支持新的Nvidia AI Enterprise产品,这是一套企业级AI工具和框架,使GPU加速的应用程序能够在VMware虚拟机和容器中运行。
VMware的vSphere 7 U2增加了对Nvidia的A100 Tensor Core GPU及其多实例GPU功能的支持,该功能允许将A100上的核心分区以供多个用户使用,这与VMware将CPU核心分区给多个用户的方式非常相似。
导读:昂扬的英伟达将触角扩大到企业数据中心
这意味着AI工作负载现在可以在VMware的虚拟化平台上运行。到目前为止,人工智能工作负载只在裸机服务器上运行。如果不是性能密集型的话,人工智能什么都不是,裸机环境提供了硬件的全部功能,而不是在虚拟的多租户场景中共享它。
Nvidia在一篇博客文章中宣称,AI Enterprise可以让虚拟工作负载在vSphere上以近乎裸机的性能运行。人工智能工作负载将能够跨多个节点扩展,甚至允许最大的深度学习培训模型在VMware Cloud Foundation上运行。
利用此功能,开发人员可以在vSphere平台上为CUDA应用程序、AI框架、模型和SDK构建扩展的多节点性能。人工智能企业平台设计用于部署在经Nvidia认证的系统上,这些系统由Dell Technologies、Hewlett-Packard Enterprise(HPE)、Supermicro、Gigabyte和Inspur提供。
除了A100支持之外,vSphere 7 U2还增加了使用vSphere Lifecycle Manager查看与Tanzu(VMware的Kubernetes发行版)一起运行的vSphere映像和管理vSphere实例的功能。vSphere 7 U2具有集成的应用程序负载平衡以及对专用和第三方容器注册的更好支持。
vSAN 7 U2增强功能
除了vSphere升级之外,VMware还宣布了VMware vSAN 7 Update 2的可用性,其中包含一些新的和增强的功能。首先是它的超聚合基础设施(HCI)软件hcimesh的新版本;新版本建立在vsan7 update1中最初发布的基于软件的计算和存储资源分解方法的基础上。
新版本提供了更广泛的客户用例集,特别是对于希望在现有vSAN环境之外提高资源效率的客户。它使计算集群或非HCI集群能够远程使用数据中心内vSAN集群的存储,从而允许客户独立地扩展计算和存储。
vsan7更新2还引入了新的功能来更好地支持各种物理拓扑。这包括对扩展群集配置的集成DRS感知,以在故障回复中获得更一致的性能,以及对扩展群集和2节点群集的vSAN文件服务支持。
此外,VMware还继续提供可提高vSAN性能的功能,包括vSAN over Remote Direct Memory Access(RDMA)和RAID 5/6擦除编码的增强功能,这些功能可提高某些工作负载的CPU利用率和应用程序性能。
最后,vSAN 7 Update 2包括对加密模块的FIPS 140-2验证,以满足严格的政府要求。