据《华尔街日报》报道,据传AMD正在洽谈收购Xilinx,收购金额接近300亿美元。

两家公司都为人工智能加速器建立了产品线,但这对潜在的合并意味着什么?

AMD Radeon公司
自2015年以来,在Lisa Su的领导下,AMD已经从危机边缘卷土重来

Xilinx Versal AI核心包括可编程逻辑和AI加速器ASIC块(图片:Xilinx)

新的 cpu 和 gpu 产品再次成为了重要的玩家。该公司的高性能计算(hpc)利基,其高调 exascale 设计赢得了 epyc cpu 和 radeon gpu,frontier 和 el capitan 的市场份额,将成为最强大的机器,当他们上线。Amd 的 epyc 处理器目前为500台超级计算机中的10台提供动力,包括50台超级计算机中的4台。

对于各种服务器人工智能加速,amd 提供 radeon 直观的加速卡。该系列中最强大的 radeon instinmi50于2018年11月发布,为人工智能培训提供13.3 tflops 峰值单精度性能(fp32)或26.5 tflops 半精度性能(fp16)。为了人工智能推断,卡片提供了最高性能的53% 。它建立在 amd 的 vega 7 nm gpu 上。

Xilinx Versal公司
Xilinx在数据中心为人工智能提供的产品是基于其通用的ACAP(自适应计算加速平台)及其类SoC芯片其特点是CPU核心、可编程逻辑和ASIC元件的组合,包括通用AI核心芯片中的专用硬接线AI加速器块。对于批量人工智能推理工作负载(INT8),该ASIC块最多可实现133个top。对于不需要这么多top的数据中心应用程序,所有ACAP设备都有一个相当大的可编程逻辑块,可以通过编程来加速AI。

在软件设计方面,Xilinx在Vitis上做了大量的工作,Vitis的工具进行平台旨在使硬件系统开发管理人员、软件资源开发企业人员和数据科学家都能访问其异构计算服务产品。该公司此前还收购了DeePhi,这是我们一家修剪和量化发展方面的专家,该技术问题可以有效降低神经网络的计算能力需求。

FPGA 的优势之一是它们具有灵活性,经得起未来的考验,这是人工智能快速增长领域的一大优势。Xilinx 设备专门针对低延迟 AI 推论(其设备目前不支持 AI 培训应用程序)。

公共云部署
下面是AMD和Xilinx在公共云市场份额的有趣快照。

来自公共云技术分析师 liftr insights 的数据显示,截至2020年3月,人工智能加速器芯片几乎完全安装在英特尔 xeon cpu 上,amd 的 epyc cpu 是微软 azure 的例外。

2020年3月阿里云、AWS、Azure实例类型加速器份额(来源:Liftr Insights)

在公有云领域(阿里巴巴、AWS、微软Azure),英伟达占有人工智能加速器芯片86%的市场份额,AMD legacy、Radeon gpu各占2%左右。FPGA表现略好,Intel Arria 10约占4%,Xilinx UltraScale+占5%(注意,截至2020年3月,范思哲ACAP等较新的FPGA芯片尚未进入公有云。Hyperscaler的刷新周期可以在3-5年之间)。

(阅读Liftr Insights的完整文章EE次 在这里).

英特尔竞争对手
数据中心计算领域的现任者英特尔(Intel)凭借其Xeon cpu在超大规模和企业级数据中心占据着几乎独占的地位。Xeon CPU仍然在这些应用程序中执行绝大多数人工智能推理,这仅仅是因为它们已经存在(尽管英特尔喜欢说,它的一些客户喜欢在他们可以处理的工作负载类型上保持灵活性,因此可能喜欢坚持使用CPU)。在过去的几年里,英特尔在Xeon CPU上增加了AI特有的功能(DLBoost)。

英特尔在 2015 年以 167 亿美元收购了 Xilinx 的主要竞争对手 Altera,该业务部门在数据中心取得了成功。AMD 是否会尝试复制英特尔在自身游戏中击败英特尔的战略?这是可能的,但是是不是太晚了?毕竟,就半导体而言,五年就是数亿年。或者 Xilinx 在过去五年中一直在使用自己的设备为服务器开发先进的基于 FPGA 的 AI 加速产品?我相信是这样;英特尔今年夏天发布了首款人工智能优化FPGA,Stratix 10-NX,Xilinx已经在其ACAP硅上工作了好几年,因此其AI FPGA产品更加成熟。

英特尔的Stratix 10-NX是该公司首款人工智能优化的FPGA。今年夏天推出(图片:英特尔)

当然,英特尔还在数据中心提供其他人工智能产品,包括至强CPU和收购哈瓦那实验室(Habana Labs)提供的数据中心专用人工智能加速器ASIC,这可能是英特尔在这一领域生产优化FPGA缓慢的原因。

情报显然落后于数据中心 gpu。Vecchio 大桥预计今年完工,但要到2021年或2022年。

英伟达复仇女神
在数据中心(和HPC)上与英特尔竞争AI加速的主要竞争者是拥有GPU加速器的Nvidia。英伟达正在变得越来越强大;该公司最近达成协议,以400亿美元收购知识产权巨头Arm。近几个月来,Nvidia的数据中心GPU业务已经超过了其图形卡业务,在数据中心专用人工智能加速器方面,该公司是“一个可以击败的公司”。

除了中国市场上领先的人工进行智能教育培训管理技术外,英伟达还有一些其他企业优势。该公司的CUDA平台深受开发者的欢迎;将其与Arm庞大的开发者社区可以结合使用起来,这将是一股不可忽视的力量。


推荐:

据悉,AMD正在洽谈收购Xilinx

Amd 收购 Fpga 巨头西林克斯 (Edn) 的原因


恩维迪亚最近还收购了梅拉诺克斯,以扩大其数据中心产品。Nvidia 计划将 Mellanox 的 SmartNIC 与手臂 CPU 加速器和 VLIW 加速块相结合,创建一个名为数据处理单元-2023 的路线图,该路线图是集成的 DPU,具有用于 AI 网络功能的 GPU 加速器,如上述异常检测。AMD在这方面没有取得任何进展,但Xilinx已经——一个基于其FPGA的智能NIC平台——于今年春天推出。

AMD是不是想建立一个完整的数据中心计算平台,就像英伟达想用Arm做的那样?英伟达GPU+Arm CPU+英伟达DPU是构建完整数据中心产品的强大组合。AMD平台将是AMD CPU+AMD GPU+Xilinx FPGA+Xilinx智能网卡。考虑到英伟达的优势,这个食谱好吃到可以打败英伟达吗?

当然,成功的真正秘诀不仅仅是异构计算架构及其相对的性能——分销渠道、客户关系、软件的能力成熟度模型、性能和功耗、成本……除了成本,Xilinx在这方面也有很多优势。这包括在云和企业数据中心市场建立良好的客户关系,从云到行业,从金融技术到网络基础设施。

毫无疑问,我们中国正在开始进行一个比较完整计算技术平台的时代,随着我国人工智能的日益普及,异构计算变得越来越具有重要,行业经历了一波又一波的整合,帝国主义正在通过建立。最终,如果AMD真的想在数据信息中心研究领域与英特尔和英伟达竞争,它就需要不断扩大生产产品服务范围,拓宽平台。收购Xilinx可能是一个可以很好的方法。