AMD Xilinx交易：将战斗带到数据中心

发布日期：2021-03-13

据《华尔街日报》报道，据传AMD正在洽谈收购Xilinx，收购金额接近300亿美元。

两家公司都为人工智能加速器建立了产品线，但这对潜在的合并意味着什么？

AMD Radeon公司
自2015年以来，在Lisa Su的领导下，AMD已经从危机边缘卷土重来

Xilinx Versal AI核心包括可编程逻辑和AI加速器ASIC块（图片：Xilinx）

新的 cpu 和 gpu 产品再次成为了重要的玩家。该公司的高性能计算(hpc)利基，其高调 exascale 设计赢得了 epyc cpu 和 radeon gpu，frontier 和 el capitan 的市场份额，将成为最强大的机器，当他们上线。Amd 的 epyc 处理器目前为500台超级计算机中的10台提供动力，包括50台超级计算机中的4台。

对于各种服务器人工智能加速，amd 提供 radeon 直观的加速卡。该系列中最强大的 radeon instinmi50于2018年11月发布，为人工智能培训提供13.3 tflops 峰值单精度性能(fp32)或26.5 tflops 半精度性能(fp16)。为了人工智能推断，卡片提供了最高性能的53% 。它建立在 amd 的 vega 7 nm gpu 上。

Xilinx Versal公司
Xilinx在数据中心为人工智能提供的产品是基于其通用的ACAP（自适应计算加速平台）及其类SoC芯片其特点是CPU核心、可编程逻辑和ASIC元件的组合，包括通用AI核心芯片中的专用硬接线AI加速器块。对于批量人工智能推理工作负载（INT8），该ASIC块最多可实现133个top。对于不需要这么多top的数据中心应用程序，所有ACAP设备都有一个相当大的可编程逻辑块，可以通过编程来加速AI。

在软件设计方面，Xilinx在Vitis上做了大量的工作，Vitis的工具进行平台旨在使硬件系统开发管理人员、软件资源开发企业人员和数据科学家都能访问其异构计算服务产品。该公司此前还收购了DeePhi，这是我们一家修剪和量化发展方面的专家，该技术问题可以有效降低神经网络的计算能力需求。

FPGA 的优势之一是它们具有灵活性，经得起未来的考验，这是人工智能快速增长领域的一大优势。Xilinx 设备专门针对低延迟 AI 推论（其设备目前不支持 AI 培训应用程序）。

公共云部署
下面是AMD和Xilinx在公共云市场份额的有趣快照。

来自公共云技术分析师 liftr insights 的数据显示，截至2020年3月，人工智能加速器芯片几乎完全安装在英特尔 xeon cpu 上，amd 的 epyc cpu 是微软 azure 的例外。

2020年3月阿里云、AWS、Azure实例类型加速器份额（来源：Liftr Insights）

在公有云领域(阿里巴巴、AWS、微软Azure)，英伟达占有人工智能加速器芯片86%的市场份额，AMD legacy、Radeon gpu各占2%左右。FPGA表现略好，Intel Arria 10约占4%，Xilinx UltraScale+占5%(注意，截至2020年3月，范思哲ACAP等较新的FPGA芯片尚未进入公有云。Hyperscaler的刷新周期可以在3-5年之间)。

（阅读Liftr Insights的完整文章EE次 在这里).

英特尔竞争对手
数据中心计算领域的现任者英特尔（Intel）凭借其Xeon cpu在超大规模和企业级数据中心占据着几乎独占的地位。Xeon CPU仍然在这些应用程序中执行绝大多数人工智能推理，这仅仅是因为它们已经存在（尽管英特尔喜欢说，它的一些客户喜欢在他们可以处理的工作负载类型上保持灵活性，因此可能喜欢坚持使用CPU）。在过去的几年里，英特尔在Xeon CPU上增加了AI特有的功能（DLBoost）。

英特尔在 2015 年以 167 亿美元收购了 Xilinx 的主要竞争对手 Altera，该业务部门在数据中心取得了成功。AMD 是否会尝试复制英特尔在自身游戏中击败英特尔的战略？这是可能的，但是是不是太晚了？毕竟，就半导体而言，五年就是数亿年。或者 Xilinx 在过去五年中一直在使用自己的设备为服务器开发先进的基于 FPGA 的 AI 加速产品？我相信是这样;英特尔今年夏天发布了首款人工智能优化FPGA，Stratix 10-NX，Xilinx已经在其ACAP硅上工作了好几年，因此其AI FPGA产品更加成熟。

英特尔的Stratix 10-NX是该公司首款人工智能优化的FPGA。今年夏天推出（图片：英特尔）

当然，英特尔还在数据中心提供其他人工智能产品，包括至强CPU和收购哈瓦那实验室(Habana Labs)提供的数据中心专用人工智能加速器ASIC，这可能是英特尔在这一领域生产优化FPGA缓慢的原因。

情报显然落后于数据中心 gpu。Vecchio 大桥预计今年完工，但要到2021年或2022年。

英伟达复仇女神
在数据中心（和HPC）上与英特尔竞争AI加速的主要竞争者是拥有GPU加速器的Nvidia。英伟达正在变得越来越强大；该公司最近达成协议，以400亿美元收购知识产权巨头Arm。近几个月来，Nvidia的数据中心GPU业务已经超过了其图形卡业务，在数据中心专用人工智能加速器方面，该公司是“一个可以击败的公司”。

除了中国市场上领先的人工进行智能教育培训管理技术外，英伟达还有一些其他企业优势。该公司的CUDA平台深受开发者的欢迎；将其与Arm庞大的开发者社区可以结合使用起来，这将是一股不可忽视的力量。

推荐：

据悉，AMD正在洽谈收购Xilinx

Amd 收购 Fpga 巨头西林克斯（Edn）的原因

恩维迪亚最近还收购了梅拉诺克斯，以扩大其数据中心产品。Nvidia 计划将 Mellanox 的 SmartNIC 与手臂 CPU 加速器和 VLIW 加速块相结合，创建一个名为数据处理单元-2023 的路线图，该路线图是集成的 DPU，具有用于 AI 网络功能的 GPU 加速器，如上述异常检测。AMD在这方面没有取得任何进展，但Xilinx已经——一个基于其FPGA的智能NIC平台——于今年春天推出。

AMD是不是想建立一个完整的数据中心计算平台，就像英伟达想用Arm做的那样？英伟达GPU+Arm CPU+英伟达DPU是构建完整数据中心产品的强大组合。AMD平台将是AMD CPU+AMD GPU+Xilinx FPGA+Xilinx智能网卡。考虑到英伟达的优势，这个食谱好吃到可以打败英伟达吗？

当然，成功的真正秘诀不仅仅是异构计算架构及其相对的性能——分销渠道、客户关系、软件的能力成熟度模型、性能和功耗、成本……除了成本，Xilinx在这方面也有很多优势。这包括在云和企业数据中心市场建立良好的客户关系，从云到行业，从金融技术到网络基础设施。

毫无疑问，我们中国正在开始进行一个比较完整计算技术平台的时代，随着我国人工智能的日益普及，异构计算变得越来越具有重要，行业经历了一波又一波的整合，帝国主义正在通过建立。最终，如果AMD真的想在数据信息中心研究领域与英特尔和英伟达竞争，它就需要不断扩大生产产品服务范围，拓宽平台。收购Xilinx可能是一个可以很好的方法。

XILINX(赛灵思)原厂动态