六年磨一剑,寻找最强芯:AMD 绝地求生背后的故事

2018-05-04 22:57      36氪 未来科技范


  【未来科技范 报道】5月4日消息,在科技领域,几乎没有什么“赌博”,能像花费数十亿美元从零开始构建一个新的计算机处理器那样大。前AMD董事会成员罗伯特·帕尔默(Robert Palmer)把它比作俄罗斯轮盘赌:“你拿枪指着自己的头,扣动扳机,四年后你才会发现你的脑袋会不会炸开。”六年前,AMD上了膛,扣动了扳机,为了避免自己制造出来灾难,在内部进行了重组。现在我们已经看到了结果,它没有死亡,AMD有了一个新CPU微架构Zen,这是令人震惊的Ryzen系列处理器的基础。事实上,它们非常出色,以至于可能会对英特尔现有的统治地位构成真正的挑战,并改变未来几年计算机市场的面貌。

  “我想英特尔醒来后会说,‘嘿,你知道的,我们突然陷入了一场战斗’。所以他们不会对AMD进入市场袖手旁观。”行业杂志《Microprocessor Report》的分析师兼编辑林利·格韦纳普(Linley Gwenapp)告诉Gizmodo。

  今年1月,在拉斯维加斯的消费电子展(CES)上,我与两家公司打了照面,它们的情况非常不同。英特尔的所有时间似乎都花在了为幽灵(Spectre)和熔毁(Meltdown)的道歉上,这是一系列灾难性的安全漏洞,影响到了该公司的每一个CPU。在接下来的几个月里,它基本没有时间去宣传它在接下来的几个月里将要发布的所有酷炫的东西。与此同时,AMD则像一只孔雀——挥舞着羽毛,宣扬它打算继续进行CPU史上最具侵略性的发布。

  “我认为与一年前相比,他们(AMD)的表现非常成功,”格韦纳普在谈到AMD时表示。因为就在一年前,这家公司的状况还很糟糕。根据格韦纳普提供的数据,AMD去年仅占服务器市场份额的1.5 %。英特尔占据着其他的98.5 %。当然,AMD制造的芯片为每一个Xbox One和PS4提供动力,它也是苹果电脑的GPU的独家供应商,但对任何关注的人来说,AMD看起来确实是活在之前影子中。毕竟,该公司曾经被认为是英特尔在CPU领域的唯一严重竞争对手,在Zen宣布之前,AMD在这方面几乎一直保持沉默,实际上是在向数十亿的芯片市场屈服,而这些芯片可以充当从计算机、到为你喜爱的网站提供动力的服务器等一切产品的大脑。

timg.jpg

  AMD在CPU领域的最后一次重大突破,是在2011年推出了一款名为Bulldozer的微架构。我们放到行业中看,这一年,苹果推出了iPhone 4s,英特尔推出了第二代核心架构。英特尔现在已经进入第八代,预计将在今年年底推出第九代。自从英特尔和AMD成为直接竞争对手以来,已经有数十年了。

  AMD花了这么长时间,才重新竞争的最大原因是,上一次大规模的CPU发布是灾难性的。“这并不是说有人设计了一些他们认为不会成功的东西,”Moor Insights & Strategy的创始人兼首席分析师帕特里克·摩尔海德( Patrick Moorhead )告诉Gizmodo 。在成为分析师之前,摩尔海德在AMD担任副总裁近10年,并在Bulldozer上市的同时离职。

  摩尔海德表示,Bulldozer一直是一种高辛烷值的CPU,凭借其高时钟速率(或称时钟速度)超越了英特尔竞争对手。时钟速度越高,一个CPU在一秒钟内可能进行的处理周期就越多。根据摩尔海德的说法,AMD计划的时钟频率为5 GHz,即每秒处理50多亿次。当时英特尔的竞争对手推出的CPU时钟频率低得多,只有少数产品能够达到4GHz。

  “这就是为什么人们说‘哦,我们没有从Bulldozer中得到我们想要的东西’,因为这应该是一个非常高频的部分。”摩尔海德说。事实上,在AMD或英特尔一般的芯片生产中,从未出现过5 GHz或更高的时钟频率。使用如此高的时钟频率投入生产的唯一CPU是2012年发布的专门供IBM大型机使用的IBM zec 12。

  Bulldozer投入生产时,其基准时钟频率仅为4.2 GHz,涡轮时钟速率(处理器需要快速处理少量数据时即可启用)为4.5 GHz。而在相同领域中,令人尊敬的时钟速率并无法与英特尔的产品竞争。评论家的反应是残酷的。

  Anandtech的阿南德·希姆皮(Anand Lal Shimpi )写道,他“不确定它是否已经为黄金时段做好了充分的准备”,而且“Bulldozer根本就不能工作”。Tom’s Hardware注意到,它经常被前任“击败”,而Tweaktown则哀叹道,“你不得不对今天发生的事感到失望。”

  当CNET对Bulldozer的评论进行了一轮讨论时,它报道称,“Bulldozer似乎没有给 AMD 带来竞争性的复苏。”但至少有一点希望,能让AMD能留在CPU领域。

  然而,后续情况愈加糟糕。在每一年的迭代过程中,AMD 从门口走出来的时候,它和英特尔之间的差距都会变得越来越大。格韦纳普告诉Gizmodo,该公司试图“从一些效果不好的东西开始,然后试图把它拼凑起来,使它变得更好。”但是每一个新的迭代,都是基于性能已经表现不佳的Bulldozer架构,它无法跟上。“它从未真正具有竞争力过。”

  这需要勇气

  CPU必须具有竞争力——成本更低、速度更快或能效更高。它是核心大脑,为你使用的每一台电脑提供动力——从手机到笔记本电脑,再到电视。它是一个硅晶片,然后有数十亿个微电路蚀刻到它的表面,并通过铜离子相互连接。CPU的硅微电路(或晶体管)通过铜进行排列和连接的具体方式称为“架构”。

  1971年,英特尔发布的第一款微处理器Intel 4004是在一个只有10000纳米的芯片或基础上制造的。那就像一根很细的头发一样。Ryzen CPU只有14纳米。这意味着它可以更快地在这些铜离子之间移动能量——实际上CPU越小,它就能越快。但是CPU越小,它就变得越精致。因此,为了制造速度最快、功能最强大的处理器,CPU设计人员还必须使它们更小、更复杂。这意味着始终优化和寻求更好的效率。

  因此,每个CPU被设计用于特定的“指令集”。这是在CPU和设备软件之间工作的最基本的代码。常见的CPU指令集是ARM和x86。ARM CPU通常出现在手机和平板电脑中——为三星GalaxyS9和iPhone X提供动力的CPU是基于ARM的处理器。x86 CPU通常保留给需要更多电源和更少电池寿命的计算设备。英特尔和AMD的笔记本电脑、台式机和服务器的CPU是x86,除非特别说明,AMD的竞争对手也是如此,包括其新一批Ryzen处理器。

  除了指令集CPU之外,它实际上非常简单,仅由几个关键组件组成:内核、CPU缓存和系统总线。内核是CPU的引擎,它们执行所有实际处理的工作,当你谈到CPU的时钟频率时,你谈到的是这些内核的运行速度。内核执行CPU所需的所有实际处理,但它们忙于处理你提供给它们的所有数据,因此需要缓存其中的位(bits),以便快速引用。

  这就是CPU缓存的来源。它们是记忆。你浏览你计划购买的计算机的规格说明时,你可能会看到提到这些缓存,通常标记为L1、L2和L3。它们之所以重要,是因为它们是内核在处理数据时实际读取和写入数据的对象。这些数据在CPU高速缓存中处理后,会被发送回计算机的通用内存(也称为RAM ),然后可能会被发送到存储驱动器上,所有这些数据都会通过图形处理单元到达你的眼前。

  CPU高速缓存和内核通过系统总线彼此通信。它被称为总线,因为它本质上是在将信息从CPU的一部分传输到另一部分。有时,这不仅仅是在内核和CPU缓存之间移动数据。如果图形处理器被压缩到同一个芯片上,系统总线也会将数据移入和移出图形处理器。在它最初级的时候,把一个系统总线看作是你用来把所有的乐高积木卡在上面的绿色小板。

  系统总线种类繁多,各大CPU制造商都有自己的系统总线架构。英特尔拥有所谓的Front Side Bus,在Zen之前,AMD使用了一种叫做HyperTransport的技术。

  现在,集中于这些组件中的任何一个都可以提高CPU的速度。当AMD制造Bulldozer时,它把所有的精力都投入到了CPU内核的时钟上。时钟频率是计算机处理单元实际处理数据周期的频率。更多的进程意味着更快的CPU,在很长一段时间内,提高CPU的时钟频率是设计人员的主要目标。

  但在本世纪初,英特尔推出了一款时钟频率为3 GHz的CPU,此后几乎所有的CPU都围绕着这个时钟频率徘徊。时钟信号延迟增加的原因之一是时钟信号越高,CPU产生的热量越多。除去所有的热量可能会很昂贵——尤其是如果你想把CPU包装成超薄无风扇的产品的时候,比如Surface Pro。

  因此,近年来,CPU设计人员已经将CPU的其他部分转变为提高速度,当AMD决定基本上废弃Bulldozer,并将其大部分资源投入到即将到来的Zen中时,CPU的一个特定组件将首当其冲地成为焦点:一种新的系统总线体系结构,称为Infinity Fabric。

  但是,在AMD决定采用Infinity Fabric之前,甚至说,在它决定创建一个新的CPU并承认Bulldozer的故障之前,该公司需要一个新的CPU设计团队。

  将力量结合在一起

  现任的AMD 首席技术官是马克 · 帕尔马斯特(Mark Papermaster)。他在2011年末加入了公司,就在Bulldozer推出后不久,据他说,“这不是巧合。“帕尔马斯特被请来帮助拯救一家股价在一年内暴跌60 %以上的公司,部分原因是Bulldozer的糟糕表现。

  在加入AMD之前,帕尔马斯特主要因为两件事而引人注目。2008年,他成为了 IBM 公司一起广为人知的诉讼的对象。1982年以来,他一直在IBM工作。IBM担心帕尔马斯特 (当时是苹果公司的一名新员工)可能会把商业秘密从IBM带到苹果公司。最后,这个案子在庭外和解了。2010年,帕尔马斯特再次登上了头条,据报道,由于与时任首席执行官史蒂夫·乔布斯( Steve Jobs )的分歧,他在仅仅15个月后就离开了苹果。

  2011年10月,帕尔马斯特加入AMD,该公司当时似乎处于自由落体状态,高通、苹果和三星等主要竞争对手纷纷挖走了不满的员工。雇员的离开使一些人感到不安。AMD创始人杰里·桑德斯( Jerry Sanders )在2012年2月接受《福布斯》采访时说:“这让我很伤心。”

  公司处于混乱之中,帕尔马斯特自己也在为此做出贡献。不是因为他以前的声誉,而是因为他的第一个任务就是大幅重组CPU设计团队。他看到Bulldozer的性能有多差时,他很清楚,这不是AMD获取成功所需要的处理器。“我看到市场将会有很高的表现,”他告诉Gizmodo 。“为此,我们需要一个新的CPU。”帕尔马斯特确信市场需要一种可以处理游戏、处理大型3D文件或渲染大型4K视频的设备,而不是只处理web浏览的设备。

  对于帕尔马斯特来说,新的CPU意味着对AMD设计团队进行重大重组。传统上,CPU设计团队分为两个基本团队。多伦多大学电气与计算机工程教授娜塔莉·杰格(Natalie Jerger )告诉Gizmodo说:“在Zen架构之前,他们确实有两个平行的设计轨迹。”其中一款处理器专为低功耗笔记本电脑和台式机设计,是最便宜的。另一个用于服务器和高端台式机。服务器级处理器是Bulldozer,低功率CPU被称为Bobcat系列。

  AMD公司副总裁兼产品首席技术官乔·麦克里(Joe Macri)告诉Gizmodo :“帕尔马斯特的做法是将这两个团队合并在一起。”麦克利是这个新的、更大的团队领导者之一。

  听他这么说,这两个团队合并(并裁掉多余的人),似乎是帕尔马斯特开展工作的必要条件。“我们不需要从头开始,”麦克利说。“因此,这实际上是一次合并,而不是将现有团队拆分,然后重新组合在一起。但是在这个过程中,我们的效率得到了提升。我们能够将更多的人应用到单个功能中,并获得更多的‘设计带宽’。”带宽是实现帕尔马斯特的目标所必需的,即构建一个在各方面都优于刚刚发布的垃圾的CPU。

  帕尔马斯特很快得到了AMD另一位新高管的帮助:丽莎·苏( Lisa Su ),她于2012年1月加入AMD,担任高级副总裁兼总经理。苏来自另一家CPU制造商Freescale,该公司后来与恩智浦半导体合并。她首先关注的是AMD的图形和游戏市场——该公司在这方面确实取得了一些成功。苏和时任首席执行官罗利·里德( Rory Read )与索尼和微软达成协议,为Playstation 4和Xbox One制造芯片。

  这些交易是巨大的,许多消息来源援引AMD为索尼和微软定制芯片的工作,作为该公司在CPU“干旱”中幸存下来的原因之一,并以其当前的架构Zen实际上成功地生产出了如此有效的CPU。

  苏的工作很快就引起了注意,到2014年10月,在她加入AMD两年多一点后,她被提升为首席执行官。苏、帕尔马斯特随后开始为 Zen 的发展投入资源。据麦克利说,在过去的四年里,超过了两百万个工时。

  对于帕尔马斯特来说,将所有这些资源投入到一个新的CPU设计中,并让这个团队有效地忽略Bulldozer及其后续的迭代是绝对重要的。他需要一个有喘息空间的团队,来获得他们所拥有的那些聪明的想法。“他觉得AMD对于新的CPU的一些最酷的想法已经被搁置了,因为在新的修订之后有如此苛刻的新修订时间表。”

  “你知道有时候你可以得到一个‘让我们从头开始,把一切都扔掉的设计’。团队没有这样做。“相反,这个团队从 AMD 广泛的后备目录中抽出一些多年来没有得到很多关注的想法。其中一个想法是改进系统总线体系结构HyperTransport,并创建一个新的架构: Infinity Fabric。

  马克·帕尔马斯特告诉Gizmodo,AMD称之为“隐藏的宝石”,吉姆·安德森(Jim Anderson)告诉Gizmodo,这是“秘密的调味料”。

  Infinity的关键先生

  这就是一位名叫吉姆·凯勒(Jim Keller)的天才工程师进来的地方。在AMD内部,他是一个神话般的人物。我采访过的几乎每一个人,都提到凯勒是Zen设计成功背后的主要人物之一,也是Infinity Fabric 设计背后的重要人物之一。

  帕尔马斯特在2012年聘请凯勒,让他负责处理器组。凯勒对AMD并不陌生。上世纪90年代,他曾在那里工作过。他短暂的任期,在网络极客处理器领域获得了传奇般的地位,他被认为是AMD K8微架构背后的主要人物,该架构使AMD在90年代末和2000年代初与英特尔展开了激烈的竞争。

  凯勒和帕尔马斯特曾一起在苹果工作,大家都认为,凯勒为苹果的iPhone和iPad设计了第一个CPU。当他来到AMD时,他和他的新雇主都同意签订一份有限期的合同。他将在AMD工作三年,在合同结束后,他将离开。他现在为特斯拉汽车的自动驾驶功能设计芯片,并拒绝就此事置评。(最新消息:英特尔宣布吉姆·凯勒已经加入该公司作为硅工程的SVP。情节变得更复杂了!)

  凯勒,特别是他在移动CPU方面的工作和之前在 HyperTransport 上的工作是关键。来自AMD高管都对他热烈赞扬,如马克·帕尔马斯特和吉姆·安德森,以及来自分析师林利·格韦纳普,他们说:“我认为吉姆和他的团队真的从技术角度扭转了公司的局面。”

  2014年,在一次罕见的公开采访中,你可以感受到凯勒的热情和动力。“我加入AMD是因为我喜欢处理器设计,我喜欢复杂的系统设计,而AMD正着眼于在下一代产品上取得巨大进展,”凯勒说。

  凯勒看起来很冷静,在小舞台上表现得很优雅,当他谈论架构、管道和内核以及我们大多数人都会打哈欠的其他极其技术性的东西时,他会变得越来越敏锐,越来越活跃。

  这次采访是对2014年的Zen的一个很好的展示——距离发布还有三年。当时,它刚刚开发了大约两年,并且仍与K12 ( AMD计划的下一代ARM CPU )一起设计。在采访中,凯勒实际上将这种协同开发称为Zen的资产,特别是每个Zen CPU内核的资产。

  然而,凯勒直到15分钟会话接近尾声时,才提到最重要的组件,他提到了下一代“Fabric”,这可以在从移动设备到服务器的每个CPU中找到,并允许AMD以令人羡慕的速度扩展性能。到2017年,这种Fabric将被称为Infinity Fabric。

  他解释说,这种结构将允许AMD采用“chiplet”方法进行设计。AMD可以将一系列处理器封装在一起,而不是在单个芯片上构建一个处理器——通过Infinity Fabric系统总线连接它们。这将使CPU的生产成本更低,理想情况下与CPU一样快,就像AMD以前的CPU和大多数来自英特尔的CPU一样,包括一个管芯上的所有内核。

  “从历史上看,”分析师帕特里克·摩尔海德告诉Gizmodo,“当你把东西包装在一起时,它会减慢这个过程。但是,AMD已经找到了一种方法,让这种封装设置具备非常高的性能。”

  这种封装还意味着AMD正在设计一种与竞争对手截然不同的CPU,根据AMD的说法,这种CPU采用了一种不同的、效率更高的方法。“我们想出了一个非常规则的结构,”乔·麦克利告诉Gizmodo。“我们基本上有一个数据点和一个控制点,每个人都以同样的方式连接到Infinity Fabric 。”

  麦克利声称, Infinity Fabric实际上加快了处理器的设计。它给Zen架构的模块化设计,意味着AMD不需要为每一种CPU重新发明轮子。“设计内核的最大挑战之一是实际验证它,”麦克利说。得益于Infinity Fabric,AMD能够快速验证或确认一系列稍有变化的设计,这些设计涵盖了Zen处理器的全部产品。

  把Infinity Fabric想象成乐高积木中的小折扣,把CPU的所有组件想象成积木本身。AMD可能只需要几个块来构建台式机CPU,或者使用更多块来创建大的多核服务器处理器,或者使用GPU来制作专为笔记本电脑设计的超高速芯片。

  或者,就像在2016年发生的那样,AMD 是一种全新的 CPU。

  突破性进展

  2017年发布的Threadripper,可能是AMD在Zen基础上推出的最引人注目的CPU,它从未出现在帕尔马斯特咄咄逼人的路线图中。相反,这是一个非常小的工程师团队的激情项目——可能有四个人。APU和CPU的AMD布道者罗伯特·哈洛克(Robert Hallock)说,这是一个“非常非常小的团体”。他和他们共用同一排小隔间。

  该公司曾一度想做一个真正强大的台式机CPU,但从技术上或财务上来说,它都是不可行的。然而,这一小部分工程师意识到,他们可能会利用Infinity Fabric提供的小芯片设计,构建一个功能强大得令人难以置信的台式机CPU,与英特尔广受欢迎的高端至强CPU相抗衡。然而,Threadripper 将不再使用 Xeon 处理器上的8个内核,而是16个——这是大规模生产的台式机CPU中放置内核最多的。

  这样的CPU应该需要数年的时间来设计、测试和推向市场,对吗?据吉姆·安德森说,这个小团队直到2016年1月才与他接洽,当时他们在拉斯维加斯的消费电子展上将他拉到一边。他说,他立即意识到这些芯片的绝对酷炫的因素,并坚持把项目放在一个快速的轨道上,从他们的概念到生产仅仅花了一年多一点的时间。

  这个项目被严格保密,只被称为 Summit P3——许多人认为这是Ryzen的一个小分支——然后称之为Summit Ridge,根据哈洛克的说法,“你甚至不被允许发送关于这个项目的电子邮件”。从外观到速度结果,一切都受到严密保护,直到发布。甚至连试图说服戴尔等PC制造商采用CPU的团队,也几乎没有产品本身的详细信息。

  然而,当Threadripper终于在2017年夏天推出时,震惊了批评家和消费者,并很快被世界上一些最大的PC制造商采用,包括Alienware等顶级游戏台式机。

  但引起人们兴趣的不仅仅是 Threadripper 大胆的设计。是的,在任何人都能构建的台式PC上运行32个线程的16核处理器,给人留下了深刻印象,但Threadripper推出两周后,英特尔宣布推出18核i9处理器。不过,令人惊讶的是,Threadripper 很便宜——英特尔18核处理器的价格从1000美元到2000美元不等——而且它的速度也一样快。

  最重要的是,这让观察人士对AMD最新的CPU架构感到惊讶:这些芯片比英特尔的竞争对手更便宜,而且通常更快。

  然而,AMD不仅仅是生产快速、廉价的处理器,它还以惊人的速度突然发布了这些处理器。2017年,AMD发布了基于Zen的四种类型的CPU : Ryzen台式机CPU、Threadripper、面向服务器的Epyc CPU和面向笔记本电脑的Ryzen APU ( APU是AMD对集成显卡的CPU的称呼)。2018年刚过去四个月的时间,AMD已经发布了速度惊人、价格低廉的台式机APU、更多的笔记本电脑移动APU,甚至还有第二代台式机Ryzen CPU。

  吉姆·安德森告诉Gizmodo,他预计到今年年底,将会有60多台内置Ryzen的新笔记本电脑和台式机推出,其中大部分是笔记本电脑,大部分将在未来几个月推出。“这将是您在AMD公司历史上见过的最广泛使用的高端笔记本电脑系统。”

  这些笔记本电脑有多好还有待观察。到目前为止,市场上实际上只有少数基于AMD的笔记本电脑,与英特尔等竞争对手相比,我们仍然不太清楚移动Zen处理器的处理能力。

  英特尔已经清楚地注意到AMD在CPU领域的进步,并做出了相应的回应。去年,英特尔的顶级台式机CPU达到4核,但在AMD发布6核处理器后,英特尔迅速做出了反应,推出了自己的6核设备。当AMD用16核Threadripper 让我们大吃一惊时,英特尔立即将18核i9推向市场。

  两家公司之间的竞争,只会对我们所有人寻找下一台电脑有好处。“你知道,”娜塔莉·杰格告诉Gizmodo,“如果我们有很多个人试图在这个领域进行创新,世界将会更加令人兴奋。”

AMD

相关阅读

    无相关信息