异构计算大战升温 HSA、OpenPOWER、英特尔谁执牛耳?
——首届HSA峰会纪实

 

时间:2016-08-24        来源:半导体行业观察

 

当前,半导体行业创新风起云涌,特别是在计算领域,呈现出了全新的发展态势,多种计算方式和架构正在逐渐融合。处理器芯片架构历经单核、同构多核等不同时期,正向异构多核方向发展,国内外主流企业均已加强对异构处理器的研发投入,并取得了一些重要的成果。如AMD发布支持HSA(Heterogeneous System Architecture,异构系统架构)联盟标准的异构计算处理器芯片,英特尔也在进行异构计算芯片的研发,另外还有IBM发起的OpenPOWER联盟。近期,中国芯“申威26010”CPU+GPU异构计算处理器芯片,应用在“太湖之光”超级计算机上,取得了很好的应用成果。

 

在这样的行业背景下,首届HSA峰会暨“2016年全球异构计算HSA峰会”于8月22日在北京亦庄拉开帷幕。本次峰会由HSA联盟和中国半导体行业协会(CSIA)共同主办,华夏芯、超威半导体(AMD)、联发科技、进想科技(Imagination)、乐金电子(LG)承办,以“拥抱CPU+时代”为主题,这是中国首次举办下一代处理器全球峰会。本次会议得到了网信办、工信部和北京经济技术开发区的大力支持。

 

各承办单位就全球异构计算芯片最新发展做了主题演讲。Cadence、Synopsys、CEVA等海外企业与申威、北大众志、元心科技、复旦大学、国防科大、上海交大、中山大学等数十家中国产学研单位围绕机器视觉、人工智能、深度学习、云计算、虚拟现实、软件无线电等多方面应用,对高性能计算的需求做了主题报告。

 

何为HSA

 

目前,复杂的片上系统(SoC)是大多数电子产品的核心:包括基于视觉的物联网系统、移动设备、台式机、高性能计算(HPC)系统、AR / VR和服务器,这些异构架构通常由来自不同供应商的各种IP模块组成。这些IP包括CPU、GPU、FPGA、深层神经网络(DNN)、DSP等,通常采用它们自己的专有编程语言进行设计和实现。异构系统架构(HSA)规范旨在解决这种低效率的方式,帮助开发者加速设计和编程过程,从而开发日益复杂的异构系统。一旦采用缓存一致性的共享虚拟内存,HSA系统将实现对存储空间的高带宽共享访问,提高了系统的性能并降低了功耗。

 

HSA联盟于2012年成立,成员包括40多家半导体公司和17所大学,这些成员单位也包括中国的半导体公司和大学。该联盟的宗旨是提高计算效率,让异构编程更加容易、方便和简单,HSA是一个非营利性的组织。

 

从CPU向CPU+的发展,有可能引起芯片行业很多现行规则的改变,使得处理器设计变得更加容易集成,也更容易验证,对开发者而言,将更容易开发和调试,也更容易使用,价格也更低。该市场非常庞大,如果HSA联盟能够在中国首先实现CPU+的目标,不仅有利于突破传统处理器的技术和应用,而且有可能改变全球处理器产业的发展格局。

 

异构计算竞争格局

 

HSA联盟一直想建立一个开放的标准,并于2014年发布了HSA平台的系统架构手册1.0版本,以及HSA程序参考手册1.0等,希望通过这些开放标准迅速建立起HSA的生态系统,使它更容易推广,容易被人们接受。但由于它还是一个新的行业组织、一种新的标准,所以要被广泛接受还需要有一个过程。对于HSA联盟来说,如何让大家广泛地接受,推广自己是一个很重大的课题。

 

目前,国际上有其他一些跨国集团也在做类似于HSA所做的融合各种处理器的工作。2015年英特尔以167亿美元收购FPGA厂商Altera,最近,英特尔又收购了一些特色技术供应商,这些举动表明该公司也在向异构计算方向发展,英特尔具有CPU传统优势,但是他们也存在危机感,随着数据中心的需求、云计算的发展,为了提高竞争力,该公司希望通过收购的手段,用特定功能的加速器来加强他们在数据中心市场的竞争力。

 

此外,2013年8月IBM联合了谷歌、NVIDIA、Mellanox、TYAN等成立了OpenPOWER基金会,这个联盟的宗旨是基于IBM Power处理器架构建立全球性的生态系统,其中IBM提供GPU,有一些厂商把他们的芯片接到IBM的CAPI接口上,以提升IBM Power系统在数据中心的竞争力。今年6月,OpenPOWER在北京举办了峰会,这表明这些国际联盟都非常重视中国市场。

 

此外,非传统厂商也在进入这个新兴处理器市场,比如谷歌和脸书,他们主要是在人工智能、深度学习等有巨大需求潜力的领域推动发展新一代的处理器。谷歌认为,AlphaGO能够战胜李世石,秘密武器就是张量处理器(TPU),使得机器的深度学习能力,在同等功耗下,处理性能大大优于传统芯片。

 

中国工程院院士倪光南表示:“异构计算正在发展,我们希望大家能密切关注这个趋势。今天,HSA峰会提供给我们一个机会,让我们看到他们所做的工作,给我们中国处理器厂商提供了很好的学习和创新机会。我们希望这次大会能够在发展异构计算方面取得更大的进展,希望我们中国的同行能够在这其中积累经验,我们共同努力,让异构计算实现更大的创新和发展。”

 

HSA生态系统的建立

 

对于HSA生态系统的建立,该联盟主席John Glossner表示:“几个月前,我们发布了异构系统架构HSA 1.1规范,极大地提高了在异构设计中整合开放或专有IP模块的能力。我们现在已经可以看到一系列的HSA兼容解决方案进入市场,峰会期间与会成员公司还会展示技术细节和HSA兼容系统演示。”

 

AMD全球副总裁、中国研发中心总经理李新荣表示:“AMD作为HSA 联盟的成员之一,承诺支持一个使开发者可以自由选择的开放的生态系统。作为一个拥有丰富功能的开源软件平台,ROCm为超大规模多GPU计算进行优化,并支持更广泛的软件工程社区,为开发者提供一个优质和简易的编程环境。我们希望在开源的架构上促进更多的学术研究以及商业创新,并希望透过开源架构与合作伙伴一起开发更多的使用界面,并做更多工具的开发。”

 

Imagination谈软银收购ARM

 

作为全球第二大处理器IP提供商,Imagination也是HSA联盟的创始成员之一,其PowerVR GPU IP和MIPS CPU IP闻名于世。HSA峰会期间,当被问到近期软银收购Imagination最大竞争对手ARM时,该公司全球副总裁、中国区总经理刘国军表示:“Imagination在地球上的竞争对手只有一家,那就是ARM。日本软银公司收购ARM对我们有什么影响?坦率地讲,这是一个比较复杂的问题。不只是我们自己,整个行业的看法是,这对我们Imagination是一个很好的机会。特别是在中国,在没有并购的时候,ARM在嵌入式领域已经很强大。很多客户在做新产品开发的时候,已经感受到了来自ARM的压力,任何一个行业,如果只有一家独大的话,第一客户不喜欢,第二不可持续。”

 

“为什么我们认为软银并购ARM对我们来讲是个机会呢?原因有两个”, 刘国军说:“第一,软银旗下有很多IT和电信公司,原来ARM在剑桥完全独立的市场地位是不是能持续,这是一个很大的疑问,因为作为IP公司必须是中立、独立的。第二,跟中国市场有关系,坦率地讲,至少中国政府不喜欢一个日本公司掌握着我很多核心的东西。日本公司拥有关键IP,中国市场肯定会有很多人有疑虑。”

 

华夏芯努力建设HSA生态链

 

华夏芯(北京)通用处理器技术有限公司是异构多核处理器IP核供应商,在处理器IP核方面,拥有完全自主知识产权,在国内外申请了多项基础核心专利,基本形成知识产权保护门槛。该公司的副总裁John Glossner已于2015年当选为异构系统架构联盟(HSA)主席,这也是中国企业第一次在高端处理器领域的国际组织中担任最高领导职务。

 

华夏芯在加入HSA联盟之初,就积极投入到相关技术的研究和开发中。目前在工具链方面,华夏芯开发的GCCBRIG已经交付GCC组织,成为HSA的主要开源工具之一。特别需要指出的是,在这一次峰会上,华夏芯还将对外发布新一轮的开源软件计划,这就是商业价值极高的深度学习和神经网络开源软件计划。

 

对于CPU+,华夏芯首席执行官李科奕表示:“CPU+时代的来临,背后有着强大的驱动力:那就是更强大的计算,更低的功耗,更方便的集成,开发团队更小,以及产品更快速进入市场。这不是某一项技术所能解决的,而是需要一整套从软件到硬件的标准。这正是HSA的目标。要实现这个目标,需要IP供应商、OEM制造商、学术组织、SoC厂商、操作系统供应商和软件供应商共同努力。”

 

在谈到开放性的时候,李科奕说:“HSA是完全开放的,全球有3个主要阵营做异构计算。英特尔是完全封闭的,它也是世界上唯一一个有能力什么都做的公司,它的实力和垄断优势摆在那儿。HSA是全面兼容的,支持X86,HSA是向它开放的,它会不会把自己的东西开放给别人呢?这要画一个很大的问号。”

 

确实,对中国来说,很难跟英特尔去谈架构合作,因为英特尔认为它的标准就是全球的标准,你很难和它共同制定一个平等的游戏规则,它不愿意开放,因为开放之后它就没有优势了。

 

在谈到OpenPOWER时,李科奕表示:“我觉得这是一个很不错的开放体系,OpenPOWER的优势主要在服务器上,HSA覆盖面比较广,它的主要优势还体现在嵌入式、移动计算领域,英特尔现在放弃了移动计算,这是HSA的第二个优势,第一个是开放性。为什么我提倡更多的中国处理器公司,包括下游厂商一起加入HSA?就是基于刚刚提到的开放性和共享,今天,HSA主席提到,所有的东西都是免费的,都是大家来共享,开源的,这对中国来说是非常重要的。”

 

联发科十核三丛助力HSA

 

联发科在2012年6月HSA联盟成立时就加入进去了,是6个初始建立者之一。除了是基金会的董事会成员外,联发科还积极参加各种不同的工作组,向HSA提交技术方案。联发科还主持着多厂商工作组的工作。

 

应用HSA 技术,联发科首创了十核三丛集架构,并将其应用到高端芯片曦力X20上,再辅以CorePilot3.0技术,实现了高性能、低功耗和优秀的用户体验。联发科与其他伙伴公司积极合作,评估如何将HSA技术更好地嵌入到SoC中。HSA技术能够使 CPU及其他运算单元实现更高的性能和更低的功耗,得益于这些优势。

 

HSA推广面对的问题和挑战

 

对于中国市场来说,异构计算和HSA还属于较新鲜的事物,现阶段,其在推广方面还面临着一些问题和挑战,具体表现如下:

第一,像这种系统级的整合,特别是系统软件和系统硬件方面的整合,难点在于高端人才比较稀缺。

第二,这个领域需要产业链上下游的协同合作。

首届HSA峰会于北京拉开帷幕,参会人员远超预期 全球下一代处理器峰会在京举行 中国如何领跑异构计算