日前,有媒体发布了《除了圆珠笔头,中国还有哪些核心技术没掌握?答案令人震惊……》一文,并在网络上广泛传播。文章中介绍了很多中国在诸多科技领域的短板,说明了在精密仪器、数控机床等领域中国依然和国际顶尖水平有较大差距。但文章存在一些明显的谬误,比如介绍了几项有关超算的内容,但这几项技术却并非中国还未掌握的核心技术。
日本在CPU+GPU异构式超算方面技术成果非常有限
《除了圆珠笔头,中国还有哪些核心技术没掌握?答案令人震惊……》一文中称:
“cpu/gpu异构式超算系统的提倡者兼此平台程序软件的先驱开发者,超级计算机界最高峰学术赏sidney fernbach award的新科得主——东京工业大学全球科学信息计算中心prof.satoshi matsuoka;随着后续软体资源的快速配套和并行集群计算技术的加速发展,cpu/gpu异构式超算已经成为整个hpc界的事实标准体系,从最早的tsubame1.2到连续green500测试头名的tsubame-kfc,目前全球几乎所有高性能超算系统都是此架构的支持者,matsuoka博士也因此获得了象征超级计算机领域个人最高荣誉的sidney fernbach award”
抛开文章中非常拗口的表达方式不谈,该文章中的内容很容易误导读者,以为日本在cpu/gpu异构式超算方面有很高的成就。那么,实际情况又是怎么样呢?
CPU+GPU异构式超算系统仅仅是异构式超算系统的一个选项,而日本matsuoka博士是CPU+GPU异构式超算系统的提倡者,而之后的完善和实现是全球众多工程师、公司合力的结果,比如中国国防科大、美国英伟达公司等都参与其中。
就CPU+GPU异构式超算的技术成果来说,中国有天河1A,美国有泰坦。相比之下,日本在CPU+GPU异构式超算方面却没有性能与泰坦相似的CPU+GPU异构式超算系统,根本没能建成哪怕一台性能达到神威太湖之光十分之一的cpu/gpu异构式超算。即便是日本最新建的超算Oakforest-PACS,也使用的是Intel的众核加速器,而非美国英伟达公司的GPGPU。
CPU+GPU异构式超算并非高不可攀
异构计算要使用不同类型的处理器来处理不同类型的计算任务。常见的计算单元包括CPU、GPGPU、GPDSP、ASIC、FPGA和其它类型的众核处理器等。采用异构计算架构的超算会使用至少2种类型的处理器,其中异构计算架构中通用CPU负责逻辑复杂的调度和串行任务,加速器负责并行度高的任务,实现计算加速。
具体来说,采用异构计算架构的超算在运算中既使用处理器,又使用GPU或众核芯片等加速器。中国天河2号、美国泰坦都采用异构计算架构。
而根据使用的加速器不同,异构超算也有多种类型。
比如美国超算泰坦、中国的天河1A,就是CPU+GPGPU。
中国超算天河2号就是CPU+众核处理器。
中国天河2A超算则是CPU+GPDSP。由于美国对中国四家超算中心禁售Intel至强PHI计算卡,升级之后的天河2A采用自主研发的矩阵2000来替代Intel的计算卡,在更换加速器之后,变成了CPU+GPDSP,这是全球首创。
此外,也可以使用直接使用经过有着特殊设计的众核芯片,比如神威太湖之光,这也是全球首创,国外间谍对中国这款众核芯片非常感兴趣。原因就在于这款众核芯片凭借设计理念的先进性,以落后美国Intel 公司2代的制造工艺,实现了与美国Intel公司最先进计算卡相似的性能。
从中可以看出,CPU+GPU异构体系只是异构超算体系的一个选项,而非什么高不可攀的黑科技。而且无论是中国天河2A的CPU+GPDSP,还是神威太湖之光的众核异构体系目前都是全球唯一,而且性能无与伦比。
文中“目前全球几乎所有高性能超算系统都是此架构的支持者”不符合客观事实
文章中称:“cpu/gpu异构式超算已经成为整个hpc界的事实标准体系”,“目前全球几乎所有高性能超算系统都是此架构的支持者”。但这与客观事实不相符。
举例来说,如上图所示:2016年TOP500前10的超算依次为:
神威太湖之光,中国,性能93P;
天河2号,中国,性能33P;
泰坦,美国,性能17P;
红杉,美国,性能17P;
科里,美国,性能14P;
Oakforest-PACS,日本,13P;
京,日本,性能10P;
代恩特峰,瑞士,性能9P;
米拉,美国,性能8P;
三一,美国,性能8P。
在这当中,红杉、米拉、三一、京都是属于同构体系超算,压根就不是异构体系超算,更遑论cpu/gpu异构式超算。
而天河2号、科里、Oakforest-PACS采用的是CPU+众核加速器,虽然属于异构超算体系,但并非cpu+gpu异构式超算。
神威太湖之光在技术上独树一帜,将管理核心与加速器合二为一,属于众核异构超算。
在全球性能最强的10台超算中,只有泰坦和代恩特峰使用了英伟达的GPGPU,属于cpu/gpu异构式超算。
从中可以看出,“cpu/gpu异构式超算已经成为整个hpc界的事实标准体系”,“目前全球几乎所有高性能超算系统都是此架构的支持者”这种说法是站不住脚的。
过度鼓吹被淘汰技术并不可取
文章中称:“NEC喧布已开发完成最新型SX系列矢量超级计算机——SX-ACE这台采用sun架构的矢量超算虽然其总体运算能力(130TFLOPS)排不进世界前5,但却具备世界第一的单核性能(64GFLOPS)和世界第一的单核内存带宽(64GB/s),并利用独到的工业设计实现紧凑化与低耗能”。
首先明确的是,日本比较推崇向量机,SX-ACE其实是向量机,中国在几十年前也曾经做过,比如已经有不少年月的国内首台银河亿次机就是向量机。因而向量机对于中国来说并非什么没有掌握的技术。
现在中国不做向量机,并非没有掌握该技术而做不了,而是完全是不屑于做。因为这种向量机完全早过时了,完全是被淘汰的设计,性能低就不说了,还有成本高,应用范围窄的缺点,更要命的是可扩展性也不好。
对于日本的SX-ACE,国内从事高性能计算机的资深工程师表示:这机器现在大概已不存在了吧。。。。。我说大概不存在,主要是目前很少有人再去推崇向量机;第二就是这台机器的性能参数并不突出,不值得耗费时间精力去关注。
最后要补充的是SX-ACE很多技术其实源自美国SUN公司,比如其SPARC处理器,就是SUN公司的遗产。
中国在超算技术上领先日本
在2011年,日本超算京曾经位列TOP500第一。但由于日本经济在广场协议之后一直保持在低迷的状态,加上超算本来就属于偏向国家工程的项目,相对较少的建造量和昂贵的价格都很难让私人公司通过超算获取高额利润,在研发成本过于高昂的情况下,使得日本NEC、日立等大公司先后退出超算研发领域,唯有富士通还在苦苦支撑。
而在超算研发经费的拨付上,日本政府相当吝啬。而且还曾发生过这样一件事——数位日本科学家联名向政府申请超算研发经费,结果遭到日本政客反问:“当老二有什么不好?”
也正是因此,由于长时间缺乏经费,导致日本在超算技术上缺乏大型工程的磨砺。对于此,日本官方也是心知肚明。在2016年,日本文部科学省发表了后续基本设计方针:“在发展方针中,日本文部科学省不再追求世界第一的计算速度,而是将目标由加快计算速度转向了加强节能及便捷功能”。但从曾经追求计算性能最强超算,到如今的追求最节能超算,想必日本从事超算建设的工程师们心中除了无奈只有苦笑吧。
在美国盐湖城SC16全球超算大会期间召开的第14届HPC Connection Workshop中外超算高峰论坛(HPCC)上,日本理化所Mitsuhisa Sato透露了日本发展E级超算的“旗舰2020计划”,宣布将在2017年4月投入运营Post K超级计算机,其系统峰值性能约为25P, 1000P超算的升级计划被排到了2020年。
不过,技术发展有其规律,是一步一个脚印迭代演进的,大跃进式一口吃成一个胖子的做法并不可取。而且日本的超算建设十有八九无法按时完成,举例来说,如今已将近2017年4月份了,日本理化所计划中投入运营的25P超算尚无音讯。何况日本最新的Oakforest-PACS也只有13P,从13P迅速跨越到1000P,这中间的技术扩跨度实在是太大,从处理器到互联网络都有质的飞越,如果不谋求从美国获取技术,这对于日本来说未必不是一个挑战。
目前,中国三家单位同时开展了1000P超算的原型机研制,并计划在2020年建成1000P超算。考虑到中国在过去几年中在超算上技术成果斐然,先后研制出曙光6000、天河1号、天河2号、神威太湖之光等性能优异的超算,中国很有可能领先日本完成1000P超算的建设。