美国已经确定在2023年实现
超级计算机的下一个大飞跃,前提是现在到2023年间的两次总统选举和四次国会选举不会阻止该计划。
超级计算机跟政治有联系似乎有些奇怪,但随着这些系统变得越来越复杂和昂贵,这需要国会的资助。
政治现状让超级计算机社区感到受挫,并且在今年的大型超级计算机会议SC14推出了新的计划,旨在让研究人员向更广泛受众推广超级计算机好处。
最近来自欧洲、日本和中国的竞争压力,美国的超级计算机资助有望提高,中国现在运行着世界上速度最快的超级计算机。上周美国能源部宣布为IBM的两台150千万亿次系统资助3.25亿美元,其中有台系统有望实现300千万亿次。
IBM技术计算副总裁Dave Turek表示,这些系统的架构能力可以支持500千万亿次。
一个exaflop等于一百万的三次方(一个quintillion是1后面18个0)。这是美国在2008年实现1千万亿次(IBM构建的系统),或1000万亿次浮点运算后,超级计算机领域的下一个伟大的目标。1千万亿次等于1 quadrillion(1后面15个0)。
美国能源部先进科学计算研究项目的研究部总监William Harrod表示,2023年我们将会有百亿亿次系统。目前美国已经在下一代系统花费将近3亿美元,这仍然是很低的水平。
美国国会将不得不批准更多资金来推动研究,以满足这个发展时间表。虽然国会的支持现在看起来很好,但未来无法预测。
构建万亿亿次系统面临的技术挑战是多方面的。这包括解决软件问题来实现几十万计算核心的并行运行;解决可靠性和灵活性需求;以及能源效率。
郑州知网最后一个问题能源效率得到了很多的关注。对于每兆瓦功率,每年的费用大约是100万美元。计划在2017年运行的150千万亿次系统将运行在10兆瓦。
顶级国家研究人员承认,美国面临竞争压力来实现百亿亿次,但也需要理解软件堆栈开发很复杂,必须需要国际合作。
欧洲也有与美国类似的时间框架,而日本此前也宣布到2020年实现百亿亿次。但Riken理化学研究所高级计算科学研究所的副主任Akinori Yonezawa在周二接受采访时表示,其目标是到2020年构建200到600千万亿次系统,而不是万亿次系统,。
上个月,Riken选择富士通来为这个系统进行基本设计。
在2008年,美国第一个千万亿次系统来自于IBM公司。如果摩尔定律仍然适用于高性能计算,美国应该到2018年达到百亿亿次,但很明显在技术问题不太可能满足这个日期。
百亿亿次并不是容易实现的事情。
IBM的Turek表示,现在构建百亿亿次系统需要巨大数量的GPU,但问题是这种系统用来支持什么?
现在,衡量系统执行浮点速度的Linpack基准被广泛用来确定超级计算机的能力和500强排名。但对于百亿亿次系统,更有用的指标可能是应用程序的性能:该系统对真实世界的使用带来多大程度的改进。
Turek表示,IBM正在构建的
DOE系统将助力实现百亿亿次系统,这是降低风险的方法,因为我们知道这里需要大量的学习和创新