2012年5月3日星期四

中国CAE软件发展的新契机 - CAE新闻资讯 - 中国仿真互动网(www.Simwe.com)

中国CAE软件发展的新契机 - CAE新闻资讯 - 中国仿真互动网(www.Simwe.com)


中国CAE软件发展的新契机

发布: Simwe    来源:万方数据    发布时间:2012-05-03   收藏】 【打印】  复制连接 【  】 我来说两句:(0逛逛论坛
0 引言
目前,加快发展科学与工程数值软件的需求愈加强烈,逐渐成为人们的共识,但在数值软件市场方面,特别是工程CAE软件的市场方面,国际竞争者已远远走在我国的前面,并且前进的步伐并未放缓,如何才能实现跨越?突破口在哪里?
在过去的几十年中,计算机处理器速度的发展一直遵循摩尔定律,应用程序随处理器频率的提高自然变快,然而,这一发展趋势由于处理器在性能提高上受功耗等问题的限制而难以为继。处理器性能的提高将不再单一依赖时钟频率的提高,而必须发挥其并行性。由于并行编程的复杂性,这种体系结构上的变化将极大地改变科学与工程计算实践,例如:如何在众核上实现计算的有效加速,特别是有限元计算这类典型的访存密集型算法程序?如何应对千万亿次计算的挑战?这些新问题正引发人们的关注和思考。本文从千万亿次计算的特点展开,讨论未来计算技术的发展趋势,就如何发展我国新一代科学与工程数值软件提出一些体会与建议。
1 千万亿次计算时代——一个新起点
从学科角度讲,以千万亿次以及更大规模计算能力为基础的计算科学的最主要特点是在实验不可行或仅有少量实验支持的情况下,立足于基本原理,经精细计算,通过验证与确认,最终达到可信“预知预报”的目的。赋予计算机模拟以真正的预言功能(发现新知识、认识新规律)是计算科学的终极发展目标。
以目前千万亿次超级计算机的系统规模估计,一个千万亿次级应用的并行度要达到几万到十几万以上CPU核,迄今为止,尚无程序可扩展到此规模,因此,如何发挥千万亿次级的计算能力是一个全新的课题——计算技术的历史性飞跃让我国与国际同行又重新站到同一起跑线上。
千万亿次级计算具有一些前所未有的特性:
(1)物理学特点。高分辨率、多尺度和多物理场,伴随着计算规模(分辨率)的提高,多空间、时间尺度求解成为必然,跨越不同尺度的数值模拟正是实现“预言性”计算的物理学基础,模拟对象物理学特点的这个改变必将驱使计算方法的改变。
(2)海量并行计算。几万甚至几十万计算内核级的海量并行计算与PC机时代诞生的现有CAE软件架构之间的矛盾将越来越突出,即PC机时代诞生的数值软件架构将越来越不能适应海量并行计算的要求。
(3)高可扩展性。目前国外商用CAE软件的可发展性:固体计算一般在几十核规模,流体计算一般在几百核的规模,同时,与传统并行计算相比,除可扩展数值算法本身外,未来的可扩展性问题将更多地体现在计算中的负载均衡方面。
(4)必须容错。千万亿次超级计算机随着系统规模增大,平均无故障运行时间将由于概率递增而缩短,只有容错能力强的程序才能完成相应规模的计算,程序算法设计必须假设计算节点出错为常态——这类在传统数值软件开发时完全不考虑的技术问题将变得至关重要。
与此相对应,支持千万亿次级计算的算法必然会出现一些新的特征,如:
(1)将充分利用尺度间“非全息”信息传递的特点,通过尺度间的计算分割(层次模式)进行并行计算,如采用“Google数字地图逐级放大的模式”设计层次型计算算法的思想将得到重视。
(2)通过耦合不同学科领域、不同尺度间的程序或现有成熟软件完成大规模复杂“多物理场多尺度”问题的求解,基于组件的软件架构设计及不同组件间的耦合技术将成为研究重点。
(3)在非线性多尺度计算中显式算法将发挥作用。目前比较有代表性的显式算法包括分子动力学模拟、光滑粒子动力学法和显式有限元法等。这几类方法主要求解牛顿第二定律,本质上完全相同,在向全尺度和高度非线性问题计算的发展过程中,显式算法的强健性和高可扩展性将发挥重要作用。
(4)计算密集型的高精度算法将受到重视。面向众核技术,适当降低矩阵稀疏性的数值方法将带来众核计算性能的释放。从应用角度看,大带宽矩阵往往对应高精度的数值方法,因此这种计算量大的高精度数值方法反而更适应未来的众核处理器。
(5)混合精度计算加速策略。长期以来,单精度似乎与科学计算无缘,在能使用双精度时通常不会使用单精度,然而从体系结构看,混合精度计算充分发挥向量部件、异构多核和GPGPU等单精度性能,同时提供更高的效能,如降低通信带宽要求、提高数据传输和通信效率、提高Cache利用率和降低能耗等。
简而言之,千万亿次计算时代的到来即将成为CAE软件发展的一个新起点。
2 世界水准的国产高性能计算平台
从2004年起,在不到10年的时间里,我国高性能计算机的计算速度迅速问鼎世界Top10:2004年“曙光4000A”首次进入世界前十名;2008年“曙光5000A”再次进入世界前十名榜单;2009年“天河-1”让我国的高性能计算能力跃升为世界前五名;2010年“曙光星云”让我国成为拥有世界第二快超级计算机的国家;而在刚刚结束的HPC China 2010上,“天河-1A”又以LINPACK测试2.507 Petaflops的速度让我国成为拥有世界上最快超级计算机的国家。目前,北京、深圳、天津、沈阳、武汉、广州、济南、成都和长沙等各城市都在投巨资建立从十万亿次、百万亿次到千万亿次甚至万万亿次规模的大型超级计算中心。
我国超级计算能力的飞速发展已引起世界的瞩目。我国的超级计算机为发展高端数值计算提供广阔的空间、充足的驱动力和世界水准的硬件平台,这也正是我国发展新一代数值软件的基础和优势。
3 历史性机遇,突破口与发展模式
我国高性能计算机硬件的飞速发展凸显出应用水平低的现实矛盾,具体表现为大规模并行数值模拟高端软件严重不足。据上海超级计算中心2009年统计:60%的高性能计算应用为16处理器核以下的规模(受国外并行软件授权费用的限制),所用的开源大规模并行代码99%来自国外,在美国橡树岭国家实验室,3万核以下的计算占50%,4万~9万核的计算占18%,“并非我们的硬件比人家差几百倍,而是我们在高性能计算的软件方面非常落后,并行计算能力还很差。”由于CAE软件市场长期由国外软件所垄断,授权费用昂贵,战略性、高水准的工业工程数值模拟受到限制,52.1%的人认为我国最新型的超级计算机应优先用于船舶和飞机的设计制造,然而,没有高性能CAE软件,这些应用无法完成。因此,发展高性能数值模拟软件,充分发挥计算机的效能是对高性能计算下一个10年的期盼。
从计算技术角度看,由海量并行性(数万甚至数十万以上的处理器核)和异构多/众核体系结构的驱动,数值模拟算法与软件正进入一个历史转折期,市场上现有的国外CAE软件大多诞生于PC机时代,与海量并行计算的架构性矛盾突出,面临重新设计、重新开始的可能。
那么如何突破?首先,要平衡算法研究与软件开发之间的“矛盾”。数值算法是数值模拟软件的核心,但同时数值算法仅是软件成功的必要而非充分条件,不能将二者等同。有时基于成熟算法的软件投资风险可能会更小,根本原因还在于数值算法是共享互通的,无法形成专利保护。因此,除对数值算法的重视外,一定要更加重视软件在架构上的优越性、前瞻性和开放性,其次,对于我国CAE软件的发展,面向高端市场、支持海量并行是取得突破的关键。
在软件的具体开发模式方面,目前国外普遍采用并行计算机、算法、软件与应用目标等4个方面交叉整合的模式,美国国立计算科学中心是世界最快超级计算机之一的Jaguar的昝理和运营机构,其网址的“.gov”后缀说明其重要性和地位。日本在其千万亿次计算项目的目标中也明确提出:(1)建造一台UNPACK测试速度达10Petaflops的机器;(2)发展和部署高性能应用软件;(3)建立一个世界先进的计算科学中心,位于神户的先进计算科学研究所于2010年正式成立。如出一辙,欧洲也倡导建造“单一”实体以凝聚数值模拟和高性能计算专家,这种发展模式值得学习和借鉴。应用-硬件的协同设计(co-design)是这种交叉整合模式的未来发展方向。
4 结论
科学与工程数值软件,特别是工程CAE软件的成功发展,始终无法回避在市场中的清晰定位问题,在决定软件生死存亡的市场上,国际竞争者已远远地走在前面,且前进的步伐较快。“如何才能实现超越,突破口在哪里?”是必须回答的关键问题。
我国面对的现实情况是:
(1)超级计算机的研制取得世界瞩目的成绩,但硬件高性能与应用低水平的矛盾较为突出;
(2)市场上的数值模拟软件大多诞生于PC机时代,其架构与未来海量并行计算需求之间的矛盾也将越来越突出。
因此,世界水准的超级计算平台、计算技术上的历史性转折以及PC机时代诞生的数值软件架构与未来海量并行需求之间的矛盾,都将是我国下一代科学与工程数值模拟软件实现后来居上、实现跨越式发展的契机,我们要抓住这个历史性机遇,发挥国产超级计算机的基础优势,以可容错、高可扩展的新一代大规模并行计算技术为支撑,通过打破市场上国外CAE软件在计算规模、分辨率和精度方面的局限以及技术封锁,从而在高端市场上实现国家战略诉求和中国CAE软件自主可控。
 


没有评论: