基于CUDA的并行计算在瞬态分析中的应用
针对瞬态分析耗时长的问题,研究了基于CUDA的并行计算方法。CUDA是NVIDIA公司推出的基于GPU的并行编程模型,采用C语言编程。它利用GPU多处理器的特点来实现大规模数据的并行计算,从而显著提高问题的求解速度。本文将CUDA技术应用到瞬态分析问题的显式求解上,较大的提高了求解效率。
透平叶栅静叶周向布局的数值研究
本文采用分区、并行计算方法求解二维Euler方程,对1.5级透平叶片排内的非定常流场干涉进行了数值模拟,并探讨了透平叶栅静叶周向布局对透平级性能的影响.计算结果表明,本文的处理和计算方法是合理有效的,并且发现存在静叶最佳周向布局,此时透平级的性能最好.本文所得结论对于透平级的优化设计是有意义的.
用OpenMP实现三维复杂渗流场的并行计算
建立了有自由面的三维渗流饱和-非饱和计算模型,该模型包含水头和饱和度两个变量,用二维、三维结果的对比证明了模型的合理性与准确性。通过分析数据执行时的相关性,算法结构的固有串行性及有限元计算的耗时分布,利用OpenMP并行编程接口,实现了渗流求解的并行化。对不同规模的问题进行了并行数值模拟并测定了加速比,通过分析可知加速比与处理器的个数呈线性分布,并且随着问题规模的增加而逐渐提高。
并行计算用于叶轮机械流场特性分析
本文采用LU-SGS-GE隐式格式和改良型高精度、高分辨率的MUSCL TVD格式求解平均的Navier-Stokes方程和低Reynolds数q-ω双方程湍流模型.利用分区处理及分布式网络并行计算技术,在多台个人计算机上完成了叶轮机械内部三维粘性流场的快速并行求解.仅将计算域拆分成8份,并行加速比就可达7.4.
使用流道反算延伸的多叶片排并行计算
计算域延伸与否对多叶片排计算模式的发展起到了很在的作用。计算域的延伸除了起到使计算域重叠,以便相邻叶片排能相互提供确定应力分布的作用外,还使计算域进出气边远离叶片前后缘,以减少边界反射引起的附加误差。并减少交接边界上周向不均匀性引起的掺混损失。本文探索进行适量延伸,以便在重叠区计算确定应力;不进行背压调整,使用确定应力模型的多叶片排并行计算新的途径。
实时特征级数据融合系统在光电经纬仪上的应用
为满足含有多个成像系统的光电经纬仪跟踪实时性的要求,保证其跟踪的精度与可靠性,设计并研制了符合MIMD架构的计算系统。对经纬仪预测滤波、数据融合问题进行了理论推导,证明该算法需要大量的数值计算。为满足上述计算要求,开发出一套具有双DSP,单FPGA的3个运算单元的专用并行计算系统,分析了每个运算单元实时运算的时间开销。仿真实验表明,在具有3个成像系统的光电经纬仪中,当CCD采样频率为50Hz时,光电编码器采样频率为800Hz,该系统可以满足1.25ms的实时性要求。
锥束CT重建FDK算法的两级并行计算研究
三维锥柬CT图像的FDK算法重建由于运算量大,在重建高分辨率的图像时,重建所需时间通常难以满足实际应用的需求,集群并行计算是解决上述问题的常用方法之一。在一个SMP集群系统上,采用MPI和Pthreads两种模型相结合的方法,通过节点之间的消息传递和节点内部的共享内存,实现了FDK算法的两级并行。
基于GATE程序的MicroSPECT成像系统并行化Monte Carlo模拟
MicroSPECT(micro single photon emission computed tomography)是专用于小动物成像的分子核医学设备.为了准确研究复杂放射源分布条件下光子在MicroSPECT成像系统中的输运过程,使用GATE程序模拟了基于H8500位置灵敏光电倍增管和针孔准直器的MicroSPECT系统,并在清华高性能计算集群上实现了GATE程序的并行化模拟.通过并行计算有效地提高了模拟速度,分别获得了点源、线源、Derenzo模型、Moby模型的投影数据及用于迭代断层图像重建的系统点扩展函数(point spread function,PSF)数据.
Scramjet燃烧室流场的三维并行数值模拟及试验比较
作者采用时间相关法,通过有限体积离散,运用带化学反应的全N-S方程,在神州巨型机上,针对试验模型,对油气比Φ=0.0和0.35的喷氢Scramjet燃烧室流场进行了三维并行数值模拟,得到了流场的精细结构。并行模拟所得壁面压力分布与试验所测得的壁面压力分布吻合较好。
具有挡板的管流中Karman涡街的并行格子Boltzmann模拟
本文应用格子Boltzmann方法对具有挡板二维管道中的Karman涡街进行了数值模拟,采用并行计算模式得到了在不同雷诺数不同时间步的情况下的涡线图,计算结果较好地再现了已有的数值结果。