ScholarMate
客服热线:400-1616-289

CPU+GPU异构并行的矩阵转置算法研究

肖汉; 李彩林; 李琦; 周清雷
中国知网
山东理工大学; 郑州大学; 郑州师范高等专科学校

摘要

针对当前算法优化研究一般局限于单一硬件平台、很难实现在不同平台上高效运行的问题,利用图形处理器(GPU)提出了基于开放式计算语言(OpenCL)的矩阵转置并行算法.通过矩阵子块粗粒度并行、矩阵元素细粒度并行、工作项与数据的空间映射和本地存储器优化方法的应用,使矩阵转置算法在GPU计算平台上的性能提高了12倍.实验结果表明,与基于CPU的串行算法、基于开放多处理(OpenMP)并行算法和基于统一计算设备架构(CUDA)并行算法性能相比,矩阵转置并行算法在OpenCL架构下NVIDIA GPU计算平台上分别获得了12.26,2.23和1.50的加速比.该算法不仅性能高,而且实现了在不同计算平台间的...

关键词

矩阵转置 图形处理器 开放式计算语言 并行算法 matrix transpose Graphic Processing Unit(GPU) Open Computing Language(OpenCL) parallel algorithm