OpenCL(Open Computing Language)是第一个面向异构系统通用目的并行编程的标准,也是一个统一的编程环境,在异构架构下,主机完成任务的调度与分配,而加速设备完成数据密集型的计算任务。
利用OpenCL标准对图像算法进行加速的过程中,并行粒度的选择和数据的访存策略将直接影响到算法的加速效果。
因此,利用OpenCL标准对图像算法进行加速时需要对并行粒度进行合理选择,以及对数据访存策略进行优化。
主流的异构架构为CPU+GPU异构架构,与传统单一架构相比,异构架构能够更好的实现高性能并行计算,在深度学习、大数据和科学计算等领域有广阔的前景。
此外,GPU相比于CPU有更大的数据吞吐量和更强的浮点计算能力,特别适合并行计算。
全变分去噪方法具有高度的并行性和较大的数据吞吐量,可以利用CPU+GPU的异构架构加速算法的执行速度。