文章摘要
田泽,张骏,许宏杰.基于图元光栅化触发的高效GPU深度数据预取[J].高技术通讯(中文),2022,32(11):1126~1133
基于图元光栅化触发的高效GPU深度数据预取
An efficient GPU depth data pre-fetching strategy triggered by primitive rasterizing
  
DOI:10.3772/j.issn.1002-0470.2022.11.003
中文关键词: 图形处理器(GPU); 光栅化; 扫描; 深度测试
英文关键词: graphic processing unit (GPU), rasterizing, scan, depth test
基金项目:
作者单位
田泽 (西安翔腾微电子科技有限公司西安 710068) (航空工业西安航空计算技术研究所西安 710068) (集成电路与微系统设计航空科技重点实验室西安 710068) 
张骏 (西安翔腾微电子科技有限公司西安 710068) (航空工业西安航空计算技术研究所西安 710068) (集成电路与微系统设计航空科技重点实验室西安 710068) 
许宏杰 (西安翔腾微电子科技有限公司西安 710068) (航空工业西安航空计算技术研究所西安 710068) (集成电路与微系统设计航空科技重点实验室西安 710068) 
摘要点击次数: 701
全文下载次数: 644
中文摘要:
      数据预取技术已经广泛应用在各类中央处理器(CPU)设计领域,取得了很好的效果。而图形处理器(GPU)对存储带宽的需求更为巨大,与图形渲染流水线和图形算法直接相关,且数据访问模式与通用CPU有显著差异,需要更有针对性的有效数据预取机制。针对GPU深度测试关键功能,本文提出一种图元光栅化触发的高效深度数据预取机制——DPRT,通过图元光栅化过程中实时扫描到的片段块地址来触发Z缓存(Z Cache)的深度数据预取,同时为了适应不同实现中流水线处理延迟,为Z Cache数据块增加访问一次标志(OTT),保证深度数据预取有效性。实验结果表明,DPRT使深度测试时Z Cache访问命中率平均提升9.51%,深度测试延迟平均降低40.43%。
英文摘要:
      Data pre-fetching technique has already been widely applied to many kinds of central processing unit (CPU) design, and obtained very good results. While, graphic processing unit (GPU) has even larger requirement for memory bandwidth, directly interrelates with graphic rendering pipeline structure and graphic algorithm, and has extraordinarily differences in memory accessing pattern in contrast to general CPU, which needs more well-directed and effective data pre-fetching strategy. Aiming at the GPU depth test function, this paper proposes a depth data pre-fetching based on primitive rasterizing triggering, called DPRT, which triggers Z Cache depth data pre-fetching by using current scanned pixel fragment tile address. To adapt graphic rendering pipeline latency in different implementation, a once touching tag (OTT) is added in Z Cache tag array to assure the pre-fetching validation. Experiment result indicates that, comparing to base graphic rendering pipeline structure, DPRT increases Z Cache hit rate by average 9.51% and reduces depth test latency by average 40.43%.
查看全文   查看/发表评论  下载PDF阅读器
关闭

分享按钮