欢迎来到草帽路飞的技术博客

探索技术,分享知识。这里记录了我在 AI Infra、高性能计算、深度学习框架、AI编程等领域的学习与实践。

文章分类导航
AI Infra (52)
✈️ 分布式训练 (1)
✈️ 推理与部署 (1)
✈️ CUDA编程 (1)
共 245 篇文章

  1. float4向量访存相比float1向量访存的优势是? 连续访存的情况下带宽利用率谁高?

  2. 全局内存和共享内存的访存粒度是怎样的?它们的访存模式分别是怎样的?

  3. 全局内存的合并访存是什么(连续访存)?共享内存讲究连续访存吗?

0%