🎯 内容更新日志

本文记录《AI Infra CUDA编程》系列文章的更新内容,便于追踪知识库的演进。

  • 2026-05-15:修正《内存访问优化》向量化加载章节,澄清向量化加载并不会提高显存带宽利用率(合并访问下标量与 float4 均为 100%),其真正收益在于减少指令数与发射开销,并相应更新适用场景表述。