AI Infra 学习资源

LLM 学习资源

LLM 全栈优质资源汇总


目录


一、LLM 算法与模型

1.1 Transformer

原理:

源码实现:

1.2 GPT 系列

GPT2:

ChatGPT:

1.3 GLM

1.4 MOE 大模型

1.5 多模态大模型

1.6 NExT-GPT(多模态下一代模型)


二、LLM 训练

2.1 分布式训练

2.2 训练技巧

2.3 LLM 微调


三、LLM 推理

3.1 推理框架与加速

3.2 模型加载与部署

3.3 解码策略

3.4 KV Cache 优化

3.5 vLLM


四、LLM 数据工程


五、LLM 压缩与量化


六、LLM 测评


七、LLM 对齐(RLHF/DPO)

教程与解读:

论文:


八、提示工程


九、AI 框架

9.1 PyTorch

9.2 DeepSpeed

9.3 Megatron-LM


十、AI 基础设施

10.1 AI 芯片

10.2 CUDA


十一、AI 编译器


十二、LLM 应用开发

12.1 应用开发教程

12.2 RAG(检索增强生成)

12.3 Agent

12.4 其他


十三、LLMOps


十四、LLM 实践项目

14.1 动手实现

14.2 课程


十五、书籍


十六、综合资料汇总

16.1 综合文章

16.2 safetensors 模型格式

16.3 Awesome 列表

16.4 微信公众号文章集锦

16.5 其他资源