AI Infra 学习资源

发表于 2026-03-26 更新于 2026-05-18 分类于 AI Infra ，学习指南

LLM 学习资源

LLM 全栈优质资源汇总

目录

一、LLM 算法与模型
二、LLM 训练
三、LLM 推理
四、LLM 数据工程
五、LLM 压缩与量化
六、LLM 测评
七、LLM 对齐（RLHF/DPO）
八、提示工程
九、AI 框架
十、AI 基础设施
十一、AI 编译器
十二、LLM 应用开发
十三、LLMOps
十四、LLM 实践项目
十五、书籍
十六、综合资料汇总

一、LLM 算法与模型

1.1 Transformer

原理：

源码实现：

1.2 GPT 系列

GPT2：

ChatGPT：

1.3 GLM

预训练语言模型：GLM

1.4 MOE 大模型

1.5 多模态大模型

1.6 NExT-GPT（多模态下一代模型）

二、LLM 训练

2.1 分布式训练

2.2 训练技巧

2.3 LLM 微调

Adapting P-Tuning to Solve Non-English Downstream Tasks

三、LLM 推理

3.1 推理框架与加速

3.2 模型加载与部署

3.3 解码策略

3.4 KV Cache 优化

3.5 vLLM

四、LLM 数据工程

An Initial Exploration of Theoretical Support for Language Model Data Engineering (Part 1: Pretraining) @符尧

五、LLM 压缩与量化

六、LLM 测评

七、LLM 对齐（RLHF/DPO）

教程与解读：

论文：

八、提示工程

九、AI 框架

9.1 PyTorch

9.2 DeepSpeed

9.3 Megatron-LM

十、AI 基础设施

10.1 AI 芯片

10.2 CUDA

十一、AI 编译器

十二、LLM 应用开发

12.1 应用开发教程

12.2 RAG（检索增强生成）

12.3 Agent

综述：全新大语言模型驱动的Agent（复旦NLP & 米哈游）

12.4 其他

大模型bad case修复方案思考

十三、LLMOps

十四、LLM 实践项目

14.1 动手实现

minGPT @karpathy
llm.c @karpathy — LLM training in simple, raw C/CUDA
LLM101n @karpathy
llama2.c @karpathy — Inference Llama 2 in one file of pure C
nanoGPT @karpathy
Baby-Llama2-Chinese
从0到1构建一个MiniLLM
gpt-fast | blog

14.2 课程

十五、书籍

大语言模型原理与工程 @杨青
大语言模型从理论到实践 @张奇 | 主页
动手学大模型

十六、综合资料汇总

16.1 综合文章

16.2 safetensors 模型格式

16.3 Awesome 列表

16.4 微信公众号文章集锦

16.5 其他资源

Hugging Face 博客

0%