目前共计 109 个标签
AI Agent AI Infra AI编程 ALiBi Agent Agent Skills Attention BPE C++ CI/CD CLI CUDA Claude ClaudeCode Click Decoder Block Decoder-only DeepSpeed Encoder-Decoder FFN FlashAttention GPU GPU编程 GQA GitHub Actions HBM Hopper InfiniBand KV Cache Kernel优化 LLM LLM推理 LLaMA LangChain LayerNorm Linux Megatron-LM Memory Wall MoE Multi-Head Attention NCCL NVIDIA NVLink Next.js Nsight Nsight Compute Nsight Systems OpenCode PagedAttention Pre-Norm Profiling PyPI PyTorch Python RMSNorm React RoPE Roofline Self-Attention Sinusoidal Speculative Decoding SwiGLU Tensor Core Thread Block Cluster Tokenization Transformer Triton VS Code Word Embedding ZeRO autograd hatch opencode uv vLLM 代码助手 代码实现 位置编码 入门教程 分布式训练 前端开发 包管理 参数量计算 命令行工具 多智能体 学习路线 并行计算 性能优化 性能分析 推理优化 显存规划 智能体 智能体协作 模型架构 残差连接 深度学习 激活函数 算子优化 终端工具 编程语言 自动化 自回归生成 训练循环 词向量 通信拓扑 量化 长上下文 集合通信 面向对象