面向深度学习初学者的 vLLM 技术文档
本文档系列旨在帮助深度学习初学者深入理解 vLLM —— 一个高性能的大语言模型(LLM)推理和服务框架。
我们将从最基础的概念出发,逐步深入到核心算法和代码实现,让你不仅知其然,更知其所以然。
深入讲解 PagedAttention 和连续批处理等核心创新技术
跟踪代码执行路径,理解从请求到响应的完整链路
从深度学习基础到进阶主题,提供清晰的学习路径