vLLM Cookbook
文档
vLLM 官网
文档
核心模块详解
核心模块详解
深入理解 vLLM 的核心创新和实现
本部分将深入讲解 vLLM 的核心技术创新,包括 PagedAttention、KV Cache 管理、调度器和连续批处理等关键模块。
PagedAttention 分页注意力
KV Cache 管理器
Block Pool 内存块池
调度器原理
连续批处理机制
January 28, 2026:
vllm cook book (efdcc55)