vLLM Cookbook

开始学习 GitHub

面向深度学习初学者的 vLLM 技术文档

本文档系列旨在帮助深度学习初学者深入理解 vLLM —— 一个高性能的大语言模型(LLM)推理和服务框架。

我们将从最基础的概念出发,逐步深入到核心算法和代码实现,让你不仅知其然,更知其所以然。

理解核心原理

深入讲解 PagedAttention 和连续批处理等核心创新技术

源码级分析

跟踪代码执行路径,理解从请求到响应的完整链路

循序渐进

从深度学习基础到进阶主题,提供清晰的学习路径

适用读者

  • 深度学习初学者:了解基本的 Python 编程,对机器学习有初步认识
  • LLM 应用开发者:希望了解推理框架底层原理
  • 系统工程师:负责部署和优化 LLM 服务
  • 研究人员:研究 LLM 推理优化技术