VLLM on WY 的技术博客

VLLM on WY 的技术博客https://zhouwy.top/tags/vllm/Recent content in VLLM on WY 的技术博客Hugozh-cnFri, 22 May 2026 00:00:00 +0000系列01：内存管理——当你在管理 ByteBuf 时，你已经在管理 KV Cache 了https://zhouwy.top/posts/java-to-ai-infra/01-%E5%86%85%E5%AD%98%E7%AE%A1%E7%90%86-bytebuf-kvcache-%E6%98%BE%E5%AD%98%E6%B1%A0/Fri, 22 May 2026 00:00:00 +0000https://zhouwy.top/posts/java-to-ai-infra/01-%E5%86%85%E5%AD%98%E7%AE%A1%E7%90%86-bytebuf-kvcache-%E6%98%BE%E5%AD%98%E6%B1%A0/从 Netty ByteBuf 池化、JVM 堆管理到 vLLM PagedAttention 与 GPU 显存管理，同一个问题在三个世界的不同解法。附带 4 个可运行的代码实验。