Claude Code 产经经理访谈实录
Inside Claude Code:产品经理 Cat Wu 深度访谈实录
从 I love you 讲清楚大模型推理:Prefill、Decode、Q/K/V/O 与 KV Cache 到底在做什么
用一个极简例子「I love you」,把 Prefill、Decode、Q/K/V/O、KV Cache 的工程直觉讲清楚。
一文讲透 github 12,000+星项目 xiaohongshu-mcp 核心设计思想
有幸参与了 github 12,000+星项目 xiaohongshu-mcp 的开发,本文分MCP Server 设计和浏览器自动化技术两个大的部分,详细解读该项目的核心设计思想。
ZeRO vs FSDP:大模型分布式训练的显存算账与通信拆解
从 16N GB 显存公式出发,逐级拆解 ZeRO-1/2/3 的切分逻辑,再对比 PyTorch 原生 FSDP 在工程实现上的核心差异。