Reku
Home
About
Writing
Projects
Writing
2026-03-08
Claude opus 4.6 独立发现的 DeepEP 时序问题
2026-03-01
ThunderKittens 2.0(1): 如何优化 Ulysses
2025-06-21
深度学习框架中的虚拟显存/vllm sleep mode
2025-06-10
LLM RL入门
2025-03-23
[Attention]FlashAttention/Ring-Attention/混合序列并行的统一原理
2025-03-11
品鉴一下OpenRLHF和verl的系统设计
2025-02-17
书籍推荐《深度学习入门2:自制框架》
2025-02-06
对DualPipe的一些想法
2020-10-13
MIT-6.S081 2020
2020-03-09
GNN for Source Code Modeling(三)