从事 AI 基础设施方向,聚焦 AI 框架层、算子层与推理系统的加速优化。日常关注 CUDA 算子、PyTorch 硬件特异性适配、vLLM 推理优化,以及从底层实现到工程落地之间的性能闭环。







关于我
About Me
主要工作
业余探索
关注 AI 如何真正进入应用场景:不只停留在模型和指标,而是成为能帮助人们完成工作、降低门槛、创造体验与带来快乐的工具。
生活爱好
生活中正在培养稳定健身习惯,用运动给长期工作补充体力和节奏。游戏偏好动作、剧情与治愈体验,也常在《鸣潮》的漂泊、《洛克王国》的精灵收集和《明日方舟》肉鸽里寻找灵感。
能力与兴趣树
Skills & Life Tree
AI Infra / 框架加速
- PyTorch
- CUDA
- Triton
- vLLM
- Kernel Tuning
- 硬件适配
推理与性能优化
- KV Cache
- Profiling
- Latency
- Throughput
- Stability
- 性能闭环
数理与系统基础
- 数学建模
- 概率统计
- 图网络
- 分布式系统
- Linux
- C/C++
AI 应用探索
- 工作提效
- 低门槛工具
- 交互体验
- 应用落地
- 产品化思考
- 快乐创造
健身与长期节奏
- 稳定训练
- 力量基础
- 有氧耐力
- 作息管理
- 身体恢复
- 长期主义
游戏与灵感收集
- 鸣潮
- 明日方舟
- 洛克王国
- 动作体验
- 剧情世界
- 治愈感
年轮时间线
Timeline
- 2017-2021本科
数学与应用数学专业学习,建立分析、代数、概率等数理基础,也训练了拆解问题、抽象建模和严谨推导的思维方式。
- 2021-2023研究生
统计学方向学习,进一步强化概率统计与数据分析能力。期间开始系统接触 AI,研究兴趣逐步转向 AI 在图网络结构中的应用。
- 2023-2024方向探索
初入职场,接触大数据、云平台、数据仓库、分布式系统与 AI 工程等多个方向。在充分理解常见技术栈和职场环境后,逐渐确认自己更擅长也更感兴趣的路径:AI Infra 与 AI 加速优化。
- 2024-至今深度耕耘
从 CUDA 算子的编写与优化切入,逐步扩展到 AI 训练、推理计算系统的性能优化。当前重点关注 PyTorch 的硬件特异性适配优化,以及 vLLM 等推理框架的效率与稳定性。
技术札记
Recent Notes

月窗茶室
Get In Touch
月色入窗,茶气未散。若你也在 AI Infra、应用落地、鸣潮、方舟肉鸽与洛克王国之间游走,欢迎留信,我们可以聊聊系统、优化与好玩的世界。



