Blog posts

2025

The Basic Knowledge of Distributed Training Pipeline

less than 1 minute read

Published: June 26, 2025

Update: June 26, 2025

敬请期待🤪

The Basic Knowledge of RLHF Training Pipeline

130 minute read

Published: May 26, 2025

Update: June 14, 2025

这篇博客主要讲解 RLHF 具体训练的框架 (DeepSpeedChat，OpenRLHF，verl) 的具体细节，包括每个框架的整体架构，架构内的各部分细节 (包括逻辑细节和代码细节)。(建议先阅读我之前关于 RLHF 的博客 The Basic Knowledge of RLHF (Reinforce Learning with Human Feedback))

2024

The Basic Knowledge of Torch Train Pipeline

14 minute read

Published: May 05, 2024

Update: May 14, 2024

这篇博客主要讲解 PyTorch 训练模型的整个流程的具体细节，包括如何在前向过程中构建计算图；后向传播过程中如何计算并保存梯度；优化器如何根据梯度更新模型参数。(建议先阅读我之前关于 torch.autograd 的博客 The Basic Knowledge of PyTorch Autograd)

The Basic Knowledge of RLHF (Reinforce Learning with Human Feedback)

37 minute read

Published: April 12, 2024

Update: April 14, 2024

这篇博客主要讲解关于 RLHF 的基础知识和训练 LLM 的具体(简易)代码实现.

VMware Workstation Pro 安装 MacOS 虚拟机

17 minute read

Published: March 26, 2024

Update: March 30, 2024

这篇博客主要讲解如何在 VMware Workstation Pro 安装 MacOS 虚拟机。

The Basic Knowledge of MoE

109 minute read

Published: January 09, 2024

这篇博客主要讲解了使用 Mixture of Experts (MoE) 将多个模型进行组合的原理。

2023

The Basic Knowledge of TorchScript

15 minute read

Published: December 22, 2023

这篇博客主要讲解了使用 TorchScript 将 Python 模型代码转化为其他语言代码(如 C++)的原理和具体实现。

The Basic Knowledge of Automatic Mixed Precision

11 minute read

Published: December 19, 2023

这篇博客主要讲解了使用自动混合精度(AMP)降低模型内存占用的原理和具体实现。

The Basic Knowledge of Gradient Penalty

22 minute read

Published: December 19, 2023

这篇博客主要讲解了使用梯度惩罚(gradient penalty)作为正则化项来促进模型学习的数学原理和具体实现。

The Basic Knowledge of PyTorch Autograd

25 minute read

Published: December 15, 2023

Update: May 05, 2024

这篇博客主要介绍了 PyTorch 的 autograd 机制及其具体实现方式。

The Basic Knowledge of PyTorch Distributed

49 minute read

Published: December 13, 2023

Update: May 17, 2024

这篇博客主要介绍了 LLM 分布式并行的训练方式，并着重讲解了 PyTorch 代码的实现 DDP 的方式。

PyTorch 随笔

16 minute read

Published: December 11, 2023

torch.backends.cudnn.deterministic: 固定 cuda 的随机种子，使得每次返回的卷积算法都是确定的，即默认算法

The Basic Knowledge of Computer Hardware

25 minute read

Published: December 06, 2023

这篇博客主要介绍了电脑硬件中的基础知识(ps；强烈安利 B 站硬件茶谈的硬件科普视频，讲的太好了🙂。虽然他现在恰饭有点多😥)

The Basic Knowledge of LLM

9 minute read

Published: December 06, 2023

这篇博客主要介绍了 Large Language Model 的基础知识，包括常见的 LLM，微调方式等。

Animate Anyone

19 minute read

Published: December 03, 2023

论文题目：Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation

The Basic Knowledge of Expectation Maximization Algorithm

30 minute read

Published: December 02, 2023

这篇博客参考了通俗理解EM算法，详细推导了 Expectation Maximization (EM) 算法。

PixelDance

8 minute read

Published: November 27, 2023

论文题目：Make Pixels Dance: High-Dynamic Video Generation

The Basic Knowledge of NLP

43 minute read

Published: November 27, 2023

这篇博客主要介绍了 NLP 任务中的基础知识，包括性能评价指标(metrics)，分词算法(tokenization)等。

The Advanced Knowledge of Diffusion Model (DM)

32 minute read

Published: November 24, 2023

这篇博客参考了 What are Diffusion Models?，继续详细讲述了最近大火的 DM 模型的改进的数学原理/推导及编程 (ps：DM 的基础知识详见 The Basic Knowledge of Diffusion Model (DM))。

Prompt-to-Prompt

24 minute read

Published: November 22, 2023

论文题目：Prompt-to-Prompt Image Editing with Cross-Attention Control

Emu series (Emu & Emu Edit & Emu Video)

49 minute read

Published: November 21, 2023

本文主要对近期 Meta 发表的三篇关于视觉处理的文章(Emu 系列)进行论文解读(按照它们的发布顺序)：首先是 SOTA 的 text-to-image 生成模型 Emu；接着以它为 baseline，进行 image edit 的研究改进，提出了一个大一统的图像编辑模型 Emu Edit，这基本上就把图像领域主流的任务都刷了个遍。最后又提出了 Emu Video 模型，利用 Emu 完成了对 text-to-video 生成模型的改进，也获得了 SOTA。 (ps：我猜下一步应该就是 video edit 的研究改进了🙂)

The Basic Knowledge of Scored-based Generative Model

89 minute read

Published: November 16, 2023

这篇博客参考了 Generative Modeling by Estimating Gradients of the Data Distribution，详细讲述了最近大火的 Diffusion Model 的另一个理解/推理角度: Score-based Generative Model 的数学原理及编程。 (ps：建议先看完上述的 Generative Modeling by Estimating Gradients of the Data Distribution 博客，虽然是全英文的，但是写的十分详细，且简单易懂，真的非常良心)