Ferkans — Interactive Telecom Tutor

Definition:
Denoising Diffusion Probabilistic Model

DDPM adds noise gradually over $T$ steps (forward process):

$q(\mathbf{x}_t | \mathbf{x}_0) = \mathcal{N}(\mathbf{x}_t; \sqrt{\bar{\alpha}_t}\mathbf{x}_0, (1-\bar{\alpha}_t)\mathbf{I})$

The model learns to reverse the process by predicting the noise:

$L = \mathbb{E}_{t, \mathbf{x}_0, \boldsymbol{\varepsilon}} \left[\|\boldsymbol{\varepsilon} - \boldsymbol{\varepsilon}_\theta(\mathbf{x}_t, t)\|^2\right]$

Sampling: start from $\mathbf{x}_T \sim \mathcal{N}(0, I)$ and iteratively denoise.

Definition:
Noise Schedule

The variance schedule $\beta_t$ controls the noise level:

$\alpha_t = 1 - \beta_t, \quad \bar{\alpha}_t = \prod_{s=1}^{t} \alpha_s$

Linear: $\beta_t$ linearly from $10^{-4}$ to $0.02$ . Cosine: $\bar{\alpha}_t = \cos^2\left(\frac{t/T + s}{1+s} \cdot \frac{\pi}{2}\right)$ .

Theorem: DDPM Simplied Loss

The variational lower bound for DDPM simplifies to:

$L_{\text{simple}} = \mathbb{E}_{t \sim U[1,T], \boldsymbol{\varepsilon} \sim \mathcal{N}(0,I)} \left[\|\boldsymbol{\varepsilon} - \boldsymbol{\varepsilon}_\theta(\sqrt{\bar{\alpha}_t}\mathbf{x}_0 + \sqrt{1-\bar{\alpha}_t}\boldsymbol{\varepsilon}, t)\|^2\right]$

This is simply training a denoiser at random noise levels.

DDPM training is just denoising: add noise at a random level, predict the noise, and minimise MSE. The magic is in the iterative sampling.

Denoising Diffusion (DDPM)

Definition:
Denoising Diffusion Probabilistic Model

Definition:
Noise Schedule

Theorem: DDPM Simplied Loss

Diffusion Forward and Reverse Process

Parameters

Noise Schedule Comparison

Parameters

Denoising Diffusion (DDPM)

Definition: Denoising Diffusion Probabilistic Model

Definition: Noise Schedule

Theorem: DDPM Simplied Loss

Diffusion Forward and Reverse Process

Parameters

Noise Schedule Comparison

Parameters

Definition:
Denoising Diffusion Probabilistic Model

Definition:
Noise Schedule