[CS50 筆記] Week 6.5Artificial Intelligence

Sep 6, 2024

0. 前言

Hello! 大家好我是Murky! 我想要在這邊和大家分享我參加 CS50 讀書會第6.5周Artificial Intelligence 的筆記，但由於筆記裡面比較多的 Latex 公式，因此把本體放在 HackMD，下面先放前面一小段，喜歡的話HackMD連結在文章最後面可以點進去看！另外讀書會的Github連結在：Tech-Book-Community / CS50

1. Image Generation

參考資料：

1.1 常見圖片生成

Autoencoder [2006]
Variational Autoencoder (VAE) [2014]
Flow-based models
GAN [2014]
PixelRNN [2016]
Diffusion [2020]

1.2 Defusion Model

Defusion Model 是模仿Markov chain，利用常態分佈(高斯分佈)逐漸對一張圖片增加雜訊，直到看不到原始的圖片(下圖的q)，再利用模型一步一步把圖片還原回來(下圖的p)

可以看下面這張圖逐漸從雜訊中生出一張圖。

Diffusion process (擴散過程)

下面是的意思是，我們會逐步對一張圖片加上常態分配的雜訊，這個步驟總共會做T次，其中的一次叫做t。Beta_t是一個會隨著t越大而增加的值，而雜訊的常態分配的平均數(mean)是Beta_t*上一步驟t-1的圖片, 變異數(var)是Beta_t，可以算出雜訊eps, 接著新的圖片會是main + √var*eps。

我們模型要訓練的其實是給定一張被雜訊污染的X_t，要求模型幫我們預測出是什麼雜訊污染他，也就是預測eps。

不好意思下面開始就會出現Latex，請前往HackMD繼續閱讀。

<前往HackMD繼續閱讀>

[CS50 筆記] Week 6.5Artificial Intelligence

0. 前言

1. Image Generation

1.1 常見圖片生成

1.2 Defusion Model

Written by Tiny_Murky