[CS50 筆記] Week 6.5Artificial Intelligence

Tiny_Murky
Sep 6, 2024

--

0. 前言

Hello! 大家好我是Murky! 我想要在這邊和大家分享我參加 CS50 讀書會第6.5周Artificial Intelligence 的筆記,但由於筆記裡面比較多的 Latex 公式,因此把本體 放在 HackMD,下面先放前面一小段,喜歡的話HackMD連結在文章最後面可以點進去看! 另外讀書會的Github連結在:Tech-Book-Community / CS50

1. Image Generation

參考資料:

1.1 常見圖片生成

  • Autoencoder [2006]
  • Variational Autoencoder (VAE) [2014]
  • Flow-based models
  • GAN [2014]
  • PixelRNN [2016]
  • Diffusion [2020]

1.2 Defusion Model

Defusion Model 是模仿Markov chain,利用常態分佈(高斯分佈)逐漸對一張圖片增加雜訊,直到看不到原始的圖片(下圖的q),再利用模型一步一步把圖片還原回來(下圖的p)

可以看下面這張圖逐漸從雜訊中生出一張圖。

Diffusion process (擴散過程)

下面是的意思是,我們會逐步對一張圖片加上常態分配的雜訊,這個步驟總共會做T次,其中的一次叫做t。Beta_t是一個會隨著t越大而增加的值,而雜訊的常態分配的平均數(mean)是Beta_t*上一步驟t-1的圖片, 變異數(var)是Beta_t,可以算出雜訊eps, 接著新的圖片會是main + √var*eps。

我們模型要訓練的其實是給定一張被雜訊污染的X_t,要求模型幫我們預測出是什麼雜訊污染他,也就是預測eps。

不好意思下面開始就會出現Latex,請前往HackMD繼續閱讀。

<前往HackMD繼續閱讀>

--

--