[CS50 筆記] Week 6.5Artificial Intelligence
Sep 6, 2024
0. 前言
Hello! 大家好我是Murky! 我想要在這邊和大家分享我參加 CS50 讀書會第6.5周Artificial Intelligence 的筆記,但由於筆記裡面比較多的 Latex 公式,因此把本體 放在 HackMD,下面先放前面一小段,喜歡的話HackMD連結在文章最後面可以點進去看! 另外讀書會的Github連結在:Tech-Book-Community / CS50
1. Image Generation
參考資料:
1.1 常見圖片生成
- Autoencoder [2006]
- Variational Autoencoder (VAE) [2014]
- Flow-based models
- GAN [2014]
- PixelRNN [2016]
- Diffusion [2020]
1.2 Defusion Model
Defusion Model 是模仿Markov chain,利用常態分佈(高斯分佈)逐漸對一張圖片增加雜訊,直到看不到原始的圖片(下圖的q),再利用模型一步一步把圖片還原回來(下圖的p)
可以看下面這張圖逐漸從雜訊中生出一張圖。
Diffusion process (擴散過程)
下面是的意思是,我們會逐步對一張圖片加上常態分配的雜訊,這個步驟總共會做T次,其中的一次叫做t。Beta_t是一個會隨著t越大而增加的值,而雜訊的常態分配的平均數(mean)是Beta_t*上一步驟t-1的圖片, 變異數(var)是Beta_t,可以算出雜訊eps, 接著新的圖片會是main + √var*eps。
我們模型要訓練的其實是給定一張被雜訊污染的X_t,要求模型幫我們預測出是什麼雜訊污染他,也就是預測eps。
不好意思下面開始就會出現Latex,請前往HackMD繼續閱讀。