GameNGen์ ํฌ๊ฒ ๋ ๊ณผ์ ์ ๊ฑฐ์ณ ๋ง๋ค์ด์ก์ต๋๋ค. 1) ๋ฐ์ดํฐ ์์ง์ ์ํด ์์ด์ ํธ์ ํ๋ ์ด๋ฅผ ํ๋ จํ๋ ๊ณผ์ ๊ณผ 2) ์์งํ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ชจ๋ธ์ ํ์ตํ๋ ๊ณผ์ ์
๋๋ค.
์์ด์ ํธ๋ฅผ ํ์ตํด, ๋ฐ์ดํฐ๋ฅผ ์์งํ๋ ๊ณผ์ ๋ถํฐ ์ดํด๋ณผ๊น์? ๊ฒ์์ ์ธ๊ณ๋ฅผ ์๋ฎฌ๋ ์ด์
ํ ๊ฒฐ๊ณผ๋ก ๋ณผ ์ ์์ต๋๋ค. ๊ฒ์์ ์กฐ์ํ๋ฉด์ ์ฐ๋ฆฌ๋ ๊ณ์ ๊ฒ์ ์ธ๊ณ์ ์ํธ์์ฉํ์ฃ . ํ๊ฒฝ๊ณผ ์ํธ์์ฉ์ ํตํด ํ์ตํด ๋๊ฐ๋ ๋ฐฉ์์ผ๋ก ๊ฐํํ์ต์ ๋ ์ฌ๋ฆด ์ ์์ต๋๋ค. ์์ด์ ํธ ํ๋ จ์ ์์ฑ์ ํ์ํ ๊ฐ ๊ณผ์ ์ ๊ธฐํธ๋ก ํํํ๋ฉด ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
ํ๊ฒฝ(Environment; E) ์ํ(State; S) ๊ด์ฐฐ(Observation, O) ํ๋(Action; A) ๋ ๋๋ง ๋ก์ง(Value Function; V) ํ๋ก๊ทธ๋จ ๋ก์ง(probability function; p)
โDOOMโ์์๋ ๋์ ์ธ ๋ฉ๋ชจ๋ฆฌ๊ฐ S, ํ๋ฉด์ ๋ ๋๋ง๋ ๊ฒฐ๊ณผ๊ฐ O, S์ ๋ฐ๋ผ O๋ฅผ ๋ ๋๋งํ๋ ๊ณผ์ ์ด V, ์ฌ์ฉ์์ ์
๋ ฅ์ด A, ์ฌ์ฉ์ ์
๋ ฅ์ ๋ฐ๋ผ ์คํํ ๊ฒฐ๊ณผ๋ฅผ p๋ผ๊ณ ๋ณผ ์ ์์ต๋๋ค. ์ผ๋ฐ์ ์ผ๋ก ๊ฐํํ์ต์ ํตํด ๊ฒ์์์ ์ป์ ์ ์๋ ๋ณด์์ ์ต๋ํํ๋๋ก, ์ฆ ์ข์ ํ๋ ์ด๋ฅผ ๋ณด์ด๋๋ก ํ๋ ๊ฒ์ด ํต์ฌ์ด์ง๋ง ์ด ์ฐ๊ตฌ์์๋ ๋ค๋ฆ
๋๋ค. ์ธ๊ฐ๊ณผ ์ ์ฌํ ํ๋ ์ด๋ฅผ ํตํด์ ์ต๋ํ ๋ค์ํ ์ฌ๋ก๋ฅผ ์์งํด์ผ ํฉ๋๋ค.
์ด๋ ๊ฒ ์์ด์ ํธ์ ํ๋(Action)๊ณผ ๊ด์ฐฐ(Observation)์ ์์งํ๊ณ , ํด๋น ๋ฐ์ดํฐ๋ก ์์ฑ ๋ชจ๋ธ์ ํ์ต์ํต๋๋ค. ํ์ต์ ํ์ฉํ ์ด๋ฏธ์ง ์์ฑ ๋ชจ๋ธ์ Stable Diffusion v1.4์
๋๋ค. ๊ธฐ์กด์ ํ
์คํธ ์
๋ ฅ์ ๋ด๋นํ๋ ๋ถ๋ถ ๋์ , ์ด ๋ชจ๋ธ์๋ ์ด์ ํ๋๊ณผ ๊ด์ฐฐ๋ ๊ฒฐ๊ณผ๋ฅผ ์กฐ๊ฑด์ผ๋ก ํ์ฌ ์ด๋ฏธ์ง๋ฅผ ์์ฑํ๋๋ก ํ์ต๋๋ค.
์ฐ๊ตฌ์๋ค์ ์์ฑ ํ๋ จ ๊ณผ์ ์์ ๋ฐ์ํ๋ Auto-regressive Drift ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด Noise Augmentation์ ์ ์ฉํ์ต๋๋ค. Auto-regressive Drift๋ ์๊ฐ์ ๋ฐ๋ผ ๋ชจ๋ธ ์ถ๋ ฅ์ด ์ ์ ๋ ํฌ๊ฒ ์ค๋ฅ๋ฅผ ๋์ ํด ๊ฐ๋ ํ์์ ๋งํ๋๋ฐ์. ํ๋ จ๊ณผ ์ถ๋ก ๊ณผ์ ์์ ๋ฐ์ํ๋ ์ฐจ์ด๋ก ์ด๋ฐ ํ์์ด ๋ฐ์ํ ์ ์์ต๋๋ค. ํ๋ จ ์์๋ ์์งํ ํ๋ จ ๋ฐ์ดํฐ๋ก ์ค์ ์ ๋ณด๋ฅผ ์
๋ ฅํด ๋ค์ ํ๋ ์์ ์์ธกํ๋๋ก ๋ชจ๋ธ์ ๊ฐ์ ๋ก ํ์ต์ํต๋๋ค(Teacher-forcing). ํ์ง๋ง ์ถ๋ก ์์๋ ์ถ๋ ฅ๋ ๊ฒฐ๊ณผ๊ฐ ๋ค์ ์
๋ ฅ๋๋๋ฐ์. ์ด ๊ฒฝ์ฐ ํ ๋ฒ ๋
ธ์ด์ฆ๊ฐ ๋ฐ์ํ๋ฉด ๋ชจ๋ธ์ด ์ด ๋
ธ์ด์ฆ๋ฅผ ์ ์ดํ์ง ๋ชปํ๊ณ , ์ถ๋ ฅ ๊ฒฐ๊ณผ์ ๋
ธ์ด์ฆ๊ฐ ๋์ ๋ผ ํ์ง์ ๊ณ์ ์
ํ๋ฉ๋๋ค.
Noise Augmentation์ ์ด๋ฌํ ์ฐจ์ด๋ฅผ ์ค์ด๊ธฐ ์ํด ์ธ์ฝ๋ฉ๋ ํ๋ ์์ Gaussian Noise๋ฅผ ๋ค์ํ๊ฒ ์ถ๊ฐํ์ฌ ์ปจํ
์คํธ ํ๋ ์์ ์๋์ ์ผ๋ก ์์์ํค๋ ๋ฐฉ๋ฒ์
๋๋ค. ๋ชจ๋ธ์ ์ผ๋ถ๋ฌ ์์์น ๋ชปํ ์ํฉ์ ๋
ธ์ถ์์ผ, ์ค์ ๊ฒ์ ํ๊ฒฝ๊ณผ ๊ฐ์ด ๋์ ์ด๊ณ ์์ธก ๋ถ๊ฐ๋ฅํ ์ํฉ์์๋ ๊ฒฌ๊ณ ํ ์ฑ๋ฅ์ ์ ์งํ ์ ์๋๋ก ํ์ง์. |