MIT ์ฐ๊ตฌ์ง์ ์ง๋ 5์, <The Platonic Representation Hypothesis> ๋ ผ๋ฌธ์ ๋ฐํํ์ต๋๋ค. ์ ๋ชฉ์์ ์ ์ ์๋ ๊ฒ์ฒ๋ผ ๋ฅ๋ฌ๋ ์ธ๊ณ๋ฅผ โํ๋ผํค์ ์ธ ํํ๋ฒโ์ผ๋ก ๋ด์ธ์ ๋๋ฐ์. ์ค๋์ ๋ค์ ์ฒ ํ์ ์ผ๋ก ์๋ก์ด ๊ฐ์ค์ ์ฃผ์ฅํ ๋ฅ๋ฌ๋ ๋ ผ๋ฌธ์ ์๊ฐํฉ๋๋ค. ๐
๊ณผ๊ฑฐ AI๋ ํ ๊ฐ์ง ํ์คํฌ์ ์ต์ ํ๋ ์ฑ๋ฅ์ ๋ณด์ ํ์ต๋๋ค. ๊ทธ๋ฌ๋ ์ค๋๋ AI ์๋น์ค๋ ๋ฉํฐ๋ชจ๋ฌ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ณธ์ ์ผ๋ก ๋ค๋ฃจ๊ณค ํฉ๋๋ค. ChatGPT, Gemini, Claude 3.5 ๋ชจ๋ ์ฌ์ฉ์๊ฐ ์ ์ํ ํ ์คํธ์ ์ด๋ฏธ์ง๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ง๋ฌธ์ ์ดํดํ๊ณ ๋ต๋ณํ ์ ์๋ฏ์ด ๋ง์ด์ฃ .
ํฌ๊ฒ ๋ณด๋ฉด AI๋ ๋ฐ์ดํฐ๋ฅผ ํ์ตํ ์ปดํจํ ๋ชจ๋ธ์ ๋๋ค. ์ฆ, ์ฃผ์ด์ง ๋ฐ์ดํฐ๋ฅผ ํ ๋๋ก ํน์ ํ ๋ฐฉ์์ ๋ฐ๋ผ ํ์ตํ๋๋ก ๋ง๋ค์ด์ก์ต๋๋ค. ๋ฉํฐ๋ชจ๋ฌ์ฒ๋ผ ๋ค์ํ ๋ฅ๋ ฅ์ ๋ณด์ ํ AI๋ ๋ฐ์ดํฐ์ ๋ชจ๋ธ ๊ตฌ์กฐ๋ก๋ถํฐ ์ถ๋ฐํ๋๋ฐ์.
MIT ์ฐ๊ตฌ์ง์ ํ๋ผํค์ โ์ด๋ฐ์โ ์ฌ์์ ๋น๋ ค์ต๋๋ค. โ์ด๋ฐ์โ๋ ๊ฐ๋จํ ์ค๋ช ํ์๋ฉด ์ด๋ค ๋์์ด ๊ฐ์ง๊ณ ์๋ ์๋ฒฝํ ๋ณธ์ง์ ๋๋ค. ์ฐ๋ฆฌ๊ฐ ๊ฒฝํํ๋ ๋ฌผ๋ฆฌ์ ์ธ๊ณ๋ ๋ชจ๋ ์ด ์ด๋ฐ์์ ๋ํ ๋ถ์์ ํ ๋ฐ์์ด๋ผ๊ณ ๋ณผ ์ ์์ฃ . ํ๋ผํค์ โ๋๊ตด์ ์ฐํโ๋ฅผ ์๋ก ๋๋๋ฐ์. ์ฌ๋๋ค์ด ์ด๋์ด ๋๊ตด ์์ ๊ฐํ ์์ต๋๋ค. ๊ทธ๋ค ๋ค์์ ๋ถ์ด ํ์ค๋ฅด๊ณ ์๊ณ ์. ์ฌ๋๋ค์ ๋ฒฝ์ ๋น์น๋ ๊ทธ๋ฆผ์๋ง์ ๋ณผ ์ ์๊ณ , ๊ทธ๊ฒ์ด ํ์ค์ด๋ผ๊ณ ๋ฏฟ์ต๋๋ค. ์ด โ๋๊ตด์ ์ฐํโ์ ๋ชจ๋ธ์ด ํ์ตํ๋ ๊ณผ์ ์ด ๋งค์ฐ ์ ์ฌํ๋ค๊ณ ๋ณผ ์ ์์ต๋๋ค. ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ์ ํ๋ ๋ฐ์ดํฐ(๋๊ตด์์์ ๊ทธ๋ฆผ์)๋ก๋ถํฐ ํ์ค ์ธ๊ณ์ ๋ณธ์ง์ ํ์ตํ๋ ค ํฉ๋๋ค. ์ด ๋ชจ๋ธ๋ค์ ๋ฐ์ดํฐ๋ฅผ ํตํด ํ์ค์ ๋ณต์กํ ๊ตฌ์กฐ๋ฅผ ํ์ ํ๋ ค ํ์ง๋ง, ์ด ๋ฐ์ดํฐ๋ ํ์ค์ ๋ถ์์ ํ ๋ฐ์์ผ ๋ฟ์ ๋๋ค.
์ถ์ฒ: ์ํคํผ๋์ โ๋๊ตด์ ์ฐํโ
๋๊ตด์ ๋ฒ์ด๋๋ ค๋ฉด ๋ถ์์ ํ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์๋ฒฝํ ๋ณธ์ง์ ์ฐพ์์ผ ํฉ๋๋ค. ์ฐ๊ตฌ์ง์ ์ฌ๊ธฐ์ ์ฒ ํ์ ๊ฐ๋ ์ ๋ค์ ํ ๋ฒ ๊บผ๋ด๋ญ๋๋ค. ๋ฐ๋ก โ์๋ ด์ ์ค์ฌ๋ก (Convergent Realism)โ์ ๋๋ค. ๋ง์ด ๋ค์ ์ด๋ ต๊ฒ ๋๊ปด์ง๋๋ฐ์. ์ฝ๊ฒ ๋งํ๋ฉด, ๊ณผํ์ด ๋ฐ์ ํ ์๋ก ์ฐ๋ฆฌ๋ ์ฐธ(๋ณธ์ง)์ ๋์ฑ ๊ฐ๊น์์ง๋ค๋ ๊ฒ์ ๋๋ค. ๋ฅ๋ฌ๋ ์ธ๊ณ์์๋ ๋ ๋ง์ ๋ฐ์ดํฐ๊ฐ ๋์ ๋ ์๋ก ๋ณธ์ง์ ๊ฐ๊น์์ง๋ค๊ณ ๋ณผ ์ ์๊ฒ ์ฃ .
๋๋ฌธํธ ํจ์คํ ์ด์ ์ํ '์๋ ์นด๋ ๋๋'๋ ํ๋ณตํ ๊ฐ์ ์ด ๋ชจ๋ ๋น์ทํ ๋ชจ์ต์ ๊ฐ์ง๊ณ ์๋ค๋ ์ฒซ ๋ฌธ์ฅ์ด ์ ๋ช ํฉ๋๋ค. ์ด๋ฒ ๋ ผ๋ฌธ์๋ ์ ์ฉ์ด ๊ฐ๋ฅํ๋ฐ์. ๋ชจ๋ ํจ์จ์ ์ธ ๋ชจ๋ธ์ 'ํ๋ณตํ ํํ(Happy Representation)'์ ํตํด ํ์ค์ ์ ์ฌํ ๋ฐฉ์์ผ๋ก ๋ฐ์ํ๋ค๋ ๊ฐ๋ ์ ์ค๋ช ํฉ๋๋ค. ์ด ์ด๋ก ์ ๋ชจ๋ ์ฑ๊ณต์ ์ธ ๋ชจ๋ธ์ด ์ผ์ข ์ ๊ณตํต๋ ํ์ค์ ํต๊ณ์ ๋ชจ๋ธ๋ก ์๋ ดํ ๊ฐ๋ฅ์ฑ์ ์ ์ํฉ๋๋ค. ๋ชจ๋ ์ฑ๊ณตํ ๋ชจ๋ธ์ ์ฌ์ค ๋น์ทํ ๋ชจ์ต์ ๊ฐ์ง๊ณ ์์ ํ ๋๊น์.
๊ฒฐ๊ณผ์ ์ผ๋ก ๋ ผ๋ฌธ์์ ์ด์ผ๊ธฐํ๋ ๊ฒ์ ํ๋์ ๋๋ค. โ์ธ์์ ๋ณธ์ง์ ์๋ฒ ๋ฉ ๊ณต๊ฐ ์์ ํํํ ์ ์๋ค.โ ์ด๋ฅผ ๋์ํํ๋ฉด ๋ค์๊ณผ ๊ฐ์ ๋ชจ์ต๋๋ค.
์ ์ด๋ฏธ์ง๋ ํด๋น ๋ ผ๋ฌธ์ ํต์ฌ์ ์ค๋ช ํฉ๋๋ค. ์ฐ๋ฆฌ๊ฐ ์๊ณ ์๋ ๋ณธ์ง์ Z์ ๋๋ค. Z๊ฐ ์ด๋ค ์(Image)์ผ๋ก ํํ๋๋ค๋ฉด X์ ๊ฐ์ ๋ฒกํฐ๋ก ํํ๋ ๊ฒ์ด๊ณ , ํ ์คํธ๋ก ์ค๋ช ๋๋ค๋ฉด Y์ ๊ฐ์ ๋ฒกํฐ๋ก ํํ๋ ๊ฒ์ ๋๋ค. Z๋ฅผ ํํํ X๋ฅผ ํตํด Y๋ฅผ ์ถ๋ก ํ ์ ์๊ฒ ์ง์. ๋ฐ๋๋ก ์ด๋ฏธ์ง์ ํ ์คํธ๋ ๋์์ ๋์ผํ ๋ณธ์ง์ธ Z๋ก ์๋ ดํด์ผ ํฉ๋๋ค. ๊ทธ๋ ๋ค๋ฉด ์ด ๊ฐ์ค์ ๋ํด ์ด๋ป๊ฒ ์ ์ฆํ ์ ์์๊น์?
์ต๊ทผ Transformer ๋ชจ๋ธ์ ํ ์คํธ, ์ด๋ฏธ์ง, ์ค๋์ค ๋ฑ ๋ค์ํ ๋ชจ๋ฌ๋ฆฌํฐ๋ฅผ ์ฒ๋ฆฌํ ์ ์๋๋ก ๋ฐ์ ํ์ต๋๋ค. ์ฆ, ํ๋์ ๊ธฐ์ด ๋ชจ๋ธ(Foundation Model)์ ๊ธฐ๋ฐ์ผ๋ก ์ฌ๋ฌ ๋ชจ๋ฌ๋ฆฌํฐ๋ฅผ ๋ค๋ฃจ๊ณ ํํํ ์ ์์ง์. ์ด๋ ์ค์ํ ๋ฐ์ ์ ์์์ ์ ๋๋ค.
๋ํ CNN์ ์ด๊ธฐ ๋ ์ด์ด๋ ๋์ ๋ฒ์๋ฅผ ํํํ๋ ํน์ฑ์ด ์์ด, ํ๋ฐ๋ถ ๋ ์ด์ด์ ๋นํด ๊ตํ ๊ฐ๋ฅ์ฑ์ด ๋์ต๋๋ค. ์ด๊ธฐ ๋ ์ด์ด๋ ๋ฐ์ดํฐ์ ๋ณธ์ง์ ๊ฐ๊น์ด ํํ์ ํ๊ธฐ ๋๋ฌธ์, ๋ค๋ฅธ ๋ชจ๋ธ๊ณผ ๊ต์ฒดํด๋ ์์ธก ์ฑ๋ฅ์ด ์ ์ง๋ ์ ์์ต๋๋ค.
์ด์ ๊ฐ์ ์ ์ฌ์ฑ์ ํ ์คํธ ๋ฐ์ดํฐ๋ฅผ ํ์ตํ๋ ๋ชจ๋ธ์์๋ ๋ํ๋ฉ๋๋ค. ์๋ฅผ ๋ค์ด, ์์ด๋ฅผ ํ์ตํ ์ธ์ฝ๋๋ฅผ ํ๋์ค์ด ๋์ฝ๋์ ์ ์ฉํ์ ๋ ํฐ ์ค์ฐจ ์์ด ๋ฐ์ดํฐ๋ฅผ ์์ฑํ ์ ์์ต๋๋ค. ์ด๋ ์ธ์ด ๊ฐ ์ ์ฌ์ฑ๋ฟ๋ง ์๋๋ผ, ๋ชจ๋ธ์ด ์ธ์ด์ ๊ตฌ์ฑ ํ์์ ๋ณธ์ง์ ์ผ๋ก ํ์ตํ๊ธฐ ๋๋ฌธ์ ๋๋ค.
์ค๋ฅธ์ชฝ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด ๋ชจ๋ธ ํํ(Model Representation)์ 2์ฐจ์์ผ๋ก ์๊ฐํํ UMAP์ ์ดํด๋ณธ ๊ฒฐ๊ณผ, ํด๊ฒฐํ ํ์คํฌ๊ฐ ๋ง์์๋ก(ํ๋์์ ๋จ์๋ก) ํด๋น ๋ถํฌ๊ฐ ๋์ฑ ๋ฐ์ง๋ ๊ฒฝํฅ์ด ๋ํ๋๋ค. ์ถ์ฒ: <The Platonic Representation Hypothesis> (Huh et al., 2024)
๋ชจ๋ธ์ ํฌ๊ธฐ๊ฐ ์ปค์ง์๋ก ์ฑ๋ฅ์ด ์ข์์ง๋๋ค. ์์ ๋ชจ๋ธ์ ๋นํด ํฐ ๋ชจ๋ธ์์ ๋ค๋ฅธ ๋ฐ์ดํฐ๊ฐ์ ์ ๋ ฌ(Alignment) ํจ๊ณผ๊ฐ ๋์ฑ ํฌ๋ค๊ณ ๋ฐํ์ก๋๋ฐ์. ์ด์ฒ๋ผ ๋์ ์ ์ด(Transfer) ๋ฅ๋ ฅ์ ๊ฐ์ง ๊ธฐ๋ฐ ๋ชจ๋ธ์ ๋ชจ๋ ์ ์ฌํ๊ฒ ๋ฐ์ง๋ ํํ ์งํฉ์ ํ์ฑํ์ง๋ง, ๋ฐ๋๋ก ๋ฎ์ ์ฑ๋ฅ์ ๋ณด์ด๋ ๋ชจ๋ธ์ ๊ฐ๊ธฐ ๋ค๋ฅธ ํํ์ ๊ฐ์ง๊ฒ ๋ฉ๋๋ค.
์ด์ ๊ฐ ๋ฌด์์ผ๊น์? ์ธ ๊ฐ์ง ํต์ฌ ๊ฐ์ค์ ์ดํด๋ณด๊ฒ ์ต๋๋ค.
์ด ๊ฐ์ค์ ์ด๋ค ํ์์ ํ์ต ๋ฐ์ดํฐ๋ผ๋ ๋์ผํ ํํ ๊ณต๊ฐ์ ๊ณต์ ํ ์ ์๋ค๊ณ ๋งํฉ๋๋ค. ์ฆ, ๋ฉํฐ๋ชจ๋ฌ ๋ฐ์ดํฐ์ ๊ดํด ๋ ๋ณธ์ง์ ๊ฐ๊น์ด ํํ์ ํ ์ ์๊ณ ๊ทธ ๊ฒฐ๊ณผ๋ก ๋์ฑ ์ข์ ์ฑ๋ฅ์ผ๋ก ์ด์ด์ง๋๋ก ํ์ตํ ์ ์๋ค๋ ์ฃผ์ฅ์ด์ง์. ๋ง์ฝ ์ด ๊ฐ์ค์ด ์ค์ ๋ก ์ด๋ฃจ์ด์ ธ ๋ณธ์ง์ธ Z๋ฅผ ๋์ฑ ์ ํํํ ์ ์๋ค๋ฉด ์ฐ๋ฆฌ๊ฐ ์ฌ๋ ์ธ๊ณ๋ฅผ ๊ทธ๋๋ก ๋ชจ๋ธ๋งํ ์ ์์์ง๋ ๋ชจ๋ฆ ๋๋ค. ๋ ๋์๊ฐ ํ๋ผํค์ด ์ค๋ช ํ ๋ณธ์ง์ด ๋ฌด์์ธ์ง์ ๋ํด์๋ ์๋ช ํ ์ ์๊ฒ ์ง์?
: OpenAI๊ฐ ๋์ฑ ๋น์ฉ ํจ์จ์ ์ธ ์์ ๋ชจ๋ธ์ธ GPT-4o mini๋ฅผ ๋ฐํํ์ต๋๋ค. ์ด ๋ชจ๋ธ์ ๊ธฐ์กด ๋ชจ๋ธ๋ณด๋ค ํจ์ฌ ์ ๋ ดํ ๊ฐ๊ฒฉ์ผ๋ก ์ ๊ณต๋๋ฉด์ ๋์์ ํ ์คํธ์ ์ด๋ฏธ์ง ์ฒ๋ฆฌ๋ฅผ ์ง์ํฉ๋๋ค. ์ด์ ChatGPT์์๋ GPT-3.5๋ ์ฌ๋ผ์ง๊ณ ๊ทธ ์๋ฆฌ์ GPT-4o mini๊ฐ ๋์ฒดํฉ๋๋ค.
Transformer์ ํ๊ณ๋ฅผ ๋ฐ์ด ๋์ ์๋ก์ด ์ํคํ ์ฒ, TTT
: Transformer ๋ชจ๋ธ ๊ตฌ์กฐ์ ํ๊ณ๋ฅผ ๋์ด์๊ธฐ ์ํด ์๋ก์ด ์ํคํ ์ฒ์ธ ํ ์คํธ ํ์ ํธ๋ ์ด๋(TTT)์ด ๋ฑ์ฅํ์ต๋๋ค. ์ด ์๋ก์ด ๋ฐฉ์์ Transformer์ ๊ณ ์ง์ ์ธ ์ ๋ ฅ ์๋ชจ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ์ ์๋ ๊ฐ๋ฅ์ฑ์ ๋ณด์ธ๋ค๊ณ ์๋ ค์ ธ ์ด๋ชฉ์ ๋๊ณ ์์ต๋๋ค.
Mistral, ๊ณ ๊ธ ์ฝ๋ฉ์ ํนํ๋ Codestral Mamba ๊ณต๊ฐ
: ํ๋์ค์ AI ์คํํธ์ Mistral AI๊ฐ ์ฝ๋ฉ์ ํนํ๋ Codestral Mamba๋ฅผ ๊ณต๊ฐํ์ต๋๋ค. Mamba๋ ์ด๋ก ์ ์ผ๋ก ๋ฌดํํ ๊ธธ์ด์ ์ํ์ค๋ฅผ ๋ชจ๋ธ๋งํ ์ ์๋ ๋ฅ๋ ฅ์ ๊ฐ์ง๊ณ ์์ด, ์ ๋ ฅ ๊ธธ์ด์ ๊ด๊ณ์์ด ๋น ๋ฅธ ์๋ต์ ๊ฐ๋ฅํ๊ฒ ํฉ๋๋ค. Codestral Mamba๋ HuggingFace์์ ๊ฐ์ค์น ์๋ณธ์ ๋ค์ด๋ก๋ํ ์ ์์ผ๋ฉฐ, ๋ก์ปฌ ํ๊ฒฝ์์ ๋ง์ ๋์์ ์ค ์ ์์ ๊ฒ์ผ๋ก ๋ณด์ ๋๋ค.
์ธ์ ๋ชจ๋ ๋ฐ์ดํฐ๋ฅผ ์ฐพ์,
AI ๋ผ์ดํ์ฌ์ดํด์ ํจ๊ปํ๋ ์ฌ์ธ์ ๋ฐ์ดํฐ ํ๋ซํผ
์
์ ๋ขฐํ ์ ์๋ AI๋ฅผ ์ํ ์ ํ