๐ซ ๋์น๋ฉด ์๋๋ ์ด๋ฒ์ฃผ AI ์์ TOP 3 2024๋
8์ 3์ฃผ์ฐจ ์
๋ ํธ์คํ ๋ด์ค๋ ํฐ |
|
|
๊ธ: ์ด์ฑ๋ฐฐ, ๋ฅ๋ค์ด๋ธ(deep daiv.) ์ ํด ์ฝํ
์ธ ใ
ฃ ์๋ํฐ: ์ ์ธ์ |
|
|
๐ ํ-ํ, ํ-ํ, ํ๊ตฌ์น๋ ๋ก๋ด |
|
|
์ง๋ 7์ผ, Google DeepMind์์ ํ๊ตฌ ์น๋ ๋ก๋ด ์ฐ๊ตฌ๋ฅผ ๋ฐํํ์ต๋๋ค. AI๋ฅผ ํ์ฉํด ์๋ง์ถ์ด ์์ค์ ์ธ๊ฐ๊ณผ ๊ฒฝ์ํ ์ ์๋ ์ฑ๊ณผ๋ฅผ ์ด๋ค๋๋๋ฐ์. ๊ณผ์ฐ ์ด๋ค ๋ก๋ด์ธ๊ฑธ๊น์? ๐ค
|
|
|
์ธ๊ฐ์ฒ๋ผ ๊ธฐ์ ์ ์ฐ๋งํ๋ ๋ก๋ด |
|
|
DeepMind๋ ์ด๋ฏธ ์ธ๊ฐ ์์ค์ ๋ฐ์ด๋๋ ๋ฐ๋ ๋ชจ๋ธ, AlphaGo๋ฅผ ๋ง๋ ์ ๋ ฅ์ด ์์ต๋๋ค. ๊ทธ ์ธ์๋ ์ฒด์ค, ์ค๋ชฉ ๋ฑ์ ๋ชจ๋ ์ ๋ต์ ์๋ฎฌ๋ ์ด์
ํ๋ฉฐ ํ
์คํธํ ์ ์๊ณ , ์ด ์๋ฎฌ๋ ์ด์
๊ณผ์ ์ ์ค์ ๊ฒ์์ ์ํ๋ ๋ฐ ์์ด ํฐ ์ฐจ์ด๊ฐ ์์ต๋๋ค. ๋ฐ๋์์๋ AlphaGo์ ๋ช
๋ น์ ๋ฐ๋ผ ์๋ฅผ ๋์์ค ์ฌ๋ ํ ๋ช
๋ง ์์ผ๋ฉด ์ถฉ๋ถํ์ฃ .
ํ์ง๋ง ํ๊ตฌ๋ ๋ค๋ฆ
๋๋ค. ์์น, ์๋, ํ์ ๋ฑ ๋ค์ํ ๋ณ์๋ฅผ ์กฐ์ ํ๋ฉฐ ๊ฒฝ๊ธฐ๋ฅผ ํผ์น๋ ๋ณต์กํ ์คํฌ์ธ ์
๋๋ค. ์ฌ๊ธฐ์๋ ๋ ๊ฐ์ง ์์๊ฐ ์ค์ํ๋ฐ์. ๋ฐ๋ก 1) ๋์ ์์ค์ ์ ๋ต์ ๊ฒฐ์ ์ ๋ด๋ฆฌ๋ ๋ฅ๋ ฅ๊ณผ 2) ๊ทธ ์ ๋ต์ ์คํํ ์ ์๋ ๋ฌผ๋ฆฌ์ ๊ธฐ์ ์
๋๋ค. ๋ก๋ด์ ์ค์๊ฐ์ผ๋ก ๊ฐ์ฅ ์ ๋ฆฌํ ์ ๋ต์ ์ ํํ ํ, ์ด๋ฅผ ์ํํ ์ ์๋ ๊ธฐ์ ์ ๊ฐ์ถ ์ํ์์ ํ์ํ ๊ฒฝ์ฐ ์ ๋ต์ ์ผ๋ก ๋ ์ ๋ฆฌํ ์ ํ์ ํ ์๋ ์์ด์ผ ํฉ๋๋ค.
์ฐ๊ตฌ์ง์ ๊ณ์ธต์ ์ด๊ณ ๋ชจ๋ํ๋ ์ ์ฑ
์ํคํ
์ฒ๋ฅผ ์ ์ํ์ต๋๋ค. ์ด ์์คํ
์ ์ฌ๋ฌ ์ ์์ค ๊ธฐ์ ์ ์ฑ
(Low-level Skill Policies)๊ณผ ๊ณ ์์ค ์ปจํธ๋กค๋ฌ(High-level Controller)๋ก ๊ตฌ์ฑ๋์ด ์์ต๋๋ค. ๊ฐ ์ ์์ค ๊ธฐ์ ์ ์ฑ
์ ๋ง์ ํ๊ตฌ ๊ธฐ์ ์ ์๋ฏธํฉ๋๋ค. ๋ํ์ ์ผ๋ก ํฌํธ๋ ํ์คํ, ๋ฐฑํธ๋ ํ๊ฒํ
, ๋๋ ํฌํธ๋ ์๋ธ์ ๊ฐ์ ํ๊ตฌ ์ ๋ฌธ ๊ธฐ์ ์ด ์์ฃ .
ํน์ ๊ธฐ์ ์ด ์ถฉ๋ถํ ํ๋ จ๋๋ฉด, ๊ณ ์์ค ์ปจํธ๋กค๋ฌ๋ ๋์ฑ ์ ๋ฌธ์ ์ธ ํํ๋ก ๋ก๋ด์ ๋ฐ์ ์ํต๋๋ค. ํน์ํ ๊ธฐ์ ์ ๊ตฌ์ฌํ๋ ๋ฅ๋ ฅ์ ์ตํ ๋ค์ ์ด๋ค ํ์ด๋ฐ์ ์ด๋ค ๊ธฐ์ ์ ํ์ฉํด์ผ ํ๋์ง ๊ฒฐ์ ํ๋๋ฐ์. ์ด๋ ๊ฒ์ ์ค์ ์ป๋ ์ค์๊ฐ ์ ๋ณด๋ง ํ์ฉํ์ง ์์ต๋๋ค. ํ์ฅ์์ ์ ์๊ฐ ์ฝ์น์๊ฒ ํผ๋๋ฐฑ์ ๋ฐ๋ฏ์ด ๊ฒ์ ํต๊ณ, ์๋๋ฐฉ์ ๋ฅ๋ ฅ๊ณผ ๊ฐ์ ์ค๋ช
์ ๊ธฐ๋ฐ์ผ๋ก ์ต์ ์ ๊ธฐ์ ์ ์ ํํ๊ธฐ๋ ํฉ๋๋ค.
|
|
|
ํ๊ตฌ ๋ก๋ด์ด ํ์ตํ๋ ๋ฐฉ๋ฒ |
|
|
ํ๊ตฌ ๋ก๋ด์๊ฒ๋ ๋ฌผ๋ก ํ์ต ๋ฐ์ดํฐ๊ฐ ํ์ํฉ๋๋ค. ์ด๊ธฐ ์์
์กฐ๊ฑด์ ์ค์ ํ๊ธฐ ์ํด ์๋์ ์ธ๊ฐ ๋ ์ธ๊ฐ ๊ฒฝ๊ธฐ ๋ฐ์ดํฐ๋ฅผ ์์งํ๊ณ , ์ด๋ฅผ ๋ฐํ์ผ๋ก ์๋ฎฌ๋ ์ด์
์์ ์์ด์ ํธ๋ฅผ ํ๋ จ์ํต๋๋ค. ์ดํ, ์ ์ฑ
์ ์ค์ ํ๋์จ์ด์ ๋ฐ๋ก ์ ์ฉํ๋ ์ ๋ก์ท(Zero-shot) ๊ธฐ์ ์ ์ฌ์ฉํ์ฌ ๋ก๋ด์ ํ๊ตฌ๋ ์์ ๋ฐฐ์นํฉ๋๋ค. ๋ก๋ด์ ์ธ๊ฐ๊ณผ์ ์ค์ ๊ฒฝ๊ธฐ์์ ๋ ๋ง์ ํ๋ จ ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๊ณ , ์ด ๊ณผ์ ์ ๋ฐ๋ณตํ๋ฉฐ ๊ธฐ์ ์ ์ ์ง์ ์ผ๋ก ํฅ์์ํต๋๋ค. ์ด ๊ณผ์ ์ ๊ทธ๋ฆผ์ผ๋ก ์ค๋ช
ํ๋ฉด ์๋์ ๊ฐ์ต๋๋ค. |
|
|
์ถ์ฒ: <Achieving Human Level Competitive Robot Table Tennis> (DโAmbrosio et al., 2024)
์ด๋ฏธ์ง์ ์ผ์ชฝ ๋ถ๋ถ์ ํ๋ จ ๊ณผ์ ์ ๋ณด์ฌ์ค๋๋ค. ๋ก๋ด์ MuJoCo ๋ฌผ๋ฆฌ ์์ง๊ณผ ๊ฐ์ ์๋ฎฌ๋ ์ด์
ํ๊ฒฝ์์ ํ๋ จ์ ๋ฐ์ต๋๋ค. ์ฌ๊ธฐ์ ๋ก๋ด์ ๋ค์ํ ๊ณต์ ์ํ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ์ฌ ์ ์์ค ์ปจํธ๋กค๋ฌ(LLC)๋ค์ ๊ธฐ์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ๊ตฌ์ถํฉ๋๋ค. ์ด ์ ์์ค ์ปจํธ๋กค๋ฌ๋ค์ ์๋ธ๋ ๋ ๋ฆฌ ๋ฑ ๋ค์ํ ๊ธฐ์ ์ ๋ด๋นํ๋ฉฐ, ์๋ฎฌ๋ ์ด์
๊ณผ ์ค์ ์ธ๊ณ ๊ฐ์ ์ฐจ์ด๋ฅผ ์ค์ด๊ธฐ ์ํ ์ด๋ํฐ๋ฅผ ์ฌ์ฉํด ํ์ต๋ฉ๋๋ค.
์ด์ ๋์์, ๊ฐ์ ๊ณต์ ์ํ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํด ์ด๋ค ์คํ์ผ๋ก ๋์ํ ์ง ๊ฒฐ์ ํ๊ธฐ ์ํ ๊ณ ์์ค ์ปจํธ๋กค๋ฌ(HLC)๋ ํ๋ จ๋ฉ๋๋ค. ์ค์ ๊ณต์ ์ํ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํด ํ์ค์ ์ธ ์๋ฎฌ๋ ์ด์
์ ๊ตฌํํ๊ธฐ ๋๋ฌธ์, ํ๋ จ๋ ์ ์ฑ
๋ค์ ๋ณ๋์ ์ถ๊ฐ ์กฐ์ ์์ด ์ค์ ํ๊ฒฝ์ ์ ์ฉํ ์ ์์ต๋๋ค.
์ด๋ฏธ์ง์ ์ค๋ฅธ์ชฝ ๋ถ๋ถ์ ์ค์ ๊ฒฝ๊ธฐ์์์ ์ ์ฉ ๊ณผ์ ์ ๋ํ๋
๋๋ค. ๋ก๋ด์ด ์ค์ ๊ฒฝ๊ธฐ์์ ๋ฐฐ์น๋ ๋, HLC๋ ์คํ์ผ ์ ํ๊ธฐ๋ฅผ ์ฌ์ฉํด ํฌํธ๋ ๋๋ ๋ฐฑํธ๋ ์ธก๋ฉด์ ์ ํํ๋๋ฐ์. ๋ก๋ด์ด ์ค์ ํ๊ฒฝ์์ ์์ง์ผ ๋, ๊ฒฝ๊ธฐ์ฅ์์์ ๊ด์ฐฐ ๋ฐ์ดํฐ(๊ณต์ ์์น, ํ๊ตฌ์ฑ์ ์์น์ ๋ฐฉํฅ, ๊ณต์ ์๋ ๋ฑ)๊ฐ ์์ง๋ฉ๋๋ค. ์ด ๋ฐ์ดํฐ๋ ์ค์๊ฐ์ผ๋ก ๋ก๋ด์ ํ๋์ ํผ๋๋ฐฑ์ ์ ๊ณตํ๊ธฐ ๋๋ฌธ์, ๋ก๋ด์ด ๊ณ์ํด์ ์์ ์ ๊ธฐ์ ์ ๊ฐ์ ํ๊ณ , ์๋๋ฐฉ์ ์คํ์ผ์ ๋ง์ถฐ ํ๋ ์ด๋ฅผ ์กฐ์ ํ ์ ์๋๋ก ํฉ๋๋ค.
๋ก๋ด์ โ์ค์ ๊ณผ ๊ฐ์ ํ๋ จโ๊ณผ โํ๋ จ๊ณผ ๊ฐ์ ์ค์ โ์ ๋ฐ๋ณตํฉ๋๋ค. ์ค์ ๋ก ์ธ๊ฐ์ฒ๋ผ ์๊ฐ์ ๋ค์ฌ ๊ฒ์์ ๋ง์ด ํ ์ ์๊ธฐ ๋๋ฌธ์ ํ์ค์ ์์ ํ ๋ชจ๋ฐฉํ ์๋ฎฌ๋ ์ด์
์ ํตํด ๋ค์ํ ์ ๋ต์ ์ธ์ฐ๊ณ , ์ด๋ฅผ ์ค์ ์์ ํ
์คํธํ๋ฉด์ ๋์์ ์๋์๊ฒ ๋น ๋ฅด๊ฒ ์ ์ํ์ง์. ์ด๋ ๊ฒ ์๋ฎฌ๋ ์ด์
์ํ์์ ํ์ตํ ๋ชจ๋ธ์ ํ์ค๋ก ์ฎ๊ธฐ๋ ๊ฒ์ Sim-to-Real์ด๋ผ๊ณ ํ๋๋ฐ, ์ด ๊ฒฉ์ฐจ๋ฅผ ์ต์ํํ๋ ๊ฒ์ ๋ฌผ๋ฆฌ์ ์ผ๋ก ๋ชจ๋ธ๋งํ๋ ๋ฐ ์์ด ๋งค์ฐ ์ค์ํ ๋ฌธ์ ์
๋๋ค.
|
|
|
ํ๊ตฌ ๋ก๋ด์ ํ์ต์ํค๋ 2๊ฐ์ง ์ฃผ์ ์๋ฆฌ์ ์ฑ๊ณผ |
|
|
์ฐ๊ตฌ์ง์ ํ์ด๋ธ๋ฆฌ๋ ํ์ต ๋ฐฉ๋ฒ์ ์ ์ํฉ๋๋ค. ์ธ๊ฐ์ ํ๋๊ณผ ์ฃผ๋ณ ํ๊ฒฝ์ ์ํธ์์ฉ์ ์ฌ์ค์ ์ ํํ ์์ธก์ด ๋ถ๊ฐ๋ฅํ๋ฐ์. ์ด๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํด ์ธ๊ฐ ํ๋ ๋ชจ๋ธ๋ง, ์ฆ ์ธ๊ฐ์ด ํ๊ตฌ๋ฅผ ํ ๋ ๊ณต์ ๋ถํฌ๋ฅผ ๋ชจ๋ธ๋งํ๊ณ ์ด์ ๋์ํ ์ ์๋๋ก ๊ฐํํ์ต ๋ฐฉ๋ฒ๋ก ์ ์ ์ฉํฉ๋๋ค. ๋ํ, ๋ก๋ด์ด ์๋ก์ด ์ํฉ์์๋ ์ธ๊ฐ์ฒ๋ผ ์์ฐ์ค๋ฝ๊ฒ ํ๋ํ๋๋ก ๋ชจ๋ฐฉํ์ต์ ์งํํฉ๋๋ค.
์ด๋ ๊ฒ ํ์ตํ ๋ก๋ด์ ์ด 29๋ฒ ์ธ๊ฐ๊ณผ ๊ฒฝ๊ธฐ๋ฅผ ์งํํ๋๋ฐ์. ์ด ์ค ๋ก๋ด์ด 45% (13/29)์ ๊ฒฝ๊ธฐ๋ฅผ ์น๋ฆฌํ์ต๋๋ค. ์๋๋ ์ด๋ณด์๋ถํฐ ๋ํ ์ฐธ๊ฐ์ ์์ค๊น์ง ๋ค์ํ ์ค๋ ฅ์ ์ธ๊ฐ ์ ์๋ค์ด์๋ค๊ณ ํ๋๋ฐ์. ๋น๋ก ๊ฐ์ฅ ์๋ จ๋ ์ ์๋ค๊ณผ์ ๊ฒฝ๊ธฐ์์๋ ๋ชจ๋ ํจํ์ง๋ง, ์ด๋ณด์์์ ๊ฒฝ๊ธฐ์์๋ 100% ์น๋ฆฌ, ์ค๊ธ์์์ ๊ฒฝ๊ธฐ์์๋ 55%์ ์น๋ฅ ์ ๊ธฐ๋กํ์ต๋๋ค.
|
|
|
ํ๊ตฌ๋ฅผ ๋น๋กฏํ ์คํฌ์ธ ์ข
๋ชฉ์ ๋ฐ์ด๋ ์ด๋ ์ ๊ฒฝ์ ๊ธฐ๋ฐ์ผ๋ก ์ค๋ซ๋์ ํ๋ จ์ ๊ฑฐ์ณ์ผ ์ด๋ ์ ๋ ๋ฅ๋ ฅ์ ๊ฐ์ถ ์ ์์ต๋๋ค. ๋ก๋ด์ด ์๋ง์ถ์ด ์ธ๊ฐ ์์ค์ผ๋ก ์คํฌ์ธ ๊ฒฝ๊ธฐ๋ฅผ ํ ์ ์๋ค๋ ๊ฑด, ๊ทธ ์์ฒด๋ง์ผ๋ก๋ ์๋ก์ด ๊ฐ๋ฅ์ฑ์
๋๋ค.
AlphaGo๋ ์ด๊ธฐ์๋ ํจ๋ฐฐ๋ฅผ ๊ฒช์์ผ๋ ๊ฐ์ ์๋๊ฐ ํ์ ์ถ์ข
์ ๋ถํํด ์ธ๊ณ ์ต๊ณ ์์ค์ ์ด๋ฅด๋ ๋๋ฐ์. ์ด์ ๋ ์ญ์ผ๋ก AI์ ๋ฐ๋์ ๋ฐ๋ผ ํ๋ ์ ์๊ฐ ์๊ฒผ์ ์ ๋๋ผ๊ณ ํฉ๋๋ค. ์คํฌ์ธ ๋ํ์ ์๋ก์ด ์ฐธ๊ฐ ๋ถ๋ฌธ์ด ์๊ธฐ๋ ๋ ์ด ์ฌ๊น์? ๐ค
|
|
|
: ์๋ถ๋ค๋น์ TII๊ฐ โFalconMamba 7Bโ๋ผ๋ ์๋ก์ด ๊ฒฝ๋ํ ๋ํ ์ธ์ด ๋ชจ๋ธ(sLLM)์ ๊ณต๊ฐํ์ต๋๋ค. ์ด ๋ชจ๋ธ์ ๊ธฐ์กด์ Transformer ๊ตฌ์กฐ๋ฅผ ๋ฒ์ด๋ ์ํ ๊ณต๊ฐ ์ธ์ด ๋ชจ๋ธ(State Space Language Model, SSLM)๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ๋ Mamba๋ฅผ ์ ์ฉํ๋ค๋ ์ ์์ ์๋ฏธ ์์ต๋๋ค. TII๋ FalconMamba 7B๊ฐ ํ๊น
ํ์ด์ค ๋ฒค์น๋งํฌ์์ Meta์ Llama 3.1 8B ๋ฐ Mistral 7B๋ฅผ ๋ฅ๊ฐํ๋ค๊ณ ๋ฐํ์ต๋๋ค.
์๋์ผ๋ก AI ์ฐ๊ตฌ ๋
ผ๋ฌธ์ ์จ์ฃผ๋ AI
: ์๋์ผ๋ก AI ์ฐ๊ตฌ ๋
ผ๋ฌธ์ ์จ์ฃผ๋ AI๊ฐ ๊ฐ๋ฐ๋์ด ํ์ ์
๋๋ค. Transformer ๋
ผ๋ฌธ ์ ์ ์ค ํ ๋ช
์ด ์ฐฝ์
ํ Sakana.ai ์์๋ ์ต๊ทผ <The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery>๋ฅผ ๊ณต๊ฐํ๋๋ฐ์. ์ด ์์คํ
์ ์ฐ๊ตฌ ์์ด๋์ด ์์ฑ๋ถํฐ ์ฝ๋ ์์ฑ, ์คํ ์คํ, ๊ฒฐ๊ณผ ์์ฝ ๋ฐ ๋ฐํ๊น์ง ๋ชจ๋ ์ฐ๊ตฌ ์ฃผ๊ธฐ๋ฅผ ์๋ํํฉ๋๋ค. ํ ํธ์ ๋
ผ๋ฌธ์ ์ ์ํ๋ ๋ฐ ์ฝ $15์ ๋น์ฉ๋ฐ์ ๋ค์ง ์์ต๋๋ค.
์ผ๋ก ๋จธ์คํฌ์ xAI, Grok-2 ๊ณต๊ฐ
: ์ผ๋ก ๋จธ์คํฌ์ AI ์คํํธ์
xAI๊ฐ ์ต์ ์ธ์ด ๋ชจ๋ธ 'Grok-2'์ 'Grok-2 Mini'๋ฅผ ๋ฒ ํ ๋ฒ์ ์ผ๋ก ๊ณต๊ฐํ์ต๋๋ค. 'Grok-2'๋ ๋ฉํฐ๋ชจ๋ฌ AI ์ด์์คํดํธ๋ก์ Claude 3.5 Sonnet๊ณผ GPT-4 Turbo๋ฅผ ๋ฅ๊ฐํ๋ ์ฑ๋ฅ์ ์
์ฆํ์ต๋๋ค. ํนํ, ๋ค์ํ ํ๋ฌธ์ ๋ฒค์น๋งํฌ์์ ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์์ผ๋ฉฐ, ์๊ฐ์ ์ํ ์ถ๋ก ๊ณผ ๋ฌธ์ ๊ธฐ๋ฐ ์ง๋ฌธ ์๋ต์์ ์ต๊ณ ์ฑ๋ฅ์ ๊ธฐ๋กํ๋๋ฐ์. ํ์ฌ ์ด ๋ชจ๋ธ๋ค์ X ํ๋ซํผ์์ ๋ฒ ํ ๋ฒ์ ์ผ๋ก ์ ๊ณต๋๋ฉฐ, ๊ณง ์ํฐํ๋ผ์ด์ฆ API๋ฅผ ํตํด ์ด์ฉ ๊ฐ๋ฅํ ์์ ์
๋๋ค.
|
|
|
The Data-centric AI company
AI ๋ฐ์ดํฐ์ ๊ธฐ์ค์ ๋ง๋ญ๋๋ค
|
|
|
๐ ์ฌ์
๋ฐ ์ ํด ๋ฌธ์ contact@selectstar.ai
๐จ ์ฝํ
์ธ ๋ฐ ํ์ฌ ๋ฌธ์ marketing@selectstar.ai
|
|
|
|
|