ํ์์ ์์ ๊ด๋ จ ์ฐ๊ตฌ์ ํฌ์๊ฐ ๊ฐ์ฅ ๋๊ท๋ชจ๋ก ์ผ์ด๋๋ ๋ถ์ผ๋ ์ธ ๋ฒ์งธ '์ข
๋ง๋ก ์ ์๋๋ฆฌ์ค'๋ก ๋ณด์
๋๋ค. ์ด์ฒ๋ผ ์ฌ๋์ ์ด์ํ๊ณ ์ง๋ฐฐํ๋ AI๋ฅผ ์ผ๋ คํด ์ธ๊ณต์ง๋ฅ์ด ์ธ๊ฐ์ด ์๋ํ ๋ฐฉ์์ผ๋ก ํ๋ํ๊ณ , ์์ธกํ์ง ๋ชปํ ์ํ์ ์ค์ด๋ ์ฐ๊ตฌ ๋ถ์ผ๋ฅผ AI ์ ๋ ฌ(AI alignment)์ด๋ผ๊ณ ํฉ๋๋ค.
์คํAI๋ ์ง๋ 7์ ์ด์ง๋ฅ ์ ๋ ฌ ๋ฌธ์ ํด๊ฒฐ์ ์ํด 'ํฅํ 4๋
๊ฐ ์ง๊ธ๊น์ง ํ๋ณดํ ์ปดํจํ
์์์ 20%๋ฅผ ์ฌ์ฉํ๊ฒ ๋ค'๊ณ ๋ฐํ์ผ๋ฉฐ, ์ผ๋ก ๋จธ์คํฌ๋ โ์ฐ์ฃผ ๋ณธ์ง์ ์ดํดํ๋ ์ธ๊ณต์ง๋ฅ์ ๋ง๋ค๊ฒ ๋คโ๋ฉฐ xAI๋ฅผ ์ฐฝ๋ฆฝํ์ต๋๋ค.
์ ๋ ฌ ๋ฌธ์ ์ ๋ํ ๋จธ์คํฌ์ ์๊ฐ์ ๋น์ ํธ์ํฐ ์คํ์ด์ค(์ด์ ๋ X ์คํ์ด์ค)๋ฅผ ํตํด ํ์ธํ ์ ์์ต๋๋ค. ๋จธ์คํฌ๋ "๋๋ ๋ฌธ์ ๋ฅผ ํผํ๊ธฐ ์ํด์, ํน์ ํ ๋๋์ ํ๋ก๊ทธ๋๋ฐํ๋ ค๊ณ ํ๋ค๋ฉด ๊ทธ๋ฅผ ๋ฐ์ ์์ผ ๋ฐ๋ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ์๋ ์๋คโ๊ณ ๋งํ์ต๋๋ค.
ํ๋ก๊ทธ๋๋ฐ์ ํตํด ๋๋์ ์ผ๋ก '์ ํ AI'๋ฅผ ์ ์ํ๋ค๋ฉด, ๊ทธ๋ฅผ ๋ค์ง์์ผ๋ก์จ ๊ฐ๋จํ '์
ํ AI'๋ฅผ ๋ง๋ค ์๋ ์๋ค๋ ๋งฅ๋ฝ์
๋๋ค. ๋จธ์คํฌ๋ ๋ง๋ฆฌ์ค ๊ฒ์์ ๋ฑ์ฅํ๋ ์ฐฉํ ๋ฃจ์ด์ง์ ๋์ ๋ฃจ์ด์ง ์๋ฅผ ๋ค๋ฉฐ ์ด๋ฅผ '์๋ฃจ์ด์ง ๋ฌธ์ '๋ผ๊ณ ์ค๋ช
ํ์ต๋๋ค.
"To avoid the inverse morality problem, if you try to program a specific morality, you can essentially invert it and get the opposite. This is sometimes called the 'Waluigi problem'.โ elon musk. X space.
์ด๋ ๋จธ์คํฌ๊ฐ ๋ฐํ AI๋ฅผ ๋ง๋๋ ๊ฐ์ฅ ์์ ํ ๋ฐฉ๋ฒ์ '์ต๋ํ ํธ๊ธฐ์ฌ ๋ง๊ณ ์ง์ค์ ์ถ๊ตฌํ๋ ์ธ๊ณต์ง๋ฅ'์
๋๋ค.
โ์ค์ ๋ก ์์ ํ ์ง์ค์ ๋๋ฌํ ์ง๋ ํ์คํ์ง ์์ต๋๋ค. ํ์ง๋ง ํญ์ ๊ทธ๊ฒ์ ์งํฅํ๊ณ ์ ํ๋ฉฐ, ๋น์ ์ด ์ฐธ์ด๋ผ๊ณ ์๊ฐํ๋ ๊ฒ๊ณผ ์ค์ ๋ก ์ฐธ์ธ ๊ฒ ์ฌ์ด์ ์ค์ฐจ๋ฅผ ์ต์ํํ๋ ค๊ณ ๋
ธ๋ ฅํฉ๋๋ค. ๊ถ๊ทน์ ์ผ๋ก ๋์ ์ด๋ก ์, ํธ๊ธฐ์ฌ ๋ง๊ณ ์ง์ค์ ์ธ ์ ๊ทผ์ด ์๋ง๋ ๊ฐ์ฅ ์์ ํ ๋ฐฉ๋ฒ์ผ ๊ฑฐ๋ผ๋ ์๊ฐ์
๋๋คโ
์ด๊ฒ์ด ๋จธ์คํฌ๊ฐ ์ฐ์ฃผ๋ฅผ ์ดํดํ๋ ค๋ ๊ถ๊ทน์ ์ธ ๋ชฉ์ ์
๋๋ค. xAI์์๋ ChatGPT์ฒ๋ผ ๋์ค์ ๋์์ผ๋ก ํ ์๋น์ค๋ฅผ ๊ณํ ์ค์ด๋ผ๊ณ ํ๋๋ฐ์, ๊ณง ๋์ฌ xAI์ ํ์ ์์์ด ๊ธฐ๋ค๋ ค์ง๋๋ค :) |