๐ฉบ ์์ฌ๋ AI๊ฐ ๋์ฒดํ ์ ์์๊น? 2025๋
7์ 1์ฃผ์ฐจ ์
๋ ํธ์คํ ๋ด์ค๋ ํฐ |
|
|
๐ฐ์๋ฃ ์ด์ง๋ฅ์ ํฅํ MS์ ์ฒซ๊ฑธ์ |
|
|
์ถ์ฒ: ๋ง์ดํฌ๋ก์ํํธ
AI ๊ฐ๋ฐ์ด ๋ณธ๊ฒฉ์ ์ผ๋ก ๋๋๋๊ธฐ ์์ํ๋ฉด์, โAI๊ฐ ์์ฌ๋ฅผ ๋์ฒดํ ๊น?โ๋ผ๋ ์ง๋ฌธ์ ํญ์ ์กด์ฌํ์ต๋๋ค. ํ์ง๋ง ๋ณธ์ง์ ๋จ์ ์ง์
๊ต์ฒด๊ฐ ์๋๋๋ค. ์ค์ ์ฐ๋ฆฌ๊ฐ ๋ต์ด ํ์ํ ์ง๋ฌธ์ ๋ฐ๋ก,
AI๊ฐ ์ค์ ์์ ํ๊ฒฝ์์ ์์ฌ๋ณด๋ค ๋ ์ ํํ๊ณ ํจ์จ์ ์ผ๋ก ์ง๋จ์ ๋ด๋ฆด ์ ์์๊น?
์
๋๋ค. ๋ง์ดํฌ๋ก์ํํธ AI ํ์ ์ต๊ทผ ์ด ์ง๋ฌธ์ ๋ํด ํ์คํ๊ฒ โ์"๋ผ๊ณ ๋๋ตํ๋๋ฐ์. ๊ทธ ์ค์ฌ์๋ ๋ ๊ฐ์ง ํต์ฌ ๊ธฐ์ ์ด ์์ต๋๋ค.
- SDBench (Sequential Diagnosis Benchmark)
- MAI-DxO (Microsoft AI Diagnostic Orchestrator)
๋ง์ดํฌ๋ก์ํํธ๋ SDBench์ MAI-DxO๋ฅผ ๊ฒฐํฉํด, ์ค์ ์ง๋ฃ์ฒ๋ผ ์ฌ๊ณ ํ๊ณ ํ๋จํ๋ AI ์ง๋จ ์์คํ
์ ๊ตฌ์ฑํ์ต๋๋ค. ์ด ์์คํ
์ ์ธ๊ฐ ์ ๋ฌธ๊ฐ๋ฅผ ๋ฅ๊ฐํ๋ ์ฑ๊ณผ๋ฅผ ๋ด๋ฉฐ, โ์ข์ ์๋ฏธ์ ์ด์ง๋ฅ*(narrow superintelligence)โ์ด ์ด๋ป๊ฒ ํ์คํ๋ ์ ์๋์ง๋ฅผ ๋ณด์ฌ์ฃผ๋ ์ฒซ ์คํ์ ๊ตฌํ์ด๋ผ๊ณ ๋ณผ ์ ์์ต๋๋ค.
*์ด์ง๋ฅ์ ์ธ๊ฐ ์ ๋ฌธ๊ฐ๋ฅผ ๋ฅ๊ฐํ๋ ๋ฌธ์ ํด๊ฒฐ ๋ฅ๋ ฅ์ ๊ฐ์ง AI๋ฅผ ๋ปํ๋ค.
|
|
|
SDBench: ์ง๋จ์ โ์ง์ง์ฒ๋ผโ ํ๊ฐํ๋ค |
|
|
์ต๊ทผ๊น์ง ๋๋ถ๋ถ์ ์๋ฃ AI ์ฐ๊ตฌ๋ ๋ฏธ๊ตญ ์์ฌ ๋ฉดํ ์ํ์ด๋ ๋ค๋ถ์ผ ์ง์ ํ๊ฐ AI ๋ฒค์น๋งํฌ์ธ MMLU ๊ฐ์ ๊ฐ๊ด์ ๊ธฐ๋ฐ ์ ์ (static) ๋ฒค์น๋งํฌ์ ์์กดํ์ต๋๋ค. ์ด๋ฌํ ๋ฌธ์ ๋ ๊ธฐ์ต ๊ธฐ๋ฐ ์ง์์ ์ ๋ฆฌํ์ง๋ง, ์ง์ง ์์์์ ๋ฒ์ด์ง๋ ์์ฐจ์ ์ถ๋ก ๊ณผ์ ๊ณผ๋ ๊ฑฐ๋ฆฌ๊ฐ ๋ฉ์ง์.
์ค์ ์ง๋จ์ ์ ํด์ง ๋ต๋ณ์ด ์๋ ๊ฒ ์๋๋ผ, ํ์์ ์ด๊ธฐ ์ฆ์์์ ์ถ๋ฐํด,
- ์ง๋ฌธ์ ๋์ง๊ณ ,
- ๊ฒ์ฌ ๊ฒฐ๊ณผ๋ฅผ ๋ฐ๊ณ ,
- ์ ๋ณด๋ฅผ ์
๋ฐ์ดํธํ๋ฉฐ
- ์ ์ง์ ์ผ๋ก ์ง๋จ์ ๋๋ฌํ๋,
๋น์ ํ์ ์ถ๋ก ๊ณผ์ ์ธ๋ฐ์. ์ด ํ์ค์ ๋ฐ์ํ ๋ฒค์น๋งํฌ๊ฐ ๋ฐ๋ก SDBench์
๋๋ค. ๋ง์ดํฌ๋ก์ํํธ๋ ์ธ๊ณ ์ต๊ณ ์ํ ์ ๋์ธ New England Journal of Medicine(NEJM)์ ์ฌ๋ก 304๊ฑด์ ๋ฐํ์ผ๋ก, ๋จ๊ณ์ ์ง๋จ ์๋ฎฌ๋ ์ด์
๋ฒค์น๋งํฌ๋ฅผ ๊ตฌ์ถํ์ต๋๋ค.
SDBench๋ ๊ธฐ์กด๊ณผ ๋ฌ๋ฆฌ ๋ค์๊ณผ ๊ฐ์ ๊ตฌ์กฐ๋ฅผ ๊ฐ๋๋ฐ์:
- ์ ๋ณด๋ ์ง๋ฌธํ๊ฑฐ๋ ๊ฒ์ฌ๋ฅผ ์์ฒญํด์ผ๋ง ์ป์ ์ ์๋ค.
- ๋ชจ๋ ๊ฒ์ฌ์ ๋ฐฉ๋ฌธ์๋ ๊ฐ์์ ๋น์ฉ์ด ๋ถ๊ณผ๋๋ค.
- ์ง๋จ ์ ํ๋๋ฟ ์๋๋ผ โ๋น์ฉ ํจ์จ์ฑโ๋ ํ๊ฐ๋๋ค.
์ค์ ์์์ฒ๋ผ, AI์ ์์ฌ ๋ชจ๋ ์ ํ๋ ์ ๋ณด ์์์ ๋ฅ๋์ ์ผ๋ก ์ถ๋ก , ์ ํ, ํ๋จ์ ํด์ผ ํ์ต๋๋ค. ์ด๋ฌํ ์๋ฎฌ๋ ์ด์
์ ๋ด๋ถ์ ์ผ๋ก ์ธ ๊ฐ์ AI ์์ด์ ํธ(Gatekeeper, Diagnostic, Judge)๊ฐ ์ํธ์์ฉํ๋ฉด์ ์ด๋ฃจ์ด์ง๋๋ฐ์. ๊ฐ์ ์ด๋ค ์ญํ ์ ํ๋ ๊ฑธ๊น์?
|
|
|
SDBench ๋ฒค์น๋งํฌ์์์ ์์ด์ ํธ ๊ธฐ๋ฐ ์ค์ผ์คํธ๋ ์ด์
๊ตฌ์กฐ. ์ถ์ฒ: ๋ง์ดํฌ๋ก์ํํธ |
|
|
- Gatekeeper agent: ์ง๋ฃ ์ํฉ์ ์กฐ์จํ๋ ์ค์ฌ์๋ก์, Diagnostic agent์ ์ง๋ฌธ์ด๋ ๊ฒ์ฌ ์์ฒญ์ ๋ํด ์ด๋ค ์ ๋ณด๋ฅผ ์ผ๋ง๋งํผ ์ ๊ณตํ ์ง๋ฅผ ๊ฒฐ์
- Diagnostic agent: ์ค์ ๋ก ์ง๋จ ์ถ๋ก ์ ์ํํ๋ฉฐ, MAI-DxO ์์คํ
์ด ์ฐ๊ฒฐ๋๋ ์ฃผ์ ์คํ ์ฃผ์ฒด
- Judge agent: ์ต์ข
์ง๋จ ๊ฒฐ๊ณผ๊ฐ NEJM ์ฌ๋ก์ ์ ๋ต๊ณผ ์ผ์นํ๋์ง๋ฅผ ํ๊ฐ
SDBench๋ ์ ๋ต ๋น๊ต์ ๋๋ถ์ด, ์ ๋ณด ์ ๊ทผ์ ์ ์ฝ, ์ถ๋ก ์ ๊ณผ์ ์ฑ, ์ฑ์ ์ ๊ณต์ ์ฑ์ ๋ชจ๋ ๋ฐ์ํ ์์์ ํ๊ฐ ํ๋ ์์ํฌ๋ก ์๋ํฉ๋๋ค. |
|
|
MAI-DxO: ์ค์ผ์คํธ๋ ์ด์
๊ธฐ๋ฐ ์๋ฃ AI์ ๋ฑ์ฅ |
|
|
SDBench ์์์ ์๋ํ๋ MAI-DxO๋ ๋จ์ผ ๋ชจ๋ธ์ด ์๋๋๋ค. ๋ง์ดํฌ๋ก์ํํธ๋ ํ๋์ ์ธ์ด ๋ชจ๋ธ์ ๋ค์ฏ ๋ช
์ ๊ฐ์ ์์ฌ ์ญํ ๋ก ๋ถ๋ฆฌํด ํ์
์ ์ถ๋ก ์ ์ํํ๊ฒ ํ๋๋ฐ์. ๐ฉบ
๊ฐ ์ญํ ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
- Dr. Hypothesis: ์ง๋จ ๊ฐ์ค์ ์ ์งํ๋ฉฐ ํ๋ฅ ์
๋ฐ์ดํธ
- Dr. Test-Chooser: ์ ๋ณด์ด๋ ์ต๋ํํ๋ ๊ฒ์ฌ ์ ํ
- Dr. Challenger: ์ง๋จ ํธํฅ์ ๊ฐ์งํ๊ณ ๋ฐ๋ก ์ ์
- Dr. Stewardship: ๊ฒ์ฌ ๋น์ฉ๊ณผ ์์ ํจ์จ์ฑ ๊ด๋ฆฌ
- Dr. Checklist: ์ผ๊ด์ฑ๊ณผ ํฌ๋งท ๊ฒ์ฆ
์ด ์ญํ ๋ค์ ๋งค ์ง๋จ ๋จ๊ณ๋ง๋ค ๋ด๋ถ โํ์โ๋ฅผ ๊ฑฐ์ณ ๋ค์ ํ๋์ ๊ฒฐ์ ํฉ๋๋ค. MAI-DxO๋ ๋จ์ํ ํ๋กฌํํธ ์ฒด์ธ์ด ์๋, ์กฐ์จ๋ ๋ฉํฐ์์ด์ ํธ ์์คํ
, ์ฆ ์ง๋ฅ ์ค๊ณ์ ์งํ๋ ํํ๋ผ๊ณ ๋ณผ ์ ์์ง์. |
|
|
MAI-DxO์ ๊ฐ์. ์ถ์ฒ: ๋ง์ดํฌ๋ก์ํํธ |
|
|
SDBench์์์ MAI-DxO ์ฑ๊ณผ๋ ์ด๋จ๊น์? |
|
|
AI ์ง๋จ ์์คํ
๋ค์ ์ ํ๋์ ํ๊ท ๊ฒ์ฌ ๋น์ฉ ๋น๊ต. ์ถ์ฒ: ๋ง์ดํฌ๋ก์ํํธ |
|
|
๊ทธ๋ํ ์ผ์ชฝ ์์ ์์นํ ์๋ก ๋์ ์ง๋จ ์ ํ๋์ ๋ฎ์ ๋น์ฉ์ ์๋ฏธํฉ๋๋ค. ๋ถ์ [+] ํ์๋ ์ค์ ์์ฌ๋ค์ ํ๊ท ์ฑ๋ฅ, ์ ์ ์ ๋จ์ผ LLM๋ค์ ์ฑ๋ฅ ๋ฒ์๋ฅผ ๋ํ๋ด์ง์. ๋ณด๋ผ์ ์ ์ MAI-DxO์ ๋ค์ํ ์ค์ ์ด ๋ฌ์ฑํ ๋น์ฉ๊ณผ ์ ํ๋ ๊ท ํ์ ๋ณด์ฌ์ค๋๋ค. ๋ง์ดํฌ๋ก์ํํธ์ MAI-DxO ์์คํ
์ ์ ๋ฌธ๊ฐ ํ๊ท ์ 4๋ฐฐ ์ด์์ ์ ํ๋์, ๋น์ฉ๊ณผ ํจ์จ์ฑ ๋ฉด์์๋ ๊ฒฝ์์๋๋ฅผ ๋ฅ๊ฐํ๋ ๋ชจ์ต์
๋๋ค.
ํ์ง๋ง ์ด ์ฐ๊ตฌ๋ ์์ง ์ด๊ธฐ ๋จ๊ณ์ ์คํ์ผ๋ก, ๋ถ๋ช
ํ ํ๊ณ๊ฐ ์กด์ฌํฉ๋๋ค. ์ฌ์ฉ๋ NEJM ์ฌ๋ก๋ค์ ์ผ๋ฐ ํ์๋ณด๋ค๋ ๋ณต์กํ๊ณ ํน์ํ ๊ต์ก์ฉ ์ผ์ด์ค๋ค์ด๋ฉฐ, ๋น๊ต ๋์์ธ ์์ฌ๋ค๋ ํ์ด๋ ์๋ฃ ์์ด ์ ํ๋ ์๊ฐ์ ํผ์ ๋ณต์กํ ์ง๋จ์ ์ํํด์ผ ํ์ต๋๋ค. ํ์ค์์๋ ๋๋ฃ์ ์๋ดํ๊ฑฐ๋ ์ ๋ณด๋ฅผ ๊ฒ์ํ๋ ๋ฑ ์ข๋ ๋ค์ํ ๋์์ ๋ฐ์ ์ ์๊ธฐ ๋๋ฌธ์ ์ด๋ฒ ์คํ ๊ฒฐ๊ณผ๋ AI์ ์์ ํ ๊ณต์ ํ ๋น๊ต๋ผ ๋ณด๊ธฐ๋ ์ด๋ ต์ง์. ๋ํ MAI-DxO๊ฐ ๋ณด์ฌ์ค โ๋น์ฉ ํจ์จ์ฑโ์ ์ค์ ์๋ฃ ํ์ฅ์ ๋ค์ธต์ ์ธ ๋น์ฉ ๊ตฌ์กฐ์๋ ์ฐจ์ด๊ฐ ์์ ์ ์์ต๋๋ค. |
|
|
๋ง์ดํฌ๋ก์ํํธ AI์ CEO ๋ฌด์คํํ ์๋ ์ด๋ง(Mustafa Suleyman)์ '์ด๋ฒ ์ฐ๊ตฌ๋ ๊ธธ๊ณ ๋ ํฅ๋ฏธ๋ก์ด ์ฌ์ ์ ์ฒซ๊ฑธ์์ ๋ถ๊ณผํ๋ค'๊ณ ๋งํฉ๋๋ค. |
|
|
์ด์ง๋ฅ์ ๊ฐ์๊ธฐ ๋ฑ์ฅํ์ง ์์ต๋๋ค. ์ข์ ๋๋ฉ์ธ์์ ์ ๋ฌธ๊ฐ๋ฅผ ๋ฅ๊ฐํ๋ ์์คํ
์ด ์ถ์ ๋๋ฉฐ ์ถํํ์ง์. MAI-DxO๋ ์์ง ์ค์ ์๋ฃ ํ์ฅ์์ ๋ฐ๋ก ์ ์ฉ๋ ์ ์๋ ์์คํ
์ ์๋์ง๋ง, ์ธ๊ฐ์ฒ๋ผ ์ง๋ฌธํ๊ณ , ํ๋จํ๊ณ , ์ค์๋ฅผ ์ค์ด๋ฉฐ, ๋น์ฉ๊น์ง ๊ณ ๋ คํ๋ AI๊ฐ ์ด๋ป๊ฒ ์ค๊ณ๋ ์ ์๋์ง๋ฅผ ์ฒ์์ผ๋ก ๋ณด์ฌ์ค ์ฌ๋ก์
๋๋ค. ์ด์ง๋ฅ์ด ๊ทธ๋ ๊ฒ ๋ฉ์ง ์๊ฒ ๋๊ปด์ง๋๋ค. |
|
|
The Data-centric AI company
AI ๋ฐ์ดํฐ์ ๊ธฐ์ค์ ๋ง๋ญ๋๋ค
|
|
|
๐ ์ฌ์
๋ฐ ์ ํด ๋ฌธ์ contact@selectstar.ai
๐จ ์ฝํ
์ธ ๋ฐ ํ์ฌ ๋ฌธ์ marketing@selectstar.ai
|
|
|
|
|