2. ์ฃผ์ ์์ ์ถ์ถ (Text Chunks โ Element Instances)
๊ฐ ํ
์คํธ ์กฐ๊ฐ์์ ์ฃผ์ ์์(๋
ธ๋)์ ๊ด๊ณ(์ฃ์ง)๋ฅผ ์ถ์ถํ๋ ๋จ๊ณ์
๋๋ค. LLM์ ๋ค์์ ์ถ์ถํ๋๋ฐ์:
- ๋
ธ๋(node): ์ฃผ์ ๊ฐ์ฒด(entity)๋ฅผ ์๋ฏธํ๋, ๋
๋ฆฝ์ ์ธ ์ ๋ณด ๋จ์ (์: ์ฌ๋, ์ฅ์, ๊ฐ๋
)
- ์ฃ์ง(edge): ๋ ๊ฐ์ฒด ๊ฐ์ ์ฐ๊ฒฐ ๊ด๊ณ(relationship) (์: "A๋ B์ ๋ถ๋ถ์ด๋ค")
์ถ์ถ ๊ณผ์ ์์๋ ๋๋ฉ์ธ์ ๋ง์ถ ํ๋กฌํํธ์ few-shot learning์ ํ์ฉํฉ๋๋ค. ์๋ฃ ๋ฐ์ดํฐ์์๋ ์ง๋ณ๊ณผ ์ฆ์, ๋ฒ๋ฅ ๋ฐ์ดํฐ์์๋ ํ๋ก์ ๋ฒ์ ๋
ผ์ ๊ฐ์ ๊ด๊ณ๋ฅผ ํ์งํ๋ ์์ด์ง์. ๋ํ, ๋ฐ๋ณต์ ์ธ '๊ธ๋ฆฌ๋(gleaning)' ๊ณผ์ ์ ํตํด ์ฒ์์๋ ๋๋ฝ๋ ์ํฐํฐ๋ ์ถ๊ฐ์ ์ผ๋ก ์ถ์ถํฉ๋๋ค.
3. ์์ ์์ฝ ์์ฑ (Element Instances โ Element Summaries)
์ถ์ถ๋ ๋
ธ๋์ ์ฃ์ง์ ์ ๋ณด๋ฅผ ์์ฝํ๋ ๋จ๊ณ์
๋๋ค. Graph RAG๋ ๋
ธ๋์ ํด๋น ๋
ธ๋ ๊ฐ์ ๊ด๊ณ๋ฅผ ์ค๋ช
ํ๋ ํ
์คํธ๋ฅผ ์์ฑํ๋ฉฐ, ์ด ํ
์คํธ๋ ๊ฐ๋ณ์ ์ผ๋ก๋ ์๋ฏธ๋ฅผ ๊ฐ์ง ์ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, "์ฌ์ ๊ฐ๋ฅ ์๋์ง" ๋
ธ๋์ ๋ํด "ํ์๊ด ๊ธฐ์ ๊ณผ ์ ์ฑ
์ ์ง์์ด ์ฃผ์ ํธ๋ ๋"๋ผ๋ ์์ฝ์ด ์์ฑ๋ฉ๋๋ค. ๋ํ, LLM์ ์ค๋ณต ์ฒ๋ฆฌ ๋ฌธ์ ๋ฅผ ๋ฐฉ์งํ๊ธฐ ์ํด ์ด๋ฆ ๋ณํ(์: "AI"์ "Artificial Intelligence")์ ์ฐ๊ฒฐํ๊ณ , ์ํธ ๊ด๋ จ์ฑ์ด ๋์ ์์๋ฅผ ๋ฌถ์ด ์ ๋ฆฌํฉ๋๋ค.
4. ๊ทธ๋ํ ์์ฑ ๋ฐ ์ปค๋ฎค๋ํฐ ๊ตฌ์ฑ (Element Summaries โ Graph Communities)
์์ฝ๋ ๋
ธ๋์ ์ฃ์ง๋ ๊ทธ๋ํ๋ก ์ฐ๊ฒฐ๋๋๋ฐ์. ๊ทธ๋ํ๋ ๋
ธ๋(๊ฐ์ฒด)์ ์ฃ์ง(๊ด๊ณ)๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ๋ฉฐ, Leiden ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํด ์๋ก ์ฐ๊ด๋ ๋
ธ๋ ๊ทธ๋ฃน(์ปค๋ฎค๋ํฐ)์ ํ์ฑํฉ๋๋ค.
์๋ฅผ ๋ค์ด, ๋ด์ค ๋ฐ์ดํฐ์์๋ "๊ธฐํ ๋ณํ" ์ปค๋ฎค๋ํฐ๊ฐ "์ฌ์ ๊ฐ๋ฅ ์๋์ง", "ํ์ ๋ฐฐ์ถ", "์ ์ฑ
๊ฐํ"๊ณผ ๊ฐ์ ๊ด๋ จ ์ฃผ์ ๋ฅผ ๋ฌถ์ ์ ์๋๋ฐ์. ์ด๋ ๊ฒ ์ปค๋ฎค๋ํฐ๋ฅผ ๊ณ์ธต์ ์ผ๋ก ๊ตฌ์ฑํ๋ฉด ๋ฐ์ดํฐ์ ๋ณต์กํ ๊ตฌ์กฐ๋ฅผ ํจ์จ์ ์ผ๋ก ๋ถ์ํ ์ ์๊ฒ ์ง์? ๐ฅ
5. ์ปค๋ฎค๋ํฐ ์์ฝ ์์ฑ (Graph Communities โ Community Summaries)
Leiden ์๊ณ ๋ฆฌ์ฆ์ ํตํด ํ์ฑ๋ ๊ฐ ์ปค๋ฎค๋ํฐ๋ LLM์ ํตํด ๋ณด๊ณ ์ ํ์์ผ๋ก ์์ฝํ๋ ๋จ๊ณ์
๋๋ค. ๊ฐ ์์ฝ์ ์ปค๋ฎค๋ํฐ ๋ด ์ฃผ์ ๋
ธ๋์ ์ฃ์ง์ ์ ๋ณด๋ฅผ ํฌํจํ๋๋ฐ์. ์ง๋ฌธ์ ๋ต๋ณํ๊ธฐ ์ํ ๋ฐ์ดํฐ ์ธ๋ฑ์ค๋ก์ ์ ์ฉํ ๋ฟ๋ง ์๋๋ผ, ์ง๋ฌธ์ด ์๋ ๊ฒฝ์ฐ์๋ ๋ฐ์ดํฐ์
์ ์ ์ฒด ๊ตฌ์กฐ์ ์๋ฏธ๋ฅผ ์ดํดํ๋ ๋ฐ ๋
๋ฆฝ์ ์ผ๋ก ํ์ฉ๋ ์ ์์ง์.
์ปค๋ฎค๋ํฐ ์์ฝ ์์ฑ ๋ฐฉ๋ฒ์ ๊ฐ๋จํ๊ฒ ์ดํด๋ณผ๊น์?
-
๋ฆฌํ(Leaf)-๋ ๋ฒจ ์ปค๋ฎค๋ํฐ ๊ฐ์ฅ ์ธ๋ถ์ ์ธ ์ปค๋ฎค๋ํฐ์ ์์ฝ์ ๊ฐ์ฒด(node), ๊ฐ์ฒด ๊ฐ์ ๊ด๊ณ(edge), ํต์ฌ์ ๋ถ๊ฐ์ ๋ณด(covariate)๋ฅผ ์ค์๋์ ๋ฐ๋ผ ์ ๋ ฌํ ๋ค LLM์ ๋ฌธ๋งฅ ์ฐฝ(context window)์ ์ถ๊ฐํฉ๋๋ค.
- ์์ ๋ ๋ฒจ ์ปค๋ฎค๋ํฐ
์์ ์ปค๋ฎค๋ํฐ๋ ๋ฆฌํ ๋ ๋ฒจ๊ณผ ๋์ผํ ๋ฐฉ์์ผ๋ก ์์ฝ์ ์ถ๊ฐํฉ๋๋ค. ๋ฌธ๋งฅ ์ฐฝ ์ ํ์ ์ด๊ณผํ ๊ฒฝ์ฐ, ํ์ ์ปค๋ฎค๋ํฐ ์์ฝ์ ์งง์ ํ
์คํธ๋ก ๋์ฒดํ๋ฉฐ ์ ๋ณด๋ฅผ ์ต๋ํ ์์ถํฉ๋๋ค.
6. ์๋ต ์์ฑ (Community Summaries โ Community Answers โ Global Answer)
์ง๋ฌธ์ด ์ฃผ์ด์ง๋ฉด, Graph RAG๋ ๊ด๋ จ ์ปค๋ฎค๋ํฐ ์์ฝ์ ๊ธฐ๋ฐ์ผ๋ก ์ค๊ฐ ์๋ต์ ์์ฑํฉ๋๋ค. ๊ฐ ์๋ต์ LLM์ ํตํด ์ ์ํ๋์ด ์ ์ฉ์ฑ(0~100) ๊ธฐ์ค์ผ๋ก ํ๊ฐ๋๋๋ฐ์. ๋๊ฐ์ฅ ๋์ ์ ์๋ฅผ ๋ฐ์ ์๋ต๋ถํฐ ์ฐจ๋ก๋ก ๊ฒฐํฉํด ์ต์ข
์๋ต์ ๋ง๋ญ๋๋ค. |