All in One AI 데이터 솔루션 All in One
AI DATA SOLUTION-
SELECTSTAR |
|
|
그냥 이해를 돕기 위한 사진
GAN을 심하게 보는 AI도 있습니다.
생성적 대립쌍 네트워크(Generative Adversarial Network)를 의미하는 GAN은 현 Deepmind의 Ian Goodfellow가 2014년에 NIPS 학회를 통해 논문으로 발표한 딥러닝 프레임워크로 보통 한가지의 신경망을 가진 AI모델과 다르게 생성자(Generator ; 실제 데이터를 학습하여 거짓 데이터 생성)와 감별자(Discriminator ; 생성자의 데이터의 진위여부 판별 학습)의 두 신경망 모델의 대립적 경쟁을 통해 실제에 가까운 거짓 데이터를 생성 생성하는 딥러닝 알고리듬을 의미합니다. 생성자와 판별자는 서로 속이고 판별하는 싸움을 수없이 반복하면서 모델은 더욱 정교해지는 것이죠.
|
|
|
Drag & Change, DragGAN
이미지 생성 모델은 발전에 발전을 거듭하여 어느새 대강 보아서는 사람이 그린 것인지, 인공지능이 생성한 것인지 어려울 정도가 되었습니다. 하지만 아직도 개선할 여지는 남아 있습니다. 세밀한 표현이 어색하기도 하고, 입력 프롬프트가 원하는 만큼 충분히 구현되지 않기도 합니다. 이를 위해 ControlNet 등 구도를 제어하는 모델이 등장하기도 했죠.
그렇다면 이미지를 새로 생성하는 것이 아니라 시선의 방향을 바꾼다던지, 무뚝뚝한 얼굴을 웃는 얼굴로 바꾸는 것처럼 오리지널 이미지를 수정하는건 어떨까요? 지난 5월 말 공개된 DragGAN은 단순히 이미지를 편집하는 것이 아닌, 편집된 부분에 맞춰 다른 부분들을 자연스럽게 변형하는 것까지 손쉽게 구현할 수 있음을 보여주었습니다.
|
|
|
위의 사자 이미지를 살펴볼까요? 코와 입을 선택(빨간색 점)하고 원하는 위치(파란색 점)까지 드레그만하면 사자가 자연스럽게 입을 벌리는 이미지가 생성됩니다. 두 번째로 코끝을 잡고 오른쪽으로 드레그하면 코끝을 따라 시선도 이동합니다. 이미지 속 객체를 마음대로 조종해서 자연스러운 결과물을 생성할 수 있다니, 무엇보다 드레그 한번으로 가능하다니 매력적이지 않나요? 이번호에서는 이 흥미로운 DragGAN의 원리를 알아보도록 하겠습니다.
|
|
|
DragGAN의 원리
여러분들에게 사자 사진을 주고 입 벌린 사자를 새로 그려보라는 요청을 받는다면 어떻게 하실 건가요? 우선 머릿속에서 사자가 입벌린 모습을 상상하고 자신의 창의력에 따라 그릴수 밖에 없겠죠. 이번에는 닫힌 문 사진이 주고 그 문이 열렸을 때 어떤 모습일지 그려보라고 한다면? 문 뒤의 상황을 알수가 없기 때문에 이 작업은 완전한 창작의 영역이 될것입니다. 우리가 창의력으로 그림을 그리는 과정은 인공지능 모델에게는 바로 생성 과정입니다. 창작을 위해 가지고 있던 지식과 주어진 맥락을 함께 고려하는 것처럼 인공지능 모델도 마찬가지입니다. 좋은 이미지를 생성하기 위해서 사전에 맥락이 있는 정보들이 필요합니다. 그런데
DragGAN에게는 매번, 사전 맥락 정보도 없이 누구의 집인지도 모를 방문을 열었을 때의 모습을 그리라는 미션이 주어집니다. 처음 보는 이미지에 대해 그 이미지를 다른 각도에서 봤을 때나 이미지 속 객체를 변화시켜야 는데 문제는 이러한 상황을 연습할 만한 학습 데이터가 없기 때문에 학습에 필요한 데이터마저도 생성해야 합니다.
DragGAN은 이름에서 알 수 있듯이 GAN을 기반으로 만들어졌습니다. 더 구체적으로는 StyleGAN을 활용했는데요. StyleGAN은 한 이미지 내에 담긴 여러 스타일(특성)을 추출하여, 그 스타일에만 영향을 끼칠 수 있도록 설계했습니다. 이렇게 특정 스타일을 원하는 이미지에 반영하는 것을 Style Transfer(스타일 전이)이라고 하며, StyleGAN은 이 분야에서 뛰어난 성능을 보이는 모델 중 하나입니다. 이 StyleGAN이 바로 DragGAN의 학습 데이터를 만들어 주는 모델입니다. |
|
|
DragGAN의 작동 원리는 크게 두 가지입니다. 첫 번째는 움직임을 예측하는 Motion Supervision 단계, 두 번째는 움직이는 점들을 추적하는 Point Tracking 단계입니다.
Motion Supervision 과정에서는 우선 핸들 포인트(시작점)에서 타깃 포인트(목표점)까지 가는 길을 많은 단계로 나눕니다. 그중 한 단계 넘어갈 때마다 StyleGAN이 만든 특성맵(Feature Map) 예측을 목표로 합니다. 이때 특성맵이란, 이미지가 가진 특징들을 압축적으로 표현한 것으로 이해하시면 됩니다. 이 과정에서 StyleGAN은 이미지 속 객체가 자연스럽게 이동한 모습을 생성하게 됩니다.
Point Tracking 단계는 생성된 이미지 속에서 이동된 포인트를 다시 예측하는 과정입니다. 이 과정에서도 StyleGAN이 생성한 특성맵을 활용하는데요. 기존 핸들 포인트의 주변에서 점들 중, 기존 핸들 포인트의 특성맵과 가장 유사한 이미지 특성맵을 갖는 포인트를 찾습니다. 그리고 이 지점이 다시 새로운 핸들 포인트가 되고, 타깃 포인트에 도착할 때까지 이 두 과정이 반복됩니다.
DragGAN의 특징은, 다른 모델을 활용하지 않고 오직 GAN 모델로만 문제를 해결했다는 것입니다. 연구진들에 따르면 다른 모델을 사용하게 되면 오류가 누적되어 학습 성능이 저하된다고 합니다.
DragGAN이 주는 효용이 많습니다. 이미지를 자연스럽게 변형하기 때문에 활용도도 높을 것으로 보이고 무엇보다 GAN 의 재등장으로 새로운 문제를 해결했다는 데 큰 의의를 둘 수 있습니다. 이미지 생성 모델이 부흥하면서 Diffusion이 주목받고, GAN은 잠시 주춤하는 것처럼 보였는데 여전히 건재하다는 사실을 보여주었기 때문입니다.
DragGAN은 학계에서도 주목받고 있는만큼 앞으로도 창작의 영역에서 딥러닝이 활용될 분야는 무궁무진해보입니다. AI의 발전이 가져올 부정적인 부분들도 분명 간과할 수는 없지만 아직은 밝은 미래를 더 많이 이야기 하고 싶습니다. |
|
|
셀렉트스타가 야심차게 준비한
고품격(?) AI 토크쇼(케이스)
혁주와 찬수!
지난주 여러분이
보내주신 정렬(?)적인 성원과 호응에
완벽하게 부응하는 콘텐츠로
이번주 그 2 번째 만담을 이어갑니다!
이번주에는
지난 3월부터 방문 예고편을
글로벌 스케일로 요란하게 때린바 있는
샘 알트만을 놓고 맛깔스런 만담이 펼쳐집니다.
*
게시판에 좋은 피드벡주신 분들께는 커피쿠폰을 드립니다.
여러분의 많은 참여 기다립니다!
|
|
|
뉴스레터 게시판 BETA OPEN EVENT → → |
|
|
매주 AI 소식을 전해드리면서
반갑게 메일을 열어보시는
5,000 여 분의 목소리도 궁금했었습니다.
이제, 일방이 아닌 구독자 여러분과
양방향으로 Interactive하게 소통하고 싶습니다.
여러분들의 다양한 의견들을 기다리겠습니다.
게시판 응원 이벤트는
계속됩니다!
좋은 의견주신 분들께는
커피쿠폰을 드립니다.
여러분의 많은 참여 기다릴께요!
|
|
|
AI 관심있는 누구나! 와서 노다지를 캐가세요!
- 직군, 나이에 상관없이 참여할 수 있는 오픈 모임입니다.
- AI와 AI 도입, AI 비즈니스, 사업개발에 대한 다양한 프로그램을 운영하고 있는 AI 중심의 커뮤니티입니다.
- 신사업팀, 사업개발팀, 변화혁신팀 등 회사 내에서 Digital Transformation을 위해 AI 도입을 고민하는 분들이 모여있는 곳입니다.
- 최신 정보와 기술, 작업 노하우, AI 모델 개발을 위한 플랫폼 서치, 전략 등에 대한 고민, 질문, 다양한 경험 등을 자유롭게 나누고 자기만의 값진 노다지를 캐가십시오!
|
|
|
AI모델링을 위한
데이터셋이 필요하신가요?
그 막막한 첫걸음
저희 셀렉트스타를 믿고
내딛어 보십시오!
- 타견적대비 더많은 혜택
- 1:1 AI 멘토링 지원
- 최고 투자자들의 '투자 검토'
- 투자, 법률, 특허관련 특강 기회
* 타사 견적을 제시하시면
그보다 유리한 조건으로
진행해드립니다!
|
|
|
Weekly AI Issues → →
美대학가, ‘소크라테스식’ 구술시험 도입
미국 대학에서 챗GPT 등 생성형 AI(인공지능)를 악용한 시험 부정행위가 늘자, 이를 막기 위한 원초적 시험 방식이 각광받고 있습니다. 바로 2400여 년 전 고대 그리스 철학자들의 토론 문화에서 유래한 구술 시험 방식입니다. 월스트리트저널은 “단순한 지식 습득과 평가가 아닌 ‘왜’와 ‘어떻게’에 집중하는 구술 시험은 교수와 학생이 학문적으로 교류한다는 느낌을 준다”고 분석했습니다. |
|
|
네이버 하이퍼클로바X 8월 말 출시 예정
네이버가 8월 말 자체 초거대 인공지능(AI) ‘하이퍼클로바X’를 출시할 예정입니다. 잘못된 내용을 진실처럼 전달하는 언어 모델의 ‘할루시네이션(환각)’ 문제를 정제된 지식인(지식iN) 데이터를 활용해 줄였고, 한국어 학습량도 오픈AI에 비해 6,500배나 되는 것으로 전해집니다. |
|
|
샘 알트만, 10년 안에 ‘초지능’ 생겨날 위험
이스라엘을 방문한 오픈 AI CEO 샘 알트만이 "인공지능 분야에 당장 무거운 규제를 하거나, 혁신을 늦추는 것은 실수라고 생각한다"고 말했습니다. 하지만 그는 앞으로 10년 안에 사회 필요에 부합하지 않는 '초지능'(superintelligence, 인간의 지능을 초월하는 인공지능)이 생겨날 위험을 언급하면서, ‘인공지능을 규제하는 국제기구가 필요하다’는 기존 입장을 재차 강조하기도 했습니다. |
|
|
샘 알트만의 특별한 인연
이번 주 금요일(6/9) 오픈 AI CEO 샘 알트만이 한국을 방문합니다. 이번 방한은 캐나다, 브라질, 스페인, 영국, 일본, 이스라엘, 호주 등 17개국 17개 도시를 찾는 월드 투어 행사의 일환인데요, 당일 하루 일정으로 서울을 찾는 알트만은 소프트벤처뱅크스와 오픈AI가 공동 주최하는 공개 대담에 참여할 예정입니다. 샘 알트먼은 오픈 AI 창업 전 와이콤비네이터 인턴시절, 소프트벤처뱅크스 이준표 대표와 스타트업에 대한 투자 의견을 주고 받기도 했다고 합니다. |
|
|
Subscribe → →
한 주간의 AI 뉴스들을 큐레이션하고 AI HOT TOPIC과 ISSUE들을 분석한 기사들을 뉴스레터로 매주 한 번씩 발송해드립니다.
6,000 여명의 구독자들과 함께 하십시오!
요즘 AI 트렌드는 망설이다보면 따라 잡을 수 없습니다! |
|
|
*본 콘텐츠는 deep daiv. 와의 제휴로 구성 되었습니다.
|
|
|
|
|