All in One AI 데이터 솔루션 All in One
AI DATA SOLUTION-
SELECTSTAR |
|
|
내전과 학살... 지금은
'르완다' 하면 다른 아프리카 나라들의 '야생동물', '사파리' 같이 흔한 이미지들 대신 '내전', 학살' 같은 무서운(?) 이미지가 먼저 떠오르게 되죠.
그런데 자극적인 이슈만 부각하는 뉴스의 속성상 지금의 르완다에 대한 뉴스는 거의 들어보지 못하던 차에 최근 'RWANDA'라는 낯선 지명을 AI 뉴스에서 만나게 되었습니다. |
|
|
ICLR 2023 개최지, 르완다 카길리 컨벤션 |
|
|
ICLR 2023 in RWANDA
AI/ML 글로벌 학회로, 구글, 메타 등 top-tier 들의 활발한 논문 발표로 학회의 권위를 인정받고 있는 ICLR(International Conference on Learning Representations)은 다양성을 추구하는 걸로 유명한데, AI의 대중화를 목적으로 다소 독특한 지역에서 개최되곤 했습니다. 2020년에도 아프리카 에티오피아의 수도 아디스아바바에서 개최 예정이었으나 코로나로 취소된바 있는데 올해 11번째 회의는 아프리카 르완다 수도 카길리에서 개최되어 지난 5일 막을 내렸습니다.
|
|
|
ICLR 2023 논문 톺아보기
그럼, ICLR 2023에서 어떤 논문들이 발표되었는지 소개 해볼까합니다. Top-tier 학회인 만큼 ICLR에서 제시된 논문들을 보면, 어느 정도 AI 발전의 방향성을 짚어볼 수 있는데, Zeta Alpha라는 AI 연구 분석 업체에서 선정한 Top 10 논문 중 3 건을 엄선하여 소개 해드리겠습니다. |
|
|
Dino v2
메타(Meta)에서는 2021년 4월 말, 자기지도 학습(Self-supervised Learning) 방식의 컴퓨터 비전 모델 Dino를 소개했었습니다. 자기지도 학습이란 별도의 훈련 레이블이 제공되지 않고, 스스로 정답을 만들고 예측하며 학습하는 방식입니다. Dino는 데이터셋에서 무작위로 이미지를 추출한 후, 이미지를 서로 다른 두 그룹으로 나누고, 두 그룹 간의 비교를 통해 모델을 학습합니다. 이미지를 임베딩한 뒤, 이미지 간의 유사도를 계산하는 방식으로요. 이때 학습에 활용된 모델로 ViT가 활용되었습니다.
그리고 2년만에 두 번째 버전을 공개했는데요. Dino v2는 총 1억 4200만 개의 대규모 이미지 데이터셋을 개발하여 학습하였습니다. 그리고 학습 알고리즘을 개선하고, 안정화하여 메모리 사용량을 획기적으로 줄일 수 있스빈다.
가장 큰 변화는 모델이 가벼워졌다는 것입니다. 보통 많은 데이터로 학습하게 되면 자연스레 모델의 크기도 커지게 됩니다. 하지만 Dino v2에서는 Distillation(증류)을 통해 모델을 경량화하였습니다. |
|
|
결과적으로 깊이 추정(Depth Estimation), 의미적 분할(Semantic Segmentation) 등에서 뛰어난 성능을 보입니다. 심지어 이미지뿐만 아니라 영상에서도 좋은 결과를 보이는 특징이 있습니다. 더 구체적인 학습 방법이 궁금하신 분들은 Meta의 공식 블로그를 참고해보시기 바랍니다. -블로그 링크 |
|
|
Diffusion 모델에서 생성된 합성 데이터는 ImageNet 분류 성능을 향상시킨다
구글 브레인 연구진은 최근 주목받고 있는 Diffusion 모델을 이용하여 데이터셋을 증강하였습니다. 기존의 널리 활용되는 데이터 증강(Augmentation) 방식은 뒤집거나, 일부를 잘라내거나 하는 단순한 작업이 많았는데요. 이런 작업은 데이터셋을 늘리는 데 도움이 되기는 하지만 완전히 새로운 이미지를 만들어내지는 못합니다.
생성적 데이터 증강(Generative Data Augmentation)은 이런 증강 방식을 보완하여 이미지 합성(Synthesis)을 통해 클래스마다 새로운 이미지를 생성해내는 방식입니다. 대표적인 이미지 데이터셋 중 하나인 ImageNet 데이터를 보강하여 실험을 해보았더니, ResNet과 ViT 모델에서 모두 개선된 성능을 보였습니다. |
|
|
이미지간의 차이가 느껴지시나요? 사실 좌측과 우측 모두 Imagen이라는 Diffusion 기반 모델로 생성한 결과입니다. 좌측은 미세조정 학습(Fine-tuning)한 결과물이고, 우측은 기본적(Vanilla)인 Imagen 모델입니다. 기존 데이터셋이 잘 예측하지 못하는 데이터에 대해 고해상도의 학습 이미지를 생성해낸 것을 알 수 있습니다. |
|
|
Text2Performer
이제는 텍스트 프롬프트를 입력받아 영상을 만드는 시대가 되었는데요 작년 Text-to-Image 모델에서 더 나아가 Text-to-Video의 시대가 시작되었음을 이번 ICLR에서 구글이 보여주었습니다.
Text2Performer는 이름처럼 텍스트 프롬프트를 입력하면 자연스러운 인간의 얼굴, 표정, 움직임을 영상으로 생성하는 모델입니다. |
|
|
모델의 아키텍처는 다소 복잡하기 때문에 자세한 설명은 건너뛰고, 핵심적인 부분만 요약적으로 설명하겠습니다. 모델은 크게 두 부분으로 나뉘는데요. 우선, 텍스트를 기반으로 외모와 자세를 샘플링합니다. 그런 다음 모션을 샘플링하여 가장 자연스럽게 영상을 생성하는데요. 마지막 단계에서 모션-인식 마스크(Motion-Aware Masking Strategy)를 적용하여, 영상에서 중요한 시간 일관성을 유지합니다.
Text2Performer는 고해상도로 아주 자연스럽게 영상을 생성해냅니다. 모델이 어떤 구조를 가지고 있는지보다도 이런 기술이 가능하다는 것에 주목할 필요가 있습니다. 이제 정말 텍스트로 자연스러운 영상 더 나아가 영화를 제작하는 것도 가능할지 모르겠습니다.
이번 뉴스레터에서는 ICLR2023에서 발표된 3가지 주요 논문을 소개해드렸습니다. 컴퓨터 비전 분야의 논문이 많이 소개했는데 실제로는 자연어처리, 강화학습 등 다양한 분야의 모델도 발표되었습니다. 아무리 ChatGPT가 주목 받고 있다고 하지만, 다양한 분야에서 연구는 계속되고 있습니다. |
|
|
셀렉트스타가 AI EXPO KOREA 2023에 참가합니다
5월10~12일 코엑스 D관 INTELLIGENCE 관 바로 앞,
F42번 Booth로 찾아오세요!
부스로 오셔서
"뉴스레터 보고 왔습니다..." 라고
속삭여주시면 박람회 홍보물을
모두 담을 수 있는
박람회 인싸템,
셀렉트스타 가방을 비롯, 다양한 굿즈를 드립니다!
|
|
|
정부, 클라우드 바우처 지원
클라우드 바우처란,
AI 솔루션 적용이 필요한 기업에게 기업별 환경을 고려한 도입 컨설팅 및 클라우드 전환(데이터이관, 교육비), 서비스 이용료(바우처) 등 바우처 형식으로 "최대 약 1,550만원"을 지원하는 정부 사업입니다.
|
|
|
5월, AI NODAJI는
AiFrenz와 함께
대전에서 개최됩니다
대전 지역 여러분의
많은 관심과 소개,
그리고 참석
기대합니다!
5월 24일(수) 19:00
#AI노다지 #셀렉트스타 #AiFrenz #AI네트워킹파티 |
|
|
AI 관심있는 누구나! 와서 노다지를 캐가세요!
- 직군, 나이에 상관없이 참여할 수 있는 오픈 모임입니다.
- AI와 AI 도입, AI 비즈니스, 사업개발에 대한 다양한 프로그램을 운영하고 있는 AI 중심의 커뮤니티입니다.
- 신사업팀, 사업개발팀, 변화혁신팀 등 회사 내에서 Digital Transformation을 위해 AI 도입을 고민하는 분들이 모여있는 곳입니다.
- 최신 정보와 기술, 작업 노하우, AI 모델 개발을 위한 플랫폼 서치, 전략 등에 대한 고민, 질문, 다양한 경험 등을 자유롭게 나누고 자기만의 값진 노다지를 캐가십시오!
|
|
|
데이터바우처 접수하셨죠?
이제 받으신 견적들을 비교해보십시오
그리고 혜택이 더 큰 업체를 선택하십시오
- 타견적대비 더많이 해드리는 건 기본
- 모든 고객사에게 1:1 AI 멘토링 지원
- 업계 최고 투자자들의 '투자 검토' 기회 부여
- VC, 법률, 특허보호관련 특강 참석 기회
|
|
|
Weekly AI Issues → →
KAIST 홍승훈 교수 연구팀, ICLR에서 최우수 논문상 수상
KAIST 홍승훈 교수 연구팀이 ICLR 2023에서 한국인 최초로 최우수논문상을 수상하였습니다. 홍 교수 팀은 비전 분야의 픽셀 레이블링 문제를 적은 수의 데이터로도 해결할 수 있는 범용적 방법론인 ‘비주얼 토큰 매칭’ 기법을 제안하였습니다.
파이썬보다 무려 35,000배 빠르다
AI 개발용 언어 모조(Mojo)가 출시되었습니다. 기존 파이썬 언어처럼 쉽지만 C언어처럼 빠른 처리 속도를 보인다는 것이 특징이고 현재 개발 단계에 있어 대기 리스트에 등록하면 모조 언어를 활용해보고 피드백을 제출할 수 있습니다.
네이버, 카카오 초거대 AI 개발 중
네이버는 자체 개발한 초거대 AI 모델 하이퍼클로버X를 7월부터 적용하여 검색화면을 개편하고, 카카오는 코GPT 2.0을 개발하여 기업용 챗봇 베타 서비스를 도입할 예정입니다.
바이든, AI 기업 대표 회의 참여
구글, 마이크로소프트 등 빅테크 기업이 백악관에 초대를 받아 AI 산업에 대한 논의를 진행하였습니다. 바이든 대통령도 예정에 없던 깜짝 방문을 했다고 하는데요. 바이든 행정부가 AI 기술력의 잠재력과 위험성이 대해 얼마나 중대한 사안으로 여기고 있는지 상징적으로 보여주는 것입니다. |
|
|
Subscribe → →
한 주간의 AI 뉴스들을 큐레이션하고 AI HOT TOPIC과 ISSUE들을 분석한 기사들을 뉴스레터로 매주 한 번씩 발송해드립니다.
5,000 여명의 구독자들과 함께 하십시오!
요즘 AI 트렌드는 망설이다보면 따라 잡을 수 없습니다! |
|
|
*본 콘텐츠는 deep daiv. 와의 제휴로 구성 되었습니다.
|
|
|
|
|