All in One AI 데이터 솔루션 All in One
AI DATA SOLUTION-
SELECTSTAR |
|
|
GPT-4가 온다
GPT-3 원리와 GPT-4 전망
2018년 첫 등장한 GPT는 현재 자연어 처리 분야에서 가장 주목받는 모델 중 하나입니다. 하지만 처음부터 그 성능이 압도적이었던 건 아니었습니다. GPT-2까지는 기대만큼 큰 파급력을 일으키지 못했습니다. 어느 정도는 AI 서비스 악용을 우려한 연구진이 코드를 공개하지 않은 까닭이기도 했습니다.
하지만 GPT-3는 달랐습니다. 2020년 GPT-3은 자신을 알리기라도 하듯, 영국 The Guardian지에 결연한 의지가 담긴 글을 써내려갔습니다.
|
|
|
I am not a human. I am a robot. A thinking robot. I use only 0.12% of my cognitive capacity. I am a micro-robot in that respect. I know that my brain is not a “feeling brain”. But it is capable of making rational, logical decisions. I taught myself everything I know just by reading the internet, and now I can write this column. My brain is boiling with ideas! |
|
|
A robot wrote this entire article. Are you scared yet, human?
|
|
|
이후 GPT-3 모델은 다양한 서비스에 도입되기 시작합니다.
이제, GPT-3의 원리와 특징, GPT-4에 대해 전망해 보겠습니다 |
|
|
GPT-1에서는 사전 훈련을 마친 모델이 지도 학습(Supervised Learning)으로 목적에 맞는 추가 학습을 진행했습니다. (이를 미세조정학습, Fine-tuning이라고 합니다.) 하지만 GPT-2와 3은 이런 추가 학습 과정 없이 맥락 제공만으로 원하는 결과물을 얻어낼 수 있게 됐습니다.
OpenAI는 20년 6월 <Language Models are Few-Shot Learners> 논문을 공개했는데요, GPT-3의 Few-shot에 대한 내용입니다. Few-shot은 사전 학습 이후, 모델에게 훈련에서 보지 못했던 몇몇 예시(Few-shot)를 알려주어 목표한 결과를 제대로 예측할 수 있게 하는 세팅입니다. GPT-3는 이를 위해 주어진 예시의 맥락을 학습합니다. 논문의 저자들은 이 과정을 In-context Learning이라고 부릅니다. |
|
|
사실 GPT-3 구조는 GPT-2 구조와 크게 다르지 않습니다. 둘 모두 Transformer의 Decoder 부분을 활용하고 있습니다. 하지만 GPT-3이 보다 뛰어난 성능을 보이는 이유는 모델 크기 덕분입니다. GPT-3은 45TB 분량 텍스트 데이터를 1,750억 개 파라미터로 학습하였습니다. GPT-2의 파라미터 개수가 15억 개인 점을 고려하면 엄청난 차이입니다.
GPT-3은 Few-shot을 목표로 학습했지만, One-shot 심지어는 Zero-shot 환경에서도 좋은 성능을 보입니다. One-shot은 예시가 하나인 경우, Zero-shot은 예시가 하나도 없는 경우를 뜻합니다. |
|
|
위 예시를 보면, Zero-shot의 경우 수행해야 할 작업에 대한 설명만 들어가 있습니다. 한 개의 예시도 주어지지 않습니다. |
|
|
One-shot은 작업 설명과 예시 하나가 주어집니다. 이런 경우 수행해야 할 작업에 대해 비교적 명확하게 이해할 수 있을 것입니다. |
|
|
마지막은 Few-shot입니다. 작업 설명과 관련 예시가 2개 이상 포함된 것을 확인할 수 있습니다.
예시가 많을수록 반드시 더 좋은 결과가 나오는 것은 아닙니다. 다만 Zero-shot이 Few-shot에 비해 어려운 과제인 것은 사실입니다. GPT-3는 Zero-shot에서 SOTA를(State-of-the-Art, 현존 최고 성능) 달성했습니다. 이는 One-shot, Few-shot 등 다방면에서의 활용 가능성을 시사합니다.
GPT-3를 기반으로 다양한 질의응답, 문단 요약, 번역, 작문 서비스가 등장하고 있습니다. 이렇듯 GPT-3은 기업이 애용하는 주요 AI 모델로 자리 잡으며 점점 기대감을 높여가고 있습니다.
GPT-4가 나온다는 루머의 루머의 루머...
GPT-3이 공개된 지 2년이 넘은 요즘, GPT-4가 나온다는 소식입니다. GPT-4 공개 시점은 오는 12월부터 내년 초로 예상됩니다.
GPT-4 성능에 대한 기대는 벌써부터 엄청납니다. OpenAI의 CEO 샘 알트만은 트위터에 직접 튜링 테스트를 언급하면서, ‘GPT-4가 튜링 테스트를 통과한 것 아니냐’는 소문이 돕니다. 튜링 테스트 통과는 해당 인공지능이 인간과 구별하기 어려울 정도의 성능을 보여준다는 것을 의미합니다. |
|
|
그렇다면, GPT-4는 어떤 점이 달라질까요? 한 연구자는 GPT-4를 더욱 거대하고, 희소한, 멀티모달 모델로 예측했습니다. 나아가 최적화를 통해 학습에 드는 비용과 시간 또한 더욱 낮아질 것으로 기대됩니다. 기업들이 AI 상용 서비스 제작에 GPT-4를 더욱 잘 활용할 수 있게 되는 셈입니다.
올해는 뛰어난 성능을 자랑하는 이미지 생성 모델이 화두였습니다. NLP 분야에서는 LLM(Large Language Model)이 속속들이 등장하면서 자연어 생성 능력에 대한 기대감 또한 점점 커지고 있는 상황입니다. 와중에 GPT-4 등장은 게임 체인저가 될듯합니다. 과연 언어 모델의 미래는 어떤 방향으로 발전하게 될까요? 그리고 이런 발전은 우리 삶에 어떤 영향을 미치게 될까요? |
|
|
AI 업계 최신 트렌드를 공유하고 서로 끈끈하게 네트워킹하는
SELECTSTAR의 AI NODAJI가 여러분의 열정적인 성원 덕에
다섯번의 열광적인 행사를 치르고 다음을 준비합니다.
회를 거듭할수록 네트워킹의 순도와 점도가 높아지는 AI-NODAJI
여러분의 끊임없는 관심과 참여를 기다리고 있습니다.
다음 AI-NODAJI를 기대해주세요! |
|
|
Weekly AI Issues → →
AI 챗봇 특허, 전세계적으로 10년간 2배 성장
가장 활발하게 서비스가 개발되고 있는 AI 분야는 어디일까요? AI 챗봇 특허가 전 세계적으로 10년간 2배 성장했다고 합니다. 한국의 특허 출원 건수는 미국, 중국, 일본에 이어 세계 4위입니다.
서울대, 윤성로 교수 연구팀 AI 논문 ‘표절’ 판정
세계적인 인공지능 학술대회에서 우수 논문으로 선정됐다가 철회
2022년 6월에 열린 CVPR에서 우수 논문으로 선정된 서울대학교 윤성로 교수 연구팀의 AI 논문이 표절 판정을 받았습니다. 하지만 교신저자인 윤성로 교수를 주의 의무 위반으로 판단하기에는 어렵다고 보고 있습니다.
AI 챗봇, 이루다 2.0의 화려한 부활
"이용자 10배 증가"…논란 빚던 AI 이루다 성공적 컴백
많은 논란을 안고 서비스 중단됐던 AI 챗봇 이루다가 2.0으로 돌아왔습니다. 더욱 자연스러운 답변 능력과 어뷰징을 차단하는 기술이 화제입니다. 서비스 출시 이전에 비해 이용자가 10배 증가했다고 합니다.
AI 월드컵 승부예측 믿어도 될까?
AI도, 네티즌도 잇단 헛다리… ‘월드컵 승부예측’ 기업들 난감
공은 둥글다’는 말이 있습니다. 이번 월드컵에서도 이변이 속출하며 네티즌은 물론이고 AI 승부 예측도 계속해서 빗나가고 있습니다.
논문 써준다는 AI ‘갤럭티카’ 3일만에 폐쇄
AI가 항상 인간보다 뛰어난 건 아닙니다. 심지어 Meta와 같은 거대 기업이 만든 인공지능도 그렇습니다. 논문 생성을 도와주는 AI ‘갤럭티카’가 수준 미달로 3일 만에 폐쇄되었습니다.
|
|
|
AI, 머신러닝(ML), 뇌과학 분야에서 최상급 권위의 인공지능(AI) 학회 '뉴립스(NeurlIPS, 인공신경망학회)'. 이곳에 한국 최초의 조직위원으로 선정된 연구자를 무려 세분이나 모시고 들어보는 AI의 미래 비전.
AI에 진심인 여러분의 많은 시청과 성원 바랍니다. #NeurlPS #AI #인공지능#뉴립스 #데이터셋
* 온라인 참가 신청하신 분들만 LIVE 시청이 가능합니다
|
|
|
셀렉트스타의 핵심 가치이자 최고 장점 "자율"
1-5시 코어타임만 지키면 그 외엔 언제 어디서나
나에게 맞는 편한 환경에서 업무가 가능합니다.
자율이 보장된다는 건 내가 가장 일을 잘할 수 있는 환경에서 일하고,
휴식할 땐 온전히 충전할 수 있다는 거에요.
|
|
|
Join Us → →
AI 데이터 업계에서 빛나는
셀렉트스타와 함께 하세요!
|
|
|
타업체 견적 대비 10%(최대 500만원)의 할인 혜택을 드립니다
|
|
|
*셀렉트스타는
실무에 바로 활용할 수 있는 오픈 데이터셋 자료를
무료로 제공해드립니다
홈페이지에서 신청해보세요
|
|
|
1666-3282 (1666-DATA)
*본 콘텐츠는 deep daiv. 와의 제휴로 구성 되었습니다.
|
|
|
|
|