'Create a split diagram contrasting two types of computer interfaces.
On the left side, show CLI with a vintage computer screen...'
이미지. DALL E·3
지난 주 오픈AI의 첫 개발자 행사에서 'GPTs'가 공개된 이후 커스텀 챗봇 만들기가 유행입니다. Assistant API 기능으로 이제는 문서 임베딩과 검색 알고리즘 작업 없이도 지식 검색을 구현할 수 있으며, 늘어난 입력 토큰 길이 덕분에 매우 긴 파일도 통째로 업로드할 수 있게 됐습니다.
이처럼 새로 업데이트된 ChatGPT 기능은 많은 스타트업의 기존 서비스를 대체할 수 있어 현재 실리콘밸리에서는 ‘오픈AI가 내 회사를 죽였어(OpenAI killed my startup)’라는 말이 밈처럼 사용되고 있다고 합니다. 그렇다면 오픈AI에서는 ‘맞춤형 챗봇’ 만들기 이후 어떤 서비스를 준비하고 있을까요? 오늘은 운영 체제로서의 거대 언어 모델, 'LLM OS'에 대해 살펴보겠습니다.'
CLI, GUI 다음은 'LLM'
'The horizontal illustration of a Command Line Interface (CLI) display example is ready, featuring a wide vintage computer monitor with a text-based interface' 이미지. DALL E·3
컴퓨터 운영 체제와 인터페이스는 지난 수십 년 동안 꾸준히 발전해 왔습니다. 초기에는 명령줄 인터페이스(CLI, Command-Line Interface)가 널리 쓰였습니다. 사용자는 컴퓨터를 사용하기 위해 정확한 텍스트 명령을 입력해야 했고, 이러한 접근 방식은 고도의 기술 지식을 요구했습니다. DOS/명령 프롬프트/윈도우와 맥OS의 터미널 등이 CLI의 예시입니다. CLI는 효율적이고 강력했지만, 직관적이지 않아 초기 컴퓨터 사용을 전문가의 영역으로 제한했습니다.
이후 그래픽 사용자 인터페이스(GUI)가 등장했습니다. GUI는 아이콘, 창, 메뉴 등을 통해 시각적 상호작용을 가능하게 했습니다. 누구나 마우스 클릭으로 파일을 열고 애플리케이션을 실행할 수 있게 되어, GUI는 개인용 컴퓨터의 보급과 대중화에 큰 역할을 했습니다.
근래 대규모 언어 모델(LLM)은 다음 세대 운영체제로 주목받고 있습니다. 자연어를 이해하고 생성하는 인공지능 기반 운영 체제는 사용자 질문과 명령에 따라 적절한 작업을 스스로 수행할 수 있습니다. 이는 더욱 풍부하고 개인화된 사용자 경험을 제공하며, 시간이 지남에 따라 사용자의 선호와 스타일을 학습할 수도 있습니다.
또 한 가지 LLM OS 도입의 기대 효과는 운영 체제와 개별 애플리케이션 간의 경계가 모호해지는 것입니다. 운영 체제/App Store/앱이 모두 LLM으로 대체된다면 개별 프로그램을 일일이 실행하지 않고도 업무에 필요한 다양한 작업을 수행할 수 있습니다. 마치 현재 ChatGPT 플러그인 서비스처럼요.
오픈 AI 사장 그렉 브록만은 ChatGPT 플러그인을 출시하며 “ChatGPT는 상황에 따라 어떤 도구를 사용해야 하는지 (사용자가) 명시적으로 말하지 않아도 다양한 도구를 선택한다”면서 “저는 이것이 사용자 인터페이스에 대해 생각하는 새로운 방법을 보여준다고 생각합니다”고 말한 바 있는데, 이는 LLM OS 등장의 예고와도 같습니다.
오픈AI의 LLM OS 출시는 최근 안드레 카파시의 트윗을 보면 더욱 명확합니다. 안드레 카파시는 오픈AI 창업 멤버로, 이후 테슬라에서 오토파일럿 팀을 이끄는 AI 총괄로 활동하다 올해 2월 오AI로 다시 복귀한 컴퓨터 과학자입니다.
그는 요즘 영화 속 인공지능 비서 ‘자비스’와 같은 것을 만들고 있다고 밝혀 왔는데요, 11일엔 "LLM OS를 만들고 있으니, 기다려 달라(LLM OS. Bear with me I'm still cooking)"는 설명과 함께 그와 관련된 도식을 포스팅했습니다.
*ChatGPT의 도움을 받아 해당 도식에 대한 설명을 작성했습니다.
Peripheral devices I/O: 주변장치 입력/출력으로, 비디오와 오디오 데이터를 처리합니다.
CPU: 중앙 처리 장치로, LLM과 다른 구성 요소들 사이의 데이터 처리를 담당합니다.
카파시가 밝힌 CPU 역할의 LLM 스펙은 OpenAI GPT-4 Turbo 256 core (batch size) processor @ 20Hz (tok/s) 입니다.
Disk: 여기에는 파일 시스템과 임베딩(embeddings)이 저장됩니다.
RAM: 'context window'라는 용어는 LLM이 현재 처리하고 있는 데이터의 범위를 의미할 수 있습니다. (128K)
Browser: 인터넷 브라우저를 통해 이더넷을 통한 데이터 교환을 담당합니다.
Other LLMs: 다른 대형 언어 모델들과의 통신을 의미할 수 있습니다.
현재 LLM OS를 개발하고 기업은 오픈AI만이 아닐 듯합니다. LLM OS는 일론 머스크가 트위터를 ‘X’로 리브랜딩하며 강조한 '슈퍼 앱' 개념과도 맞닿아 있으며, 마이크로소프트는 코파일럿을 통해 LLM OS의 일부 기능을 실현하기 시작했습니다. 그러나 지금으로서는 뛰어난 모델과 사용자 친화적인 기능을 연이어 선보이는 오픈AI의 새 기술이 가장 기대되네요 :)
하정우 네이버클라우드 AI이노베이션 센터장은 “한국이 공공 영역에서 AI로 어떻게 안전성을 확보했는지 등 사례를 공유해 국제 사회에서 발언권을 키울 수 있다”라고 말했다. 거대언어모델(LLM)을 평가할 수 있는 기술(LLM 벤치마크)을 한국이 주도하자는 목소리도 있다. 셀렉트스타 황민영 부대표는 “LLM의 윤리·안전성 평가는 아직 국제 표준이 없어 한국이 선도할 수 있다"라고 말했다.