All in One AI 데이터 솔루션 All in One
AI DATA SOLUTION-
SELECTSTAR |
|
|
NeurIPS 2022
셀렉트스타는 지난 11월 29일, 세계 최고 권위 인공지능(AI) 학술대회 NeurIPS 2022, 이하 뉴립스)’에 셀렉트스타의 글로벌 브랜드인 ‘DATUMO(이하 다투모)’가 참가했습니다. 지난 2021년 셀렉트스타가 직접 구축에 참여했던 KLUE 데이터셋을 활용한 논문이 뉴립스에 등재된바 있고 또한 셀렉트스타가 구축한 데이터셋은 뉴립스 뿐 아니라, CVPR, EMNLP와 같은 세계적인 학술대회의 논문에 활용되어 국내외로 그들의 데이터셋 품질과 실력이 인증된 바 있습니다.
|
|
|
AI SUMMIT Seoul 2022
AI와 산업의 융합, 비즈니스 혁명, 기술적 트렌드에 초점을 맞춘
국내 인공지능 분야 대표 컨퍼런스 AI SUMMIT Seoul 2022에 셀렉트스타가 참가합니다. 특히, 8일 셀렉트스타의 김세엽 대표가 연사로 발표하는 세션이 준비되어 있으니
셀렉트스타, 그리고 AI에 관심있는 여러분의 많은 성원을 바랍니다.
- 2022년 12월 7~8일 코엑스 그랜드볼룸
|
|
|
AI의 승률은 어느 정도일까?
2022년 카타르 월드컵이 중반을 넘어가고 있죠? 대한민국은 기적적으로 16강에 진출했으나 아쉽게 브라질에 패해 탈락했습니다. 여러분은 어느 나라가 우승할 것 같은가요?
카타르 월드컵에서는 이전 월드컵보다 AI 기반 승부 예측을 공개하는 사례가 많았습니다. AI는 4년 동안 가파르게 성장해 왔고, 학습에 활용한 데이터 규모도 크게 늘어났습니다. 하지만 인공지능 발전이 무색하게 승부 예측을 뒤집고 유독 객관적 전력상 약팀이 강팀을 잡는 일이 많았습니다. 어떤 AI의 승부 예측 정답률은 55%에 불과했고, 카타르는 강팀의 무덤이라는 별명이 붙었습니다.
발전을 거듭하고 있다는 AI의 승부 예측은 왜 계속 빗나갈까요? 인공지능이 승부를 예측하는 과정을 짚어보며 그 이유를 찾아보도록 하겠습니다.
|
|
|
AI의 승률은 어느 정도일까?
2022년 카타르 월드컵이 중반을 넘어가고 있죠? 대한민국은 기적적으로 16강에 진출했으나 아쉽게 브라질에 패해 탈락했습니다. 여러분은 어느 나라가 우승할 것 같은가요?
카타르 월드컵에서는 이전 월드컵보다 AI 기반 승부 예측을 공개하는 사례가 많았습니다. AI는 4년 동안 가파르게 성장해 왔고, 학습에 활용한 데이터 규모도 크게 늘어났습니다. 하지만 인공지능 발전이 무색하게 승부 예측을 뒤집고 유독 객관적 전력상 약팀이 강팀을 잡는 일이 많았습니다. 어떤 AI의 승부 예측 정답률은 55%에 불과했고, 카타르는 강팀의 무덤이라는 별명이 붙었습니다.
발전을 거듭하고 있다는 AI의 승부 예측은 왜 계속 빗나갈까요? 인공지능이 승부를 예측하는 과정을 짚어보며 그 이유를 찾아보도록 하겠습니다.
|
|
|
데이터 선정
우선 승부 예측에 어떤 데이터를 활용할지 결정해야 합니다. 통상 데이터 경진대회라면 데이터가 주어지지만 ‘승부 예측’이라는 열린 질문에 대해서는 어떤 데이터로 어떻게 예측할지 연구자 스스로 결정해야 합니다.
승리를 결정하는 모든 요소를 정량화할 수 있을까요? 선수 능력? 감독 전술? 이뿐만은 아닐 겁니다. 경기장 상태, 주심 성향, 관중 태도, 날씨 등 복합적인 요소가 경기 한 판을 결정합니다. 우리는 경기 내적 요소와 함께 경기 외적인 요소도 고려해야 합니다. 예를 들어 브라질은 16강 진출을 조기에 확정했기에 조별 예선 마지막 경기에서 주전 선수들을 출전시키지 않았고, 그 결과 카메룬에게 0:1 패배당했습니다.
일반적인 인공지능 모델은 주어진 데이터 이외의 정보는 활용하지 못합니다. 주어진 정보 내에서 최적의 의사결정을 할 수는 있겠지만, 인공지능에 주입할 정보를 결정하는 건 아직 사람의 몫입니다. 어떻게 보면 데이터를 선정하고 수집하는 과정 자체가 승리를 결정하는 요소라고 봐도 무방하겠습니다. 이것이 바로 데이터 선정이 중요한 이유입니다.
|
|
|
모델 선정
데이터가 결정됐다면 어떤 모델을 활용할지 결정해야 합니다. 데이터를 가장 잘 설명할 수 있는 모델을 선정하는 게 업계 표준입니다(Data Centric-AI). 먼저 데이터를 전처리하고 그에 맞는 모델을 개발하는 게 일반적입니다. 이밖에 승패 확률 맞히기를 우선할지, 스코어 예측을 가장 우선할 지 등 개발 세부 목적에 따라 모델이 달라질 수 있습니다. 우승 국가를 맞히는 경우에는 또 다른 모델이 활용될 수도 있고요.
전통적인 방식과 다르게 강화 학습 모델을 활용해 볼 수도 있습니다. 익숙한 지표 및 통계 기반 예측이 아니라 가상 경기를 시뮬레이션해 보는 방법입니다.
|
|
|
스포츠 데이터 분석전문 업체 Opta는 지난 포르투갈전 경기 결과를 예측했습니다. Opta는 포르투갈이 조별 리그 통과를 위해 승리가 절실한 상황이 아니라는 점을 언급합니다. 하지만 Opta의 예측 모델은 여전히 포르투갈 승리를 예측했습니다. 다만 58.4% 확률로 포르투갈의 압도적인 승리를 예측하지 않았을 뿐입니다. Opta의 예측 모델에 대해서 자세히 알려지지는 않았지만, 이전 경기 결과를 포함한 복합적인 정보를 활용하는 것으로 예상됩니다. |
|
|
⚽ Portugal lack a desperate need for a result in terms of winning the group, and the Opta prediction model does not have them as overwhelming favourites, though Santos’ men are still expected to win with a 58.4% chance of winning.
|
|
|
인공지능 영역 밖의 것들
인공지능은 과거 데이터로 미래를 예측합니다. 그 때문에 현장에서 발생하는 다양한 변수를 고려하기 어렵습니다. 갑자기 특정 선수가 컨디션 난조를 보인다든지, 감독이 상황에 맞춰 유연하게 전술을 바꾼다든지, 부상으로 빠르게 교체하는 등 다양한 변수들이 나타날 수 있습니다. 심지어 지난 러시아 월드컵 결승전에서는 관중이 난입한 뒤로 경기의 양상이 달라지기도 했습니다. 모두 경기에 큰 영향을 끼치는 변수지만 인공지능 학습에 활용하기 어려운 정보입니다. 스포츠 경기 결과를 예측하기 어려운 이유가 바로 여기에 있습니다. 현장에서의 즉흥성, 스포츠가 재미있는 이유 중 하나입니다. 만약 경기 결과를 예측할 수 있는 새로운 지표가 발견된다면, 그 자체로 새로운 변인이 될 수도 있습니다. 새로운 지표 탓에 경기가 이전까지와 다른 양상으로 전개가 될 수도 있다는 해석입니다. 마치 모두가 주가가 올라가겠다고 생각하면 팔지 않는 바람에 결국은 올라가지 않게 되는 현상처럼요.
정리하면, 인공지능으로 승부를 예측하기 위해서는 경기 승부를 결정할 수 있는 요소와 그를 잘 설명할 수 있는 좋은 모델을 선정해야 합니다. 하지만 이는 매우 결정하기 어려운 사안이며, 아무리 예측을 잘한다고 하더라도 그 예측이 다시 경기에 영향을 미칠 수도 있습니다. 인공지능은 예언자도, 만능 도구도 아닙니다. 기존의 데이터로 미래를 잘 설명하는 방법을 찾아낼 뿐입니다. 그리고 결과 또한 확률입니다. 그럼에도 데이터를 기반으로 승리의 확률을 높이려는 시도가 계속되고 있습니다. 선수들의 움직임과 컨디션 정보까지 모두 수집해서 말입니다. 과학 전문 잡지 Nature지에서는 빅데이터가 어떻게 축구를 바꿨는지 설명합니다. |
|
|
AI 업계 최신 트렌드를 공유하고 서로 끈끈하게 네트워킹하는
SELECTSTAR의 AI NODAJI는
이번에는spin-off로서
미국 실리콘밸리에서 특별한 시간을 가졌습니다.
애플, 아마존, 구글, 메타, 베어로보틱스 등 실리콘밸리 속
쟁쟁한 기업의 AI 관련 분야에서 일하고 있는 50여 분의 한국인들.
그분들이 한 자리에 모여 한국어로 서로 반갑게 네트워킹 했던 자리이자
한국인들만의 유대감을 느낄 수 있었던 끈끈한 시간이었습니다.
글로벌 스케일로 성장해가는 AI-NODAJI Networking Night를 기대해주세요! |
|
|
Weekly AI Issues → →
OpenAI가 공개한 ChatGPT
OpenAI에서 ChatGPT를 데모와 함께 공개하였습니다. 강화학습 방법을 적용하여 사용자의 피드백을 반영한다는 점이 특별한데요, 성능이 매우 뛰어나 많은 화제가 되고 있습니다.
카카오브레인의 오픈 소스, ‘칼로 1.0’
AI화가 ‘칼로 1.0’ 깃허브에 공개, 로고·구조물 디자인 제작 기대
카카오브레인에서 그림 그리는 AI를 오픈 소스로 공개했습니다. 개발자뿐만이 아니라 일반인들도 활용해볼 수 있습니다. 관련해 다양한 연구가 이어질 것으로 기대됩니다.
AI 뉴스 앵커 속속 등장
딜라이브 AI아나운서 '로아' 공개…딥브레인AI·아리랑TV도 AI앵커 공동개발
아나운서의 전성시대가 끝나가고 있습니다. 정확한 발음과 다개국어가 가능한 뉴스 앵커 AI가 등장했습니다.
UAE에서 '오아시스' 찾는 삼성전자
삼성전자에서 미래 비전에도 AI가 포함돼 있어 눈길을 끕니다. 얼마 전 방한했던 빈 살만 왕세자의 사우디에 이은 UAE에서의 미래비젼은 무엇일까요?
|
|
|
AI, 머신러닝(ML), 뇌과학 분야에서 최상급 권위의 인공지능(AI) 학회 '뉴립스(NeurlIPS, 인공신경망학회)'. 이곳에 한국 최초의 조직위원으로 선정된 연구자를 무려 세분이나 모시고 들어보는 AI의 미래 비전.
AI에 진심인 여러분의 많은 시청과 성원 바랍니다. #NeurlPS #AI #인공지능#뉴립스 #데이터셋
* 온라인 참가 신청하신 분들만 LIVE 시청이 가능합니다
|
|
|
셀렉트스타의 핵심 가치이자 최고 장점 "자율"
1-5시 코어타임만 지키면 그 외엔 언제 어디서나
나에게 맞는 편한 환경에서 업무가 가능합니다.
자율이 보장된다는 건 내가 가장 일을 잘할 수 있는 환경에서 일하고,
휴식할 땐 온전히 충전할 수 있다는 거에요.
|
|
|
Join Us → →
AI 데이터 업계에서 빛나는
셀렉트스타와 함께 하세요!
|
|
|
타업체 견적 대비 10%(최대 500만원)의 할인 혜택을 드립니다
|
|
|
*셀렉트스타는
실무에 바로 활용할 수 있는 오픈 데이터셋 자료를
무료로 제공해드립니다
홈페이지에서 신청해보세요
|
|
|
1666-3282 (1666-DATA)
*본 콘텐츠는 deep daiv. 와의 제휴로 구성 되었습니다.
|
|
|
|
|