2023 회고: 대규모 언어 모델의 세계로 진입한 CTO의 인사이트

2023/12/22 | 작성자: 이화석
 

올해는 저에게 코로나19만큼이나 충격적이고 혼란스러운 한 해였습니다. ChatGPT로 대표되는 대규모 언어 모델(LLM) 이 올해 전 세계를 강타했기 때문입니다. ChatGPT가 제공한 경험은 AI 업계 종사자뿐만 아니라 일반 대중에게까지 확산되어 LLM에 대한 기대와 우려를 동시에 불러일으켰습니다. 많은 기업들이 LLM 도입을 위해 막대한 예산을 배정하고 있으며, 오픈AI, 구글, 메타 등 대기업과 앤트로픽, 코히어 등 스타트업도 매주 새로운 LLM을 출시하기 위해 노력하고 있습니다. 2023년은 우리 모두가 LLM 발전의 큰 물결에 올라탄 흥미진진한 한 해였습니다.

위기인가요, 기회인가요?

시장의 혼란은 일부 기업에게는 위기인 동시에 다른 기업에게는 기회가 될 수 있습니다. 특히 LLM과 같은 게임 체인저가 등장하여 새로운 시장이 열릴 때 더욱 그렇습니다. 아직 시장이 확고하게 형성되지 않은 상황에서 수많은 기업이 다양한 전략으로 진입을 시도합니다. 소수의 제품만이 이러한 소모의 사이클에서 살아남습니다. 결국 시장이 전환기를 거치면서 살아남은 제품이 세그먼트를 정의하고 시장 안정화로 이어집니다.

포화 상태인 시장에서 스타트업이 대기업을 능가하는 것은 이론적으로 거의 불가능합니다. 따라서 스타트업이 기존 대기업을 이기는 사례는 대개 새로운 산업이 부상하는 시기에 발생합니다. 이는 세상을 바꾼 거대 기술 기업의 출현을 돌아보더라도 마찬가지입니다. 개인용 PC 시장이 처음 열렸던 1975년에는 마이크로소프트가 등장했고, 인터넷이 급속도로 확산되고 새로운 산업이 등장하던 1998년에는 래리 페이지가 구글을 설립했습니다. 닷컴 버블 이후 인터넷 시장이 회복되던 2004년에는 페이스북이 등장했고, 4년 후 아이폰 3가 세상에 출시되면서 스마트폰과 함께 소셜 미디어 산업이 폭발적으로 성장했습니다.

저는 현재 시장이 업스테이지 같은 스타트업에게 매우 좋은 기회라고 생각했습니다. 기존에 집중하고 있던 사업이 있었지만 LLM이라는 완전히 새로운 시장이 열렸고, 이 기회를 잡아야 한다고 생각했습니다. 한편으로는 이 기회가 오래 가지 않을 것 같다는 생각도 들었습니다. 그래서 6월부터 LLM TF를 구성하고 AI 분야의 '빌보드 차트 '와 비슷한 세계 최대 오픈소스 AI 모델 플랫폼인 허깅페이스의 오픈 LLM 리더보드에서 순위를 올리는 도전에 나섰습니다.

허깅 페이스 '오픈 LLM 리더보드'에서 1위 달성

뛰어난 엔지니어들로 구성된 태스크포스를 구성한 지 두 달 만에 메타의 LLaMa2를 700억 개의 파라미터로 개선한 업스테이지의 30B 모델이 LLaMa2 70B를 제치고 국내 대규모 언어 모델(LLM) 순위에서 처음으로 1위를 차지했습니다. ARC, 헬라스웨그, MMLU, 트루스풀QA 등 모든 영역에서 점수가 상승했습니다. 국제 학회 논문 발표 경험이 있는 카글러들이 사내 리더보드를 만들어 팀원 간 선의의 경쟁을 유도하고 최신 연구 동향을 빠르게 공유하며 끊임없이 토론하고 단기간에 다양한 시도를 한 덕분입니다. 가능했던 것 같아요.

업스테이지의 많은 사람들이 문서 AI (OCR), 추천 등의 분야를 개발하다가 문득 어떻게 하면 LLM을 잘할 수 있을까 고민했습니다. 과거에는 규칙을 기반으로 알고리즘을 개발할 때 각 분야별로 특정 규칙을 프로그래밍하고 이를 기반으로 인공지능 시스템을 개발했습니다. 딥러닝이 등장하면서 엔드투엔드 방식이 도입되었고, 학습 데이터만 잘 준비되어 있다면 이미지와 자연어를 동일한 모델 아키텍처로 처리할 수 있는 패러다임으로 접어들었습니다. 대표적인 모델이 트랜스포머입니다. 자연어 처리와 컴퓨터 비전 모두 트랜스포머를 기반으로 구현되어 다양한 작업을 처리합니다. 초대형 언어 모델이 등장하면서 각 모달을 하나의 아키텍처로 처리하려는 움직임도 있습니다. 사실 그 이전에도 멀티모달 분야는 많았지만 초대형 언어 모델이 등장하면서 이러한 움직임이 가속화되고 있습니다. 이러한 관점에서 볼 때 AI 엔지니어는 특정 분야에 국한되지 않고 다양한 모달을 넘나들 수 있는 능력을 갖추는 것이 필수적입니다. 이를 위해서는 머신러닝에 대한 탄탄한 기초 지식이 뒷받침되어야 합니다. 업스테이지에는 탄탄한 기초 지식을 갖추고 이를 잘 응용할 수 있는 인재들이 많았기에 가능했습니다.

실제 비즈니스에서의 LLM

요즘 LLM(대규모 언어 모델)을 더 잘 이해하고 활용하고자 하는 사람들로부터 많은 메시지를 받느라 꽤 바빴습니다. LLM 기술은 연구자들에 의해 지속적으로 개발되고 있지만, 현실에서는 우려되는 부분도 있습니다. 첫 번째는 환상이고, 두 번째는 보안 문제 없이 제어할 수 있는 자체 모델이라는 LLM에 대한 가장 큰 두 가지 우려를 어떻게 극복하고 있는지 개념적으로 간단히 설명해 드리고자 합니다.

먼저, 환각을 완화하기 위한 대표적인 시도로는 검색 증강 생성(RAG)이라는 기술이 있습니다. RAG는 검색 기술을 이용해 사용자가 요청한 작업을 수행할 때 기본이 되는 정보를 확보한 다음, 검색 결과를 바탕으로 답변을 생성하는 방식입니다. LLM과 검색 기술이 연계되는 방식은 벡터 DB를 기반으로 합니다. 일정량의 텍스트 정보를 하나의 벡터로 변환하는 임베딩 모델을 사용해 모든 정보를 지식으로 변환합니다. 이때 텍스트 정보가 구조화될수록 RAG 성능이 향상됩니다. 이를 위해 오프라인 문서를 텍스트로 변환하는 OCR 기술뿐만 아니라 텍스트 정보를 구조화된 정보로 변환하는 파싱 기술에 대한 수요도 증가하고 있습니다. 업스테이지도 이 분야에 대한 지속적인 연구 개발을 통해 성능을 개선하고 있습니다.

둘째, 비즈니스 애플리케이션을 위한 소규모 LLM을 만들고 있습니다. 프라이빗(커스텀) LLM은 자체 데이터로 학습한 LLM을 말합니다. 현재 프라이빗 LLM은 기술 접근성, 학습 및 추론 비용 등을 고려해 최대 파라미터 수가 100억 개 이하인 모델로 구현되고 있습니다. 프라이빗 LLM은 제어 가능성, 데이터 보안, 비용 최적화 등의 강점을 가지고 있습니다. 프라이빗 LLM 중심의 비즈니스에서 가장 빠르게 검증해야 하는 것은 지식의 도메인이나 활용 방식이 제한적인 상황에서 ChatGPT와 유사하거나 더 나은 성능을 달성할 수 있는지 여부입니다. 프라이빗 LLM 사업 자체가 이제 막 시작되었기 때문에 아직 실질적인 비즈니스 사례가 많지 않으며, 이는 비단 한국만의 상황이 아니라 글로벌한 상황입니다. 따라서 내년에 고객이 만족할 만한 프라이빗 LLM 사례가 등장할지 여부가 향후 프라이빗 LLM 시장의 방향을 결정할 것으로 보입니다.

개인적으로 올해 회사의 가장 큰 자산이라고 생각하는 것은 다음과 같습니다 . Document AI 프로젝트를 통해 B2B 엔터프라이즈 AI 제품의 제품 개발, 제품 제공, 제품 유지보수의 주요 사이클 전체를 성공적으로 경험했다는 점입니다. AI 모델로 실제 문제를 해결하는 데는 보이지 않는 장벽이 많습니다. 전 세계적으로 이 과정을 처음부터 끝까지 경험한 AI 기업은 소수에 불과하다고 생각합니다. 업스테이지의 세계 최고 수준의 모델 개발 능력과 이 모델을 활용해 실제 고객의 문제를 해결한 경험은 향후 업스테이지가 LLM 관련 B2B 서비스를 출시하는 데 큰 힘이 될 것으로 믿습니다.

2024년을 기대해야 하는 이유 - LLM과 문서 AI의 만남, 세계 최고 수준의 업스테이지

LLM 기술을 통해 새로운 기회를 모색하는 과정에서 문서 AI 사업도 올 한 해 동안 꾸준히 진행되어 왔습니다. 사업 계획을 LLM으로 바꿔야 하지 않겠느냐는 질문을 자주 받았습니다. 다행히도 이미 잘하고 있던 문서 AI와 LLM 기술이 서로 시너지를 낼 수 있다는 것을 알게 되었습니다. 실제 비즈니스에 활용할 수 있는 LLM을 만들 때는 기업이 자체 데이터를 얼마나 잘 처리하느냐가 LLM의 성능을 결정한다고 해도 과언이 아닙니다. 앞서 RAG에 대해 이야기할 때 잠깐 언급했듯이 업무 관련 문서를 잘 구조화된 텍스트 정보로 지식화하는 것이 중요한데, 이때 문서 구조를 자동으로 인식하는 OCR 기술(레이아웃 분석) 이 있다면 큰 시너지를 낼 수 있습니다. 문서 AI 기술로 정보를 인식/저장하고, LLM을 통해 정보를 검색하고 분석에 활용하는 이 과정이 업무 생산성과 비즈니스 가치를 높이는 데 큰 밑거름이 될 것이라고 생각합니다.

최근 솔라 미니가 허깅페이스 오픈 LLM 리더보드에서 다시 한 번 1위를 차지하며 글로벌 시장에서 업스테이지의 인지도를 높였습니다. 업스테이지의 기술에 대한 글로벌 반응을 확인하기 위해 올 한 해 많은 컨퍼런스와 행사에 참석하며 다양한 사람들을 만났습니다. 전 세계적으로 자체 LLM 모델을 학습하는 기업이 많지 않은 상황에서 솔라의 좋은 결과가 업스테이지의 대외 평판에 큰 영향을 미쳤다는 것을 느낄 수 있었습니다.

미래를 예측하는 가장 좋은 방법은 미래를 창조하는 것입니다!

앨런 케이의 유명한 명언으로, 올해 저의 좌우명이기도 합니다. 혼란스러워 보이는 미래 속에서도 적당히 흔들리며 좋은 동료들과 함께 미래를 만들어가고 있습니다. 이렇게 글을 쓰다 보니 자랑 같지만 솔직히 부담스럽고 불안할 때가 많았습니다. 제가 선택한 견해가 모두 옳은 것은 아니더라도 혼란스러운 미래에 대한 불안감 때문에 미래를 어떻게 만들어갈지에 대한 믿음을 가지려고 노력했고, 그 믿음의 큰 부분은 함께 일하는 사람들에 대한 믿음이었다고 생각해요. 혼란과 우여곡절을 겪으며 얻은 교훈과 통찰력, 그리고 함께 일하는 사람들 덕분에 2023년이 더욱 기대됩니다. 2024년의 제 목표 중 하나는 내년에 이러한 인사이트를 더 많이 공유하는 것입니다. 앞으로의 여정을 기대해 주세요!

이전 게시물
이전 게시물

수학적 추론에서 MS ToRA와 ChatGPT를 이긴 업스테이지 13B LLM

다음
다음

'오픈 Ko-LLM 리더보드'로 국내 인공지능 경쟁력 강화 - [스타뷰 10호].