Upstage

원본 보기

'도메인별 LLM'의 실제 사례: 비즈니스에 맞춤형 AI 도입

2024/02/19 | 작성자: 박성민 (콘텐츠 매니저)

거대언어모델의 등장은 산업 전반에서 새로운 가능성을 열고 있습니다. 이번 콘텐츠에서는 ‘도메인 특화 LLM’이 실제 산업에 적용되고 있는 사례와 혁신에 대해 자세히 살펴봅니다.


도메인 특화 LLM이란 무엇이며, 다른 언어 모델과 어떻게 다른가요?

기업이 외부의 AI 기술을 도입할 때 직면하게 되는 가장 큰 허들 두 가지는 바로 데이터 보안 문제와 AI 할루시네이션(환각 현상)입니다. 이러한 문제는 부정확한 응답을 생성하거나 데이터 유출을 유발할 수 있는 생성형 AI의 특성으로 인해 발생하곤 합니다. 때문에 범용 LLM의 한계를 극복할 수 있는 도메인 특화 LLM이 대안으로 떠오르고 있습니다. 도메인 특화 모델의 강점은 전문적인 용어나 문맥을 이해하면서도 향상된 성능을 보장할 수 있다는 점입니다. 이는 특정 도메인이나 산업에 맞게 학습되었기 때문에 보다 정확하고 문맥에 맞는 응답을 제공하며 학습된 분야 내에서 AI 할루시네이션 현상을 방지할 수 있습니다. 그렇다면 도메인 특화 LLM과 일반 언어 모델의 차이점은 무엇일까요?

도메인별 LLM 학습에는 특정 도메인에서 잘 정의된 작업을 수행하기 위해 대상 데이터셋에 대한 사전 학습과 파인튜닝이 포함됩니다. 이 접근 방식은 일반적으로 다양한 작업과 언어 패턴을 수행하기 위해 대규모의 광범위한 데이터셋에 대한 사전 학습을 포함하는 기존의 언어 모델의 학습과는 다릅니다. 도메인 맞춤형 모델은 특정 도메인에 특화된 대량의 텍스트 데이터로 학습하여해당 분야의 전문 용어와 언어적 뉘앙스를 심층적으로 이해합니다. 이를 통해 LLM은 전문 어휘로 사용자와 보다 효과적으로 소통하고 고품질의 답변을 제공할 수 있습니다. 따라서 도메인 특화 LLM을 활용하는 데에는 주기적으로 업계의 용어와 이슈에 대해 최신 정보를 업데이트 해주는 것이 매우 중요합니다.


도메인 특화 LLM의 실제 적용 사례

이제 여러분은 도메인 특화 LLM으로 할 수 있는 일과 이로 인해 실제 산업의 업무 환경이 어떻게 변화하고 있는지 궁금하실 것입니다. 실제 유즈케이스들을 자세히 살펴보겠습니다.

1. 법률 산업

  • 법률 분석 지원

법률 전문가에게 실시간 분석을 제공하는 프랑스의 법률 특화 도메인 언어 모델의 사례 (출처: Predictice)

법률 문서를 실시간으로 분석해 법률 전문가의 업무를 지원하는 LLM을 상상해 보셨나요? 법률 정보를 제공에 특화된 법률 리서치 및 검색 엔진 SaaS 플랫폼'Predictice' 를 소개합니다. 프랑스의 법률 기술 기업이 출시한 이 서비스는 인공지능을 활용해 2,500만 건의 법률 데이터를 분석하고 정리합니다. 더불어 판례 검색, 최신 법률 업데이트, 법률 뉴스 등의 기능을 통해 변호사와 법률 전문가들이 보다 효율적으로 일하고 더 나은 의사결정을 내릴 수 있도록 도와주기도 합니다. Predictice는 ChatGPT를 활용해 법원 판결 요약 서비스를 제공하고 있습니다. 여기에는 법적으로 접근 가능한 모든 법원의 판결이 포함되어 있으며 24시간 업데이트되어 법률 전문가가 유용하게 활용할 수 있습니다.

  • 세무

세금 및 법률 산업 종사자를 위한 도메인 특화 언어 모델 'Blue J' (출처: Blue J)

도메인별 LLM은 세무 및 법률 산업에도 적용되고 있습니다. 이는 법률 서비스의 효율성을 개선하고 법률 업무에서 오류가 있는지를 파악하는 데 유용하게 쓰일 수 있습니다. 'Blue J'는 세무 전문가가 탁월한 분석을 수행하고 더 많은 인사이트를 더 빠르게 제공할 수 있도록 설계된 생성형 AI로, 세무 전문가는 AI를 활용하여 수천 건의 이전 결정을 즉시 분석함으로써 시나리오의 결과를 예측할 수 있습니다. 법령 참조, 관련 사례 등이 포함된 세금 주제에 대한 사전 구축된 요약이 연구를 손쉽게 지원합니다.


2. 수학

  • MathGPT(업스테이지-콴다-KT)

* MS ToRA 논문 기준(링크)
** GSM8K 및 MATH 이외의 데이터셋 포함(2023년 12월 22일 기준)

수학 특화 언어 모델의 등장으로 논리 추론에 취약한 것으로 여겨졌던 인공지능의 한계를 극복할 수 있을지 주목받고 있습니다. 수학은 주요 언어 모델조차 완벽하게 작업을 수행하기 어렵다고 알려져 있을 정도로 인공지능에게 가장 도전적인 분야 중 하나로 여겨지곤 합니다. 그렇다면 LLM에게 수학은 왜 어려운 분야일까요? 왜냐하면 수학 문제를 풀기 위해서는 명확한 논리와 순차적인 사고방식을 포함한 복잡한 추론 능력이 요구되는데, 그에 반해 언어 모델은 주로 글을 문맥적으로 이해하고 생성하는 언어적인 능력에 특화되어 있어 수학 특화 거대언어모델을 만드는 것이 쉽지 않기 때문입니다.

그럼에도 불구하고 "MathGPT"라는 별명을 가진 Upstage-Qanda 13B 모델은 1월에 GSM8K와 MATH 벤치마크 데이터 세트에서 모두 MS ToRA 13B를 능가하는 SoTA 성능을 달성했습니다. 참고로 GSM8K는 8.5만 개의 고품질 초등학교 수학 문제로 구성되어 있으며, MATH는 12,500개의 고난도 대회 수학 문제가 데이터셋에 포함되어 있습니다.

특히 MathGPT는 다양한 벤치마크 테스트에서 ChatGPT의 평균 성능을 넘어섰으며, 심지어 48.8%라는 놀라운 정확도로 MATH의 GPT-4를 뛰어넘어 업계 최고의 모델과의 경쟁력을 보여주었습니다. MathGPT는 복잡한 수학 공식과 개념을 이해하여 사용자에게 정확한 솔루션을 제공할 수 있을 것으로 기대됩니다.



3. 헬스케어

  • 임상 전문 대규모 언어 모델

생물의학 자연어 처리, 임상 텍스트 생성 및 의료 텍스트 평가를 위해 개발된 임상 생성 대규모 언어 모델, 'GatorTronGPT'
(출처: Peng, C., Yang, X., Chen, A. et al. 의학 연구 및 의료를 위한 생성적 대규모 언어 모델 연구 . Med. 6, 210 (2023). https://doi.org/10.1038/s41746-023-00958-w)

의사가 작성한 환자기록지와 AI가 작성한 환자기록지를 구분하기 어렵다면 믿어지시나요? 이것은 이미 현실입니다. 의료 전용 LLM은 의료 전문가가 정보에 입각한 의사 결정을 내리고 대량의 의료 텍스트를 처리할 수 있도록 지원함으로써 업계를 변화시키고 있습니다. 환자들은 이를 자신의 건강에 관한 올바른 정보를 얻는 데 유용하게 활용할 수 있습니다.

임상 생성 대규모 언어 모델인 'GatorTronGPT'는 플로리다 대학교와 NVIDIA의 연구진이 개발했습니다. 이 모델은 생의학 자연어 처리를 사용하여 의사의 메모를 생성합니다. 이는 임상 업무에 인공지능을 적용하여 의료 산업이 어떻게 변화하고 있는지를 보여주는 사례입니다.


  • 생물의학 텍스트 생성 및 마이닝

의료 특화 언어모델, BioGPT (출처: 존 스노우 연구소 유튜브)

BioGPT는 생물의학 텍스트 생성 및 마이닝을 위해 설계된 도메인별 사전 학습된 생성형 트랜스포머 언어 모델입니다. 이 모델은 1,500만 개의 PubMed 초록을 바탕으로 사전 학습되었기 때문에 전문 어휘를 더 잘 이해합니다. 덕분에 생의학 연구자들은 질문-답변의 대화 형식으로 생의학 문헌에서 정보를 찾는 데 활용될 수 있습니다. 또한 의료 회사에서는 연구자들이 신약 개발을 위해 이 모델을 활용할 수도 있습니다.


4. 금융

  • 재무 업무 효율 향상

블룸버그GPT가 금융 관련 및 일반 목적의 두 가지 광범위한 NLP 작업 범주에서 수행하는 방식. (출처: 블룸버그)

금융 기술 영역에서 NLP는 비정형 데이터를 이해하는 데 큰 도움이 될 수 있습니다. 금융 특화 머신러닝은 금융 문서 분류, 문맥에 따른 개체 인식, 데이터 증강 등 금융 관련 작업을 수행하도록 교육받습니다. 고급 분석 기능을 제공하고, 반복적인 작업을 자동화하며, 의사 결정을 개선함으로써 금융 산업에 혁신을 가져올 수 있습니다.

블룸버그GPT는 블룸버그의 NLP 애플리케이션을 강화하여 향상된 금융 업무 수행 및 질의응답을 제공하는 최초의 금융 중심 LLM입니다. 이것의 또 다른 특징은 전문화된 쿼리 언어를 생성하고 해당 분야에 적합한 콘텐츠를 생성할 수 있다는 점입니다.


  • 재무 관련 Q&A

출처: KAI Answers 데모 2023

Kasisto는 금융 특화 LLM의 또 다른 실제 적용 사례입니다. 이는 은행 및 금융을 위한 대화형 AI 솔루션으로, 금융 기관이 브랜드의 지향점 및 아이덴티티 안에서 직원과 고객의 요구를 모두 충족하는 서비스를 적합하게 제공할 수 있도록 지원합니다.

은행을 위해 특별히 설계된 LLM은 개인 데이터 보안을 보호하면서 은행 사용 사례에 대한 정확하고 신뢰할 수 있는 답변을 제공합니다. 이를 통해 일선 은행 직원들은 탁월한 고객 서비스를 제공할 수 있습니다. 또한 KAI-GPT를 기반으로 하는 KAI Answers는 은행 직원들이 더 나은 고객 서비스를 제공할 수 있도록 지원합니다.


5. 커머스

  • 이커머스 맞춤형 AI

이커머스 비즈니스를 위한 생성형 AI 서비스를 구축한 AI 기업 Upstage와 이커머스 데이터 플랫폼 기업 ConnectWave

커머스 업계에서도 혁신을 가속화하기 위해 도메인 특화 LLM이 적용되고 있습니다. 업계에서는 기술 적용을 통해 초개인화 기능을 강화하고, 고객과의 실시간 상호작용을 촉진하며, 검색 환경을 최적화와, 다양한 운영 프로세스를 간소화할 수 있습니다.

이커머스 데이터 플랫폼 회사인 '커넥트웨이브'와 AI 회사인 '업스테이지 '가 체결한 파트너십이 하나의 사례입니다. 지난 9월, 두 회사는 이커머스 비즈니스를 위한 개인 생성형 AI 기반 대규모 언어 모델을 구축하기 위해 파트너십을 맺었습니다. AI 기술을 적용함으로써 사용자는 필요한 제품을 쉽게 찾고 관심사에 따라 향상된 추천 기능을 경험할 수 있습니다. 이러한 기능은 소비자의 쇼핑 만족도를 높일 것으로 기대됩니다. 또한 초개인화 지원, 배송 추적 및 문의 자동화, 쇼핑몰 요약 리뷰 제공, 콘텐츠 마케팅 효율화 등을 지원하게 될 예정입니다.

도메인 특화 LLM의 잠재력 활용하기

이처럼 다양한 활용 사례를 통해 간단한 작업 자동화부터 복잡한 작업 처리에 이르기까지, 도메인 특화 언어 모델의 무한한 가능성을 발견할 수 있었습니다. 계속해서 발전하는 기술에 따라 앞으로 산업 전반에서 어떠한 흥미로운 혁신이 또 이루어질 것인지 기대되고 있습니다. 여러분도 도메인 특화 LLM을 활용해 비즈니스의 잠재력을 발휘할 준비가 되셨나요? 작지만 강력한, 비즈니스 맞춤형 SLM으로 활용할 수 있는 'Solar Mini'를 통해 여러분의 비즈니스 성장을 도모해 보세요!

원본 게시물에서 이 양식 보기