업스테이지, 차세대 LLM '솔라 프로' 프리뷰 공개
Solar Pro는 단일 GPU에서 실행되도록 최적화된 가장 지능적인 LLM으로, Microsoft, Meta, Google과 같은 거대 기술 기업의 모델을 능가하는 성능을 자랑합니다.
캘리포니아주 산호세, 2024년 9월 11일 - Upstage는 오늘 차세대 대규모 언어 모델(LLM)인 Solar Pro의 프리뷰 버전을 출시했다고 발표했습니다. 무료 API 액세스가 가능한 오픈 소스 모델로 제공되는 이 프리뷰 버전은 11월 공식 출시에 앞서 개발자와 기업이 모델을 테스트하고 피드백을 제공할 수 있는 기회를 제공합니다.
Solar LLM 시리즈의 플래그십 모델인 Solar Pro는 이전 모델인 Solar Mini보다 두 배 이상 큰 220억 개의 파라미터를 지원합니다. 크기가 커졌음에도 불구하고 Solar Pro는 업스테이지의 독점적인 뎁스업 스케일링(DUS) 방식과 고급 데이터 레시피 덕분에 단일 GPU에서 효율적으로 실행되도록 최적화되었습니다. 이러한 혁신을 통해 Solar Pro는 모델 크기를 크게 줄이면서도 최첨단 성능을 제공할 수 있으며, 이는 GPU 비용 상승과 공급 제약이 있는 AI 환경에서 필수적인 이점입니다.
Solar Pro의 고급 기능은 주요 LLM 벤치마크에서 인상적인 향상을 가져왔으며, Solar Mini에 비해 평균 51% 향상되었습니다. 14개 영역에 걸친 다분야 언어 이해 및 추론을 측정하는 MMLU Pro 벤치마크에서 52.11점의 정확도 점수를 획득했습니다. 또한 솔라 프로는 84.37점의 IFEval 벤치마크에서도 우수한 성적을 거두며 인간과 비슷한 수준의 지능으로 복잡한 지시를 따르는 능력을 보여주었습니다.
이러한 결과는 Microsoft의 Phi 3 Medium, Meta의 Llama 3.1 8B, Mistral NeMo 12B, Google의 Gemma 2 27B 등 주요 기술 회사의 비슷한 크기의 모델보다 뛰어납니다. Solar Pro는 매개변수 수가 3배나 많은 Llama 3.1 70B와 같이 여러 개의 GPU를 필요로 하는 훨씬 더 큰 모델과도 경쟁합니다. 일반 작업과 특수 작업 모두에서 새로운 표준을 설정함으로써 Solar Pro는 현재 시장에서 가장 지능적이고 효율적인 LLM으로 자리매김하고 있습니다.
업스테이지의 CEO인 성 킴은 "이미 Solar LLM 시리즈로 전 세계 AI 시장에 큰 영향을 끼친 데 이어, 단일 GPU에서 실행되는 가장 지능적인 LLM인 Solar Pro로 그 한계를 더욱 확장하게 되어 매우 기쁩니다."라고 말했습니다. "소규모 언어 모델 성능의 기준을 한 단계 끌어올린 Solar Pro 프리뷰를 개발자와 기업이 직접 체험해 보시기 바랍니다."
솔라 프로의 고급 기능을 통해 기업은 산업 전반에 걸쳐 다양한 작업을 자동화하고 간소화할 수 있습니다. 의료 분야에서는 환자 기록을 분석하고, 임상 요약을 생성하며, 의학 연구를 지원합니다. 금융 분야에서는 재무 분석을 수행하고, 보고서 초안을 작성하며, 맞춤형 투자 조언을 제공합니다. 법률 서비스에서는 계약서를 검토하고, 법률 문서를 요약하며, 법률 연구를 지원하는 등 생산성과 효율성을 높이는 데 없어서는 안 될 도구로 활용되고 있습니다.
Solar Pro 프리뷰는 11월 정식 출시 전까지 상용 애플리케이션을 포함한 오픈 소스 모델로서 무료 API 액세스와 함께 공개적으로 사용할 수 있습니다. 이 프리뷰 버전은 영어 입력을 지원하며 4,096개의 토큰으로 구성된 컨텍스트 창을 제공합니다.