SAAS - 대규모 언어 모델에서 향상된 수학적 추론을 위한 해결 능력 증폭 전략
26/06/2024 | 작성자: 전영훈, 김현우, 김경진, 김윤기, 김지후, 김병주, 이원석, 박찬준
최신 연구 논문인"SAAS: 대규모 언어 모델에서 향상된 수학적 추론을 위한 해결 능력 증폭 전략"의 발간을 발표하게 되어 기쁘게 생각하며, 업스테이지 AI와 Mathpresso Inc. 이 논문은 대규모 언어 모델(LLM)의 수학적 추론과 문제 해결 능력을 크게 향상시키기 위해 고안된 새로운 학습 접근법을 소개합니다. SAAS는 생각의 연결망(CoT)과 생각의 프로그램(PoT) 학습 방법론의 전략적 통합을 통해 AI 기반 수학적 추론 분야에서 중요한 진전을 이루었습니다.
SAAS란 무엇인가요?
SAAS(해결 능력 증폭 전략)는 CoT 학습을 통해 논리적 추론 능력을 먼저 향상시킨 다음, 문제 해결 능력을 강화하는 순차적 학습 전략으로, PT 학습으로 문제 해결 능력을 강화하는 것을 목표로 합니다. CoT 학습은 복잡한 문제를 중간 추론 단계로 분해하는 방식으로 논리적 사고력을 향상시키지만 큰 숫자에 대한 산술적 오류가 발생할 수 있습니다. 반대로 PoT 학습은 이러한 추론 단계를 코드로 표현하여 코드 인터프리터에 계산을 위임하므로 계산 오류를 줄일 수 있지만 논리적 추론이 부족할 수 있습니다. SAAS는 이 두 가지 방법론을 효과적으로 결합하여 처음에는 CoT 학습으로 논리적 추론을 향상시키고, 이후에는 PoT 학습으로 문제 해결 능력을 향상시킵니다.
SAAS의 아키텍처
SAAS 아키텍처는 구조화된 학습 과정을 통해 LLM의 추론 및 계산 능력을 모두 최적화하도록 세심하게 설계되었습니다. 다음은 그 구성 요소에 대한 자세한 분석입니다:
생각의 사슬 학습(CoT)
목표: LLM의 논리적 추론 능력을 향상시킵니다.
방법: 모델은 각 문제가 인간의 문제 해결 과정을 모방한 일련의 중간 단계로 분해되는 CoT 추론으로 구성된 데이터로 훈련됩니다. 이 단계에서는 음의 로그 가능성을 최소화하여 일관되고 논리적으로 건전한 추론 단계를 생성하기 위한 모델 파라미터를 최적화하는 데 중점을 둡니다.
결과: 이 모델은 논리적인 단계별 설명을 생성하는 방법을 학습하여 복잡한 수학적 추론을 위한 탄탄한 기반을 마련합니다.
사고 학습(POT)
목표: 계산 오류를 줄여 문제 해결 능력을 향상시킵니다.
방법: CoT 단계에서 개발한 논리적 추론 기술을 바탕으로 추론 단계를 코드로 표현하는 PoT 추론을 사용하여 모델을 추가로 훈련합니다. 이 단계에서는 모델이 이전에 습득한 추론 기술을 잊어버리지 않도록 CoT와 PoT 추론을 혼합하여 인지 유지 전략을 통합합니다.
결과: 이 모델은 논리적 추론 능력을 유지하면서 향상된 계산 정확도를 달성하여 까다로운 수학 문제를 해결하는 데 탁월한 성능을 발휘합니다.
연구 결과
경험적 연구에 따르면 SAAS는 GSM8K 및 MATH를 비롯한 여러 벤치마크에서 최첨단(SOTA) 성능을 달성하는 것으로 입증되었습니다. 특히 SAAS는 비슷한 규모의 다른 모든 모델을 능가하는 성능을 보여 순차적 학습 접근 방식의 효율성을 강조했습니다.
SAAS 모델은 지속적으로 우수한 결과를 제공하여 기존 방법론에 비해 크게 개선되었음을 나타냅니다. 예를 들어, 107억 개의 파라미터를 사용한 SAAS는 70억 개의 모델에 필적하는 성능을 보여주며 접근 방식의 효율성을 강조했습니다.
결론
결론적으로 SAAS는 대규모 언어 모델의 수학적 추론과 문제 해결 능력을 향상시키는 데 있어 큰 진전을 이루었습니다. 연쇄적 사고와 프로그램 학습의 강점을 결합한 SAAS는 수학적 문제 해결에 직면한 과제에 대한 포괄적인 솔루션을 제공합니다. 우리의 연구는 인지 유지 전략으로 보완된 순차적 학습 접근 방식이 LLM의 해결 능력을 크게 증폭시켜 AI 및 수학적 추론 분야에서 이정표를 세웠다는 것을 입증합니다.
SAAS가 어떻게 LLM의 수학적 추론과 문제 해결 능력을 향상시킬 수 있는지 알아보세요. 전문가와 연결하여 자세히 알아보세요!