ACROFAN

업스테이지, AWS 기반 소형언어모델(SLM) 출시

기사입력 : 2024년 03월 21일 09시 23분
ACROFAN=Newswire | newswire@acrofan.com SNS
아마존웹서비스(Amazon Web Services, 이하 AWS)는 오늘 한국의 대표적인 인공지능(AI) 스타트업 업스테이지(Upstage)가 AWS에서 자사의 주력 제품인 솔라 미니(Solar Mini) 소형언어모델(SLM)을 출시했다고 발표했다. 솔라 미니는 한국어와 영어로 이해와 요약, 번역 및 새로운 콘텐츠 예측 등 다양한 언어 작업을 수행하도록 쉽게 맞춤화하고 미세 조정(fine-tuning)할 수 있는 다목적 모델로, 추후 태국어와 일본어로도 제공될 예정이다. 업스테이지 고객들은 솔라 미니를 활용해 자사 모델을 처음부터 훈련시킬 필요 없이 생성형 AI를 쉽게 시작할 수 있으며, 산업별 사용 사례에 적합한 새로운 애플리케이션을 출시할 수 있다.

오늘부터 솔라 미니는 파운데이션 모델(FM)을 제공하는 머신러닝(ML) 허브인 아마존 세이지메이커 점프스타트(Amazon SageMaker JumpStart)와 타사 소프트웨어 공급업체의 솔루션을 쉽게 배포할 수 있는 AWS의 엄선된 디지털 카탈로그인 AWS 마켓플레이스(AWS Marketplace)에서 만나볼 수 있다. 업스테이지 고객들은 메타버스 엔터테인먼트(Metaverse Entertainment), 쿼라(Quora), 커넥트웨이브(ConnectWave), 콴다(Qanda) 등 국내외 기업에서 이미 사용하고 있는 도메인별 학습 데이터를 활용해 솔라 미니를 미세 조정할 수 있다.

윤정원 AWS코리아 공공부문 대표는 "AWS상에 구축된 업스테이지의 솔라 미니는 모든 규모의 기업이 다양한 지역의 요구사항에 따라 생성형 AI를 쉽게 도입할 수 있도록 지원하는 강력한 솔루션이다”라며, "언어 모델은 빠르게 진화하고 있으며, 이러한 혁신의 최전선에는 AWS의 안전하고 확장 가능한 스택(stack)이 있다. 업스테이지는 이런 역량을 활용해 AI 제품을 확장하고, 다양한 산업에 생성형 AI를 애플리케이션에 쉽게 배포할 수 있는 도구를 제공하고 있다. "고 말했다.

언어 모델은 컨텍스트, 메모리 기능 및 텍스트 생성을 제공해 생성형 AI 서비스를 가능케 한다. SLM은 수천억 개의 파라미터를 사용하는 대규모 언어 모델(LLM)에 비해 경량으로, 200억 개 미만의 파라미터를 사용한다. 솔라 미니는 107억 개의 파라미터로 구성된 더 작은 학습 데이터세트로 추론(학습된 ML 모델을 사용해 새로운 입력 데이터를 기반으로 예측을 수행하는 과정)을 더 낮은 비용으로 실행할 수 있다.

김성훈 업스테이지 대표는 "업스테이지는 사업 시작 단계부터 글로벌 AI 플레이어로 거듭날 수 있도록 준비해왔다"며 "업스테이지는 AWS를 클라우드 우선 사업자로 선정하고, 크레딧과 기술 지원을 제공하는 AWS 액티베이트(AWS Activate) 등의 지원 프로그램을 통해 업스테이지의 스타트업 여정을 시작하고 비즈니스를 빠르게 확장했다. 아마존 세이지메이커 점프스타트에서의 솔라 미니 모델 출시로 전 세계 기업들이 한국에서 가장 높은 다목적성을 갖춘 LLM을 이용할 수 있는 새로운 가능성을 열었으며, 이를 통해 AWS와의 협업을 한층 강화하게 되어 기쁘다. 업스테이지는 AI 환경을 재정의하고 기업 애플리케이션을 위한 가장 안정적이고 혁신적인 AI 솔루션을 제공하기 위해 최선을 다하고 있다"고 말했다.

업스테이지는 솔라 미니를 학습시키기 위해 우수한 컴퓨팅 성능과 비용 효율성을 갖춘 AWS를 선택했다. 한국어에 특화된 LLM 개발을 위해 ML 모델 개발 및 배포 서비스인 아마존 세이지메이커(Amazon SageMaker)를 활용했으며, 업스테이지가 설립한 업계 얼라이언스인 1T 클럽(1조 토큰 클럽)에서 제공한 데이터를 사용했다. 여기에는 업스테이지의 고급 데이터 전처리(입력 데이터를 학습에 사용하기 전에 준비 및 정리하는 단계)와 검색 증강 생성(Retrieval-Augmented Generation, RAG – LLM의 출력을 최적화하는 과정) 등의 미세 조정 기술을 사용했다. 텍스트, 서적, 뉴스 기사, 보고서, 논문 등 저작권이 없는 다양한 고품질 한국어 학습 데이터로 구성된 이 데이터는, 문화적 뉘앙스에 대한 솔라 미니의 이해를 발전시키는 동시에 응답의 정확도를 높여 잘못되거나 부적절한 답변을 생성하는 'AI 할루시네이션(AI hallucination)'을 방지한다.

2023년 12월, 솔라 미니는 글로벌 AI 플랫폼 허깅페이스(HuggingFace)의 오픈 LLM 리더보드(Open LLM Leaderboard)에서 모델의 추론, 상식 추론, 할루시네이션 방지, 컨텍스트 이해, 사실 정확도 등을 아우르는 우수한 설계로 74.2점을 기록하며 최고의 오픈소스 대규모 SLM AI 모델로 인정받았다. 이와 같은 인정은 솔라 미니가 더 큰 모델과 동등하거나 그 이상의 성능을 발휘해 복잡한 언어 작업을 효율적으로 수행할 수 있는 그래픽 처리 장치(GPU) 비용을 대폭 절감할 수 있음을 입증한다.

- 전 산업에서 생성형 AI 혁신 가속화

이커머스 솔루션 제공업체인 커넥트웨이브(ConnectWave)는 자사 가격비교 웹사이트인 다나와와 에누리에서 전자상거래 현대화, 배송 추적, 문의 및 반품 상담을 자동화하기 위해 14억 개의 제품에 대한 자체 데이터를 솔라 미니로 학습시켜 프라이빗 LLM을 구축했다. 손경성 커넥트웨이브 수석 부사장은 "업스테이지의 고급 모델을 AWS상의 데이터세트와 원활하게 통합해 이커머스 애플리케이션을 위해 특별히 설계된 맞춤형 프라이빗 LLM을 성공적으로 구축했다"고 말했다.

에듀테크 기업인 콴다는 업스테이지와 협력해 학생들에게 수학적 능력을 향상시키는 데 필요한 도구를 제공하고 있다. 콴다는 솔라 미니를 통해 수학적 추론을 토대로 문제를 해결하고 설명과 함수를 공식화할 수 있는 특화된 언어 모델을 개발하고 있다. 조민규 콴다(매스프레소) 사업본부장은 "업스테이지와의 파트너십을 통해 최첨단 모델 개발을 가속화하고 학생들에게 새로운 기능을 제공할 수 있게 됐다"고 말했다.

AWS는 2023년 10월, 클라우드 서비스에 대한 국내 고객의 수요 증가에 대응하기 위해 2027년까지 국내 클라우드 인프라에 7조 8,500억 원(미화 약 58억 8,000만 달러)을 투자할 계획이라고 발표했다. 이번 투자는 2027년까지 한국의 국내총생산(GDP)에 15조 6천억 원(미화 약 112억 8천만 달러)을 기여하고, 연평균 12,325개의 전일제 환산(FTE) 일자리 창출을 지원할 전망이다.

Copyright ⓒ Acrofan All Right Reserved.

디지털 마케팅의 새로운 장을 만들다! 신개념 퍼포먼스마케팅 플랫폼 '텐핑'

[명칭] 아크로팬   [제호] 아크로팬(ACROFAN)    [발행인] 유재용    [편집인] 유재용    [청소년보호책임자] 유재용
Copyright © ACROFAN All Right Reserved