ACROFAN

오라클, 신규 혁신 기술 ‘MySQL 히트웨이브 ML’ 발표

기사입력 : 2022년 04월 05일 09시 45분
ACROFAN=Newswire | newswire@acrofan.com SNS
오라클이 오라클 MySQL 히트웨이브(Oracle MySQL HeatWave: 오라클 클라우드 인프라스트럭처(OCI) 상에서 MySQL 데이터베이스 서비스를 지원하는 인메모리 쿼리 가속기)에 데이터베이스 내 머신러닝(ML) 기능을 추가했다. 오라클은 기존 트랜잭션 프로세싱과 분석에 이번에 출시한 머신러닝 기능을 추가하며 MySQL 클라우드 데이터베이스 서비스 중 해당 기능을 제공하는 유일한 업체가 되었다.

MySQL 히트웨이브 ML(MySQL HeatWave ML)은 머신러닝의 수명 주기를 완전 자동화하고 학습된 모델 모두를 MySQL 내에 저장해, 외부의 머신러닝 도구나 서비스로 데이터와 모델을 이동하지 않아도 된다. ETL(추출, 변환 및 적재) 절차가 사라지며 애플리케이션 복잡성과 비용이 감소하고 머신러닝 모델과 데이터의 보안성이 개선되었다. 히트웨이브 ML 기능은 전 세계 37개의 모든 오라클 클라우드 인프라스트럭처(OCI) 리전에서 MySQL 히트웨이브 데이터베이스 클라우드 서비스에 포함되어 제공된다.

MySQL 애플리케이션에 머신러닝 기능을 추가하는 일은 아직까지도 많은 개발자들이 오랜 시간을 소모하는 고난이도의 작업이다. 이를 위해 먼저 데이터베이스에서 자료를 추출하여 다른 시스템에 옮긴 후 머신러닝 모델을 만들고 구축하는 과정을 거쳐야 한다. 이러한 접근 방식으로는 애플리케이션 데이터가 머신러닝에 적용되는 과정에서 다수의 데이터 사일로 현상이 나타나고 데이터 이동으로 인해 지연 시간이 발생한다. 또 급증하는 데이터로 인해 데이터베이스의 보안 취약점이 증가하고 개발자가 프로그램을 작성하는 환경이 다양해져 복잡성이 증가한다. 또한 기존 서비스를 고려하여 머신러닝 모델을 학습시키는 과정에는 개발자의 전문적인 지식이 필요하다. 이를 만족하지 못할 경우 최적화된 모델을 보장할 수 없기에 예측의 정확성은 감소한다. 마지막으로 대부분의 기존 머신러닝 솔루션은 개발자가 구축한 모델이 어떻게 그러한 결과를 예측하게 되었는 지에 대한 이유를 설명해주지 않는다.

이번에 새롭게 소개된 MySQL 히트웨이브 ML은 머신러닝 기능이 MySQL 데이터베이스 내에 기본으로 통합되어 데이터를 다른 서비스로 옮기는 ETL 과정이 필요 없기 때문에 이러한 문제가 해결된다. 완전 자동화된 히트웨이브 ML의 모델 학습 프로세스는 주어진 데이터 세트에서 지정된 작업에 최적화된 특징(feature)과 초매개변수(hyper-parameter), 알고리즘을 갖춘 모델을 생성한다. 또한, 히트웨이브 ML에서 생성한 모든 모델과 예측 결과에는 설명도 함께 제공된다.

오라클은 뉴머라이(Numerai), 노마오(Nomao), 은행권 마케팅(Bank Marketing) 등의 데이터 세트를 비롯해 분류 및 회귀 분석 작업을 위해 일반에 공개된 다양한 머신러닝 데이터의 벤치마크* 결과를 공개하였다. 가장 작은 클러스터로 구성된 머신러닝 모델의 경우, 히트웨이브 ML은 아마존 레드시프트 ML 대비 평균 1%의 비용으로 25배 빠른 학습이 가능하다. 또한, 더 큰 규모의 히트웨이브 클러스터에서 학습할 경우, 레드시프트 ML 대비 성능 향상폭은 더욱 증가한다. MySQL 히트웨이브 이용자들은 기존에 많은 시간이 소요되던 훈련을 빠른 시간 안에 효율적으로 완료할 수 있기에 주기적인 모델 재학습을 통해 잦은 데이터 변경 사항도 반영할 수 있어 모델을 최신 상태로 유지할 뿐 아니라 예측의 정확성 또한 향상시킨다.

에드워드 스크리븐(Edward Screven) 오라클 총괄 아키텍트는 “오라클은 지난 해 이미 단일 데이터베이스에 분석과 트랜잭션 처리 기능을 통합했던 것처럼, 이번에는 MySQL 히트웨이브 내에 머신러닝을 통합하게 된 것이다”며 “MySQL 히트웨이브는 오라클에서 가장 빠른 성장세를 자랑하는 클라우드 서비스 중 하나다. 아마존 및 기타 클라우드 데이터베이스 서비스를 사용하던 고객들이 MySQL 히트웨이브로 마이그레이션하는 사례가 증가하고 있으며 놀라운 성능 개선 및 비용 절감 효과가 입증되고 있다. 이번에 발표된 여러 가지 혁신적 기능들은 히트웨이브의 성능 향상뿐만 아니라 가용성을 개선하는 동시에 비용도 절감해준다. 오라클이 새롭게 발표한 벤치마크 결과는 스노우플레이크, AWS, 마이크로소프트, 구글과 비교 시 MySQL 히트웨이브가 더욱 빠르고 더 저렴하다는 사실을 다시 한번 분명하게 보여주었다”고 강조했다.

기타 클라우드 데이터베이스 서비스 대비 히트웨이브 ML 기능의 장점은 다음과 같다.

· 완전 자동화된 모델 교육(Fully Automated Model Training): 히트웨이브 ML은 모델을 생성하는 모든 개별 단계가 완전히 자동화되어 개발자의 개입이 필요 없다. 이는 별도의 수작업 없이도 완료되는 훈련 프로세스와 더욱 정확한 결과를 얻을 수 있도록 잘 훈련된 모델로 이어진다. 아마존 레드시프트와 같은 여타 클라우드 데이터베이스 서비스의 경우 데이터베이스 서비스에 머신러닝 통합 기능이 포함되지 않으며 머신러닝 학습 과정에서 개발자의 광범위한 수작업이 필요하다

· 모델 및 추론 설명(Model and Inference Explanations): 모델과 함께 설명이 제공되어 개발자가 머신러닝 모델의 행동을 이해할 수 있도록 돕는다. 예를 들어, 은행에서는 고객의 대출이 거부된 경우, 모델이 어떠한 매개변수를 고려했는지, 모델에 편향된 부분이 존재하는지를 확인할 수 있어야 한다. 예측의 설명가능성(explainability)은 머신러닝 모델이 특정 결과를 예측한 이유를 알려주는 기술이다. 오늘날 머신러닝 모델을 기반으로 내린 결정에 대한 기업의 설명이 필수화되면서 예측 설명의 중요성이 커지고 있다. 히트웨이브 ML은 모델 학습 과정의 일부로서 모델 설명과 예측 설명을 통합한다. 따라서 히트웨이브 ML에서 생성된 모든 모델은 모델뿐 아니라 추론 설명을 함께 제공하고, 이 덕분에 추론 설명을 위해 데이터를 학습하는 시간이 별도로 필요하지 않다. 오라클은 기존의 설명 기술을 강화하여 성능과 해석능력, 품질을 개선하였다. 다른 클라우드 데이터베이스 서비스는 머신러닝 모델을 위해 이와 같이 풍부한 설명 기능을 제공하지 않는다.

· 초매개변수 조정(Hyper-Parameter Tuning): 히트웨이브 ML은 초매개변수를 조정하기 위해 경사탐색(gradient search-based) 기반의 새로운 환산 알고리즘(reduction algorithm)을 구현한다. 이는 모델의 정확도를 훼손하지 않으면서도 초매개변수의 병렬 탐색이 가능하다. 머신러닝 모델 훈련에서 가장 많은 시간이 소요되는 초매개변수 조정 단계에 히트웨이브 ML의 이 독보적인 기능을 사용할 경우 다른 클라우드 서비스 대비 머신러닝 모델 구축 성능의 강점이 더욱 잘 드러난다.

· 알고리즘 선택(Algorithm Selection): 프록시 모델(proxy model)은 복합적인 모델 전체의 특징들을 보여주는 단순한 모델을 말한다. 히트웨이브 ML은 이러한 프록시 모델 개념을 사용하여 학습을 위한 최적의 머신러닝 알고리즘을 결정한다. 간단한 프록시 모델을 이용해 정확도의 손실 없이 알고리즘을 효율적으로 선택할 수 있다. 다른 데이터베이스 서비스의 경우 머신러닝 모델 구축을 위한 프록시 모델 기능은 없다.

· 지능형 데이터 샘플링(Intelligent Data Sampling): 히트웨이브 ML은 모델 훈련 과정에서 적은 비율의 데이터를 샘플링하여 성능을 향상시킨다. 이러한 방식은 데이터 세트에서 대표적인 데이터 지점을 모두 수집할 수 있다. 다른 클라우드 서비스의 경우 머신러닝 모델 구축에 무작위 데이터 샘플링을 사용하여 상대적으로 효율성이 저하된다. 또한 샘플링되는 비율이 낮아져 데이터의 분산 특성 또한 고려할 수 없다.

· 특징 선택(Feature Selection): 특징 선택은 머신러닝에서 학습하고자 하는 데이터의 특징을 선택할 때 도움을 주며 이는 예측을 생성하는 머신러닝 모델의 행동에 영향을 미친다. 해당 기능을 위해 히트웨이브 ML에서 사용된 기술은 다양한 분야와 애플리케이션에서 광범위한 데이터를 대상으로 훈련되었다. 히트웨이브 ML은 이렇게 수집된 통계와 메타정보에서 새로운 데이터 세트에서도 관련 특징을 효율적으로 판별할 수 있다.

오라클은 머신러닝 기능 외에도 MySQL 히트웨이브 서비스를 위한 다양한 혁신 기능을 공개하였다. 실시간 탄력성(real-time elasticity)은 히트웨이브 고객이 노드 숫자에 상관없이 클러스터의 크기를 확대, 축소할 수 있도록 한다. 이 과정에서 시스템 운영이나 쓰기 작업이 중단되지 않으며 클러스터의 리밸런싱(rebalancing)도 불필요하다. 또한 데이터 압축(data compression) 기능은 고객의 노드당 데이터 처리량을 2배로 늘리고 비용은 50% 가까이 줄이면서도 가격 대비 성능을 동일하게 유지한다. 비용 절감을 위해 고객이 히트웨이브를 잠시 중지할 수 있는 일시 정지 및 재가동(pause-and-resume) 기능도 새롭게 추가되었다. 재가동 시에는 MySQL 오토파일럿에 필요한 데이터와 통계가 히트웨이브에 자동으로 로드된다.

- 고객과 파트너가 인정한 MySQL 히트웨이브의 탁월한 지속가능성

어스투트 비즈니스 솔루션(Astute Business Solutions)은 최고의 오라클 클라우드 MSP 파트너이다. 아르빈드 라잔(Arvind Rajan) 어스투트 비즈니스 솔루션 공동 설립자 겸 CEO는 “최근 히트웨이브 ML의 머신러닝 기능을 사용해 볼 기회를 가졌다. 매우 혁신적인 기능으로 사용 또한 빠르고 간편했으며 무엇보다도 데이터나 모델을 데이터베이스와 분리할 필요가 없기에 보안이 우수하다는 점을 알 수 있었다"며 "우리 고객들이 데이터베이스 안에 탑재된 머신러닝에 큰 흥미를 보일 것이라고 생각되며 이에 MySQL 히트웨이브 도입을 더욱 가속화할 계획이다"고 밝혔다.

일본의 비디오 게임 설계, 개발, 운영업체 지니어스 소노리티(Genius Sonority)의 마사유키 카와모토(Masayuki Kawamoto) CTO는 "MySQL 히트웨이브로 90배까지 향상된 성능 덕분에 실시간 분석을 위한 데이터 이전 과정의 어려움과 우려를 모두 해결할 수 있었고 그 결과에 정말 놀라지 않을 수 없었다. 이 성능 개선으로 전 세계 게임 유저들의 경험을 지속적으로 향상할 수 있게 되었다"고 말했다.

칼 올롭슨(Carl Olofson) IDC 데이터 관리 소프트웨어 연구 부사장은 “오라클이 지난 8월 발표한 MySQL 히트웨이브 오토파일럿은 오픈소스 클라우드 데이터베이스 분야에서 지난 20년 사이 가장 놀라운 혁신이었다”면서 "이제 오라클은 히트웨이브에 OLTP와 OLAP를 통합했던 오리지널 버전의 혁신을 MySQL 히트웨이브 ML로 넘어서게 되었다. 오라클은 모든 머신러닝 프로세싱 및 모델을 데이터베이스 내에 탑재함으로써 고객이 머신러닝 데이터베이스를 코어 데이터베이스와 별도로 관리해야 하는 수고를 덜어주었다. 동시에 번거로운 ETL이 사라지며 더욱 빠른 속도와 정확도, 비용 효율성까지 한꺼번에 누릴 수 있게 되었다"고 덧붙였다.

###

* 해당자료는 오라클이 발표한 머신러닝 데이터의 벤치마크 결과를 바탕으로 하고 있으며, 해당 자료는 오라클 홈페이지에서 확인 가능하다:

https://www.oracle.com/mysql/heatwave/performance/

Copyright ⓒ Acrofan All Right Reserved.

디지털 마케팅의 새로운 장을 만들다! 신개념 퍼포먼스마케팅 플랫폼 '텐핑'

[명칭] 아크로팬   [제호] 아크로팬(ACROFAN)    [발행인] 유재용    [편집인] 유재용    [청소년보호책임자] 유재용
Copyright © ACROFAN All Right Reserved