ACROFAN

팍사타 데이터 프렙 솔루션 런칭 기념 기자간담회

기사입력 : 2016년 05월 25일 14시 08분
ACROFAN=권용만 | yongman.kwon@acrofan.com SNS
잘레시아(Zalesia)는 지난 5월 24일 서울 강남구 그랜드인터컨티넨탈 호텔에서 기자간담회를 통해, 미국 ‘팍사타(Paxata)’와 파트너십을 밎고 데이터 프리퍼레이션(Data Preparation)솔루션 ’팍사타’를 국내 시장에 공식으로 선보였다고 소개했다.

데이터 프리퍼레이션은 현업 사용자들이 비즈니스 분석을 위해 데이터를 취합, 가공하는 복잡하고 반복적인 작업을 자동화하거나 용이하게 만드는 최신 기술 분야다. ‘팍사타’는 엔터프라이즈급 대용량 데이터 처리를 지원하는 데이터 프리퍼레이션 솔루션으로, 하둡, 스파크, 머신 러닝, 시맨틱 분석, NLP 알고리즘, 패턴 인식 등의 최신 기술을, 최신 기술에 익숙하지 않은 현업 사용자들도 쉽게 사용해 분석을 위한 정보를 준비할 수 있도록 한다.

‘팍사타’는 내, 외부에 다양하게 산재하는 정제되지 않은 대용량 데이터에서 유의미한 정보를 얻기를 원하는 데이터 사이언티스트는 물론, IT 지식이 없는 일반 사용자들도 손쉽게 데이터를 수집, 가공하여 필요한 정보를 찾을 수 있도록 하는 것이 특징이다. 한편 잘레시아는 이번 파트너십 체결을 통해 한국을 포함한 아시아태평양 지역에 ‘팍사타’의 공급을 시작했으며, 팍사타는 잘레시아와의 파트너십을 통해 아태 지역에서 비즈니스를 빠르게 확장해 나갈 것으로 소개되었다.

 
▲ 프라카시 난두리 팍사타 CEO

프라카시 난두리(Prakash Nanduri) 팍사타 CEO는 이 자리에서, 1990년대 말 정도를 생각해 보면 엔터프라이즈 데이터 관리에서는 여러 시스템에서 데이터를 가져와서 통합하는 것이 과제였고, MDM은 기업 내에서 데이터 관련 전략을 수립하는 데 중요한 요소였다고 소개했다. 하지만 이제는 엔터프라이즈 내에서 정보를 관리해야 하는 시대에 진입했고, 웹의 확산은 개인의 삶에서 정보를 생각의 속도에 가깝게 빠르게 얻을 수 있는 세상을 만들었다고 덧붙였다.

개인적인 삶은 빠르게 정보를 얻어, 의사결정에 도움받을 수 있는 세상이 된 데 비해, 업무 환경에서 예측 분석 등으로 비즈니스에서 통찰력을 얻는 등의 정보 활용 측면은 이에 크게 미치지 못하고 있다. 그리고 이는 간단한 질문에 답을 구하기 위해 데이터를 분석하는 시간이 너무 길어서, 정보 활용의 속도와 폭이 제한적이었던 것이라고 지적되었다. 이에 최근의 상황은 ‘데이터’는 너무 많지만, 정작 필요한 ‘정보’는 없어 목말라하는 상황이라고 덧붙였다.

원천 데이터와 정보는 분명 다르고, 비즈니스 운영은 정제된 형태의 ‘정보’를 기반으로 한다. 정보가 없이 원천 데이터만 있다면 분석이 불가능하고 통찰력을 얻을 수 없으며, 이것이 비즈니스가 현재 직면한 문제이기도 하다고 소개되었다. 그리고 원천 데이터와 정보는 다르며, 정보는 완벽하고 정제되어 있고, 의미가 부여되어 있고 소비가 가능한 형태라는 특징이 있고, 원천 데이터를 모든 비즈니스 수요에 활용할 수 있는 ‘정보’로 만드는 과정이 어렵다는 것이 직면한 과제라고 덧붙였다.

 
▲ 팍사타가 보는 비전문가를 포함하는 사용자 시장은 기존보다 훨씬 큰 규모다.

데이터를 정보로 만드는 과정이 현재 가진 문제로는 사용자의 수동 개입 요구, IT 주도의 프로세스, 관계형 정형 데이터 중심 등의 특징이 꼽혔으며, 기존의 방법은 미래의 비즈니스 요구에는 효율적으로 대응할 수 없다는 점이 지적되었다. 그리고 미래의 비즈니스 요구로는, 비즈니스 영역이 주도하는 프로세스, 자동화, 그리고 비관계형과 비정형 데이터를 다룰 수 있는 능력 등이 꼽혔으며, 데이터의 양이나 생산 속도, 다양성 등 특성도 바뀌고 있다고 덧붙였다.

팍사타는 실제 기업들이 데이터 분석의 과정에서 노력의 약 80%는 데이터 전처리에 쓰고 있다고 소개하며, 원인으로는 전처리 과정에 코딩 등의 직접 해야 하는 작업들이 많은 시간을 필요로 한다는 점을 꼽았다. 또한 IT와 비즈니스 부서간의 이해 부족도 원인 중 하나로 꼽혔는데, IT 부서는 비즈니스 부서에서 필요로 하는 데이터 맥락에 대한 이해가 부족하고, 비즈니스 부서는 IT 부서가 다루는 툴에 대한 이해가 부족하기 때문이라고 설명했다.

한편 팍사타의 비전은 기업의 모든 사람들이 정보를 활용할 수 있도록 하는 것이며, 미션으로는 사람들이 원천 데이터를 즉각적으로 정보로 바꾸어 분석에 활용하도록 도움을 주는 것이라고 소개되었다. 그리고 이런 목표에 따라, 기존의 제품들이 데이터 개발자나 과학자를 위주로 했던 데 비해, 팍사타는 정보를 활용하는 현업 사용자들에게 힘을 싣고자 하며, 기술 측면을 잘 모르는 현업 사용자들도 즉각적으로 정보를 만들어낼 수 있도록 하고자 한다고 덧붙였다.

 
▲ 아키텍처 구성에는 혁신을 위한 동력으로 오픈소스 프로젝트도 활용되는 모습이다.

팍사타는 솔루션 구현에 있어 적용된 다섯 가지의 ‘원칙’도 소개했다. 가장 먼저 꼽힌 것은 기업 내의 모든 사람들의 역량을 키울 수 있도록 지원하는 것이며, 또한 모든 분석 애플리케이션과 사용 사례를 지원하고자 하는 부분이 소개되었다. 이 외에도 정보를 만들어 내는 데 있어서의 장벽을 제거하는 부분, 보안과 거버넌스, 데이터 유연성간의 최적의 균형을 찾는 것, 그리고 데이터를 정보로 바꾸는 모든 과정의 재사용 지원과 팀 간 빠르고 스마트한 협업 지원 등이 소개되었다.

데이터를 정보로 만드는 과정을 재정립하는 데도 네 가지 정도의 핵심 기술이 사용되고 있다고 소개되었다. 가장 먼저 꼽힌 것은 AI로, 이미 머신러닝 기반의 AI는 다양한 형태로 생활 속에서 활용되고 있기도 하다. 또한 엔터프라이즈급 플랫폼에서 알고리즘을 적용하는 데 있어 필수적인 기술로 ‘분산 컴퓨팅’ 기술이 꼽혔으며, 고객에 전달하기 위한 수단으로는 하이브리드를 포함하는 유연한 클라우드 아키텍처 기반이 소개되었다. 이 외에도 활용을 극대화하기 위한 편리한 UX 측면도 강조되었다.

팍사타의 플랫폼 구성은 이런 네 가지 기술과 현업 사용자들의 요구를 감안했으며, 모든 형태의 데이터를 소화할 수 있어야 하고, 셀프 서비스가 가능하도록 해서 분석가가 직접 데이터에서 정보를 만들 수 있게 했다고 소개했다. 또한 모든 분석 툴 지원과 확장이 가능한 포괄적인 성격, 데이터 품질, 보관, 협업과 재사용이 가능하도록 한 엔터프라이즈급 플랫폼의 특징을 제공하고, 확장 가능성과 보안성을 갖춘, 머신 러닝 기반의 인텔리전트 플랫폼이라고 덧붙였다.

 
▲ 모든 종류의 데이터를 대상으로, 쉽게 분석 가능한 앤서셋을 만들어낼 수 있게 한다.

팍사타의 솔루션은 현업의 데이터 분석가들에게 모든 종류의 데이터를 활용해 탐색, 분석, 보강하는 과정을 거쳐 분석 가능한 앤서셋(AnswerSet)을 만들어 내는 과정을 크게 줄일 수 있게 하며, 기존에 몇 주나 몇 달이 걸리던 데이터 준비를 몇 시간이나 몇 분 만에 해결할 수 있도록 한다고 소개되었다. 또한 고객의 여정 측면에서는 ‘셀프서비스 데이터 전처리’를 지나 현재는 지침을 제공하는 단계이며, 궁극적으로는 모든 사람이 정보를 가질 수 있게 하고자 한다고 덧붙였다.

한편 팍사타는 엔터프라이즈 정보 관리에서도 이제는 알고리즘 기반과 현업 분석가 기반, 스케일아웃 환경과 멀티스트럭처 지원 환경으로 옮겨가고 있으며, 이런 변화의 수용을 통해 데이터에서 정보를 만들어가는 전체 과정을 새롭게 할 수 있었다고 소개했다. 또한 전체 데이터 전처리 시장에서 서비스 관련의 비중이 큰 상황이 이 부분의 노동집약적, 수동 작업의 비중이 높은 성격을 반영하며, 이제는 정보관리로 중심이 옮겨가면서 비즈니스 기회를 기대한다고 덧붙였다.

새로운 기술을 기반으로 한 데이터 전처리와 정보 관리는 비용 측면에서도 기존의 방법 대비 큰 절감 효과를 기대할 수 있을 것으로 소개되었다. 먼저, 스케일업 구조가 스케일아웃 구조로 옮겨가면서 TB당 연간 비용은 기존의 25,000달러에서 2,500달러 정도로 대폭 감소시킬 수 있을 것으로 기대되며, 플랫폼을 통해 수동 서비스를 최소화하면서 전체 시장 지출 규모에서 60억달러 가량 비용을 줄일 수 있을 것으로 예상한다고 밝혔다.

Copyright ⓒ Acrofan All Right Reserved.

디지털 마케팅의 새로운 장을 만들다! 신개념 퍼포먼스마케팅 플랫폼 '텐핑'

[명칭] 아크로팬   [제호] 아크로팬(ACROFAN)    [발행인] 유재용    [편집인] 유재용    [청소년보호책임자] 유재용
Copyright © ACROFAN All Right Reserved