ACROFAN

[인텔 데이터 센트릭 프레스 워크숍] HPC와 네트워크, IoT에서의 성능 개요

기사입력 : 2019년 04월 06일 22시 03분
ACROFAN=권용만 | yongman.kwon@acrofan.com SNS
인텔(Intel)은 3월 5, 6일 양일간 미국 오레곤(Oregon)주 힐스보로(Hillsboro)의 인텔 존스 팜 캠퍼스(Intel Jones Farm Campus)에서 ‘인텔 데이터 센트릭 프레스 워크숍(Intel Data-Centric Press Workshop)’을 열고, 데이터 주도의 시대를 위한 인텔의 솔루션 포트폴리오를 소개했다. 이 자리에서는 차세대 제온 스케일러블(Xeon Scalable) 프로세서와 옵테인 DC 퍼시스턴트 메모리(Optane DC Persistent Memory) 등, 차세대 프로세서와 플랫폼의 기술적 특징들이 소개되었다.

IoT와 클라우드, 5G와 인공지능에 이르기까지 다양한 IT 기술의 변화는 폭발적인 데이터의 증가 추세를 만들어내고 있으며, 이 데이터를 다루는 역량이 경쟁력으로 연결되고 있다. 이와 함께 IT 인프라 또한 클라우드 컴퓨팅으로의 이동과 AI, 분석의 활용 증가, 네트워크와 엣지의 클라우드화 등이 변화의 수요를 이끌고 있다. 인텔은 이 ‘데이터 주도’ 시대에 총 규모 2000억 달러의, 역대 최대 규모의 시장 기회가 있을 것으로 예상하고, 이 시장에 대비하기 위해 모든 것을 처리하고, 더 많은 것을 저장하고, 더 빠르게 옮길 수 있는, 소프트웨어와 시스템 레벨에 최적화된 솔루션을 제시한다는 계획을 소개했다.

인텔은 이 ‘데이터 주도’ 시대를 위한 새로운 포트폴리오로, 2세대 제온 스케일러블 프로세서와 새로운 제온 D 프로세서, Agilex FPGA, 옵테인 DC 퍼시스턴트 메모리와 옵테인 DC SSD, QLC 3D NAND 기반의 DC 시리즈 SSD, 800 시리즈 이더넷 어댑터 등을 소개했다. 새로운 제온 스케일러블 프로세서와 옵테인 DC 퍼시스턴트 메모리, 옵테인 DC SSD, 이더넷 기술 등은 시스템 레벨에서 긴밀히 결합되고, 소프트웨어 레벨의 최적화를 통해 다양한 워크로드에서 뛰어난 성능과 효율성을 제공할 수 있을 것으로 기대되며, 검증된 최적화된 구성의 ‘인텔 셀렉트 솔루션’을 통해 이러한 혁신을 더욱 빨리 누릴 수 있게 한다고 밝혔다.

▲ HPC와 AI에서 2세대 제온 스케일러블 프로세서의 장점은 크게 네 가지 정도로 정리된다

HPC 영역은 더 크고 복잡한 문제를 빨리 푸는 것을 넘어, AI 등의 문제를 풀기 위한 완전히 새로운 방법의 통합 또한 시도되고 있다. 그리고 이런 추세에서 2세대 제온 스케일러블 프로세서는 새로운 AI 관련 기능을 통해 AI 워크로드를 더 빨리 처리함은 물론이고, HPC와 AI의 컨버전스를 좀 더 손쉽게 한다고 소개되었다. 특히 2세대 제온 스케일러블 프로세서는 코어당, 노드당, 그리고 확장성에 이르기까지 최고의 성능과 메모리 대역폭을 제공해, 다양한 HPC와 AI 애플리케이션을 위한 최적의 환경을 제공한다고 밝혔다.

HPC 성능은 시스템 피크 성능과 효율, 소프트웨어 최적화 수준에 따라 결정된다. 그리고 인텔은 2세대 제온 스케일러블 프로세서는 시스템당 성능 측면에서 AVX-512와 DL Boost, 메모리 대역폭에서의 강점과 비용 효율적인 대용량 메모리 환경을 위한 옵테인 DC 퍼시스턴트 메모리 등의 특징을 갖추고 있으며, 효율 측면에서는 아키텍처의 성능 뿐 아니라 높은 멀티노드 확장 효율도 갖추고 있다고 강조했다. 또한 하드웨어의 역량을 최대한 발휘하고, 빠른 개발을 통해 가치 창출까지 걸리는 시간을 최소화할 수 있게 하는 소프트웨어 최적화 측면에서도 개발 툴과 라이브러리, 소프트웨어 툴 등에 이르기까지 다양한 지원을 제공한다고 덧붙였다.

HPC와 AI 애플리케이션을 위한, 2세대 제온 스케일러블 프로세서가 갖춘 최고의 기술은 AVX-512가 꼽혔다. 프로세서 코어 당 최대 두 개를 갖춘 AVX-512 유닛은, 유닛 당 한 번에 다룰 수 있는 벡터 폭이 두 배로 늘어 더 많은 연산을 한 번에 처리할 수 있다. 이에 한 개의 256비트 AVX2 유닛 대비, 두 개의 AVX-512 유닛은 네 배의 성능 향상을 제공하며, AI 추론 애플리케이션을 위한 INT8 연산을 사용하면 사이클 당 최대 256OPs를 처리할 수 있다. 한편 같은 프로세서에서도 AVX2와 AVX-512의 성능 차이는 워크로드에 따라 작게는 1.2배에서 크게는 1.9배까지 나기도 한다.

▲ 옵테인 DC 퍼시스턴트 메모리는 불가능했던 규모의 분석을 현실화하기도 한다

두 개의 ‘캐스케이드 레이크’ 다이를 하나로 패키징해 최대 56코어, 12채널 DDR4 메모리 인터페이스를 제공하는 ‘제온 플래티넘 9200’ 프로세서는, HPC에서도 더 작은 폼팩터에서 더 많은 코어와 더 큰 메모리 대역폭 등을 확보할 수 있게 한다. 그리고 3년 전의 제온 E5-2697 v4와 비교했을 때, 2세대 제온 스케일러블 프로세서 모델인 제온 플래티넘 8260 모델은 평균 1.9배의 성능 향상을 제공하며, 제온 플래티넘 9242 프로세서는 이보다 두 배 가량 더 높은 평균 3.7배의 성능 향상을 제공하고 있다고 소개되었다. 또한 노드 확장에 따른 성능 향상에서도 높은 효율을 보여주고 있다고 덧붙였다.

HPC와 AI의 컨버전스 측면에서도 2세대 제온 스케일러블 프로세서는 고무적인 성능 향상을 보여 준다. 1세대 제온 스케일러블 프로세서가 처음 등장할 때와 비교하면, 새로운 하드웨어와 소프트웨어 최적화의 적용은 Caffe ResNet-50 기준 추론 성능을 14~30배까지 끌어올릴 수 있게 한다. 그리고 이 때 소프트웨어 최적화 부분에서는 FP32를 INT8로 변경함으로써 같은 프로세서에서도 1.3배의 성능 향상을 얻을 수 있고, 2세대 제온 스케일러블 프로세서의 ‘DL Boost’ 기능을 INT8 기반에서 사용하면, 이론적으로는 3개 명령어가 필요하던 것을 한 개 명령어로 끝낼 수 있어 3배의 성능 향상이 가능해진다고 덧붙였다.

한편 옵테인 DC 퍼시스턴트 메모리는 DRAM과 스토리지 간 성능의 격차를 줄이고, 비용 효율적으로 더욱 큰 메모리 용량을 사용할 수 있게 해, 지금까지는 시도하지 못했던 규모의 문제에 접근할 수 있는 새로운 기회를 제공하기도 한다. 또한 인텔은 하드웨어의 역량을 최대한 활용한 워크로드 최적화된 성능을 제공하기 위해, 최적화된 라이브러리나 AI 프레임워크, 병렬 프로그래밍 프레임워크, 컴파일러와 프로파일링 툴, 툴킷과 툴 스위트까지 폭넓은 지원을 제공하고 있다고 소개했다.

▲ NFV 워크로드에 최적화된 기술 특징을 제공하는 2세대 제온 스케일러블 프로세서

▲ 옵테인 DC 퍼시스턴트 메모리는 CDN 비디오 스트리밍 캐시로도 훌륭한 결과를 보인다

네트워크 인프라에서의 기회는 5G의 도입, 유연한 모바일 인프라를 위한 가상화와 컨버전스, 엔터프라이즈 네트워크, 엣지 인프라 등 다양한 영역에서 가시화되고 있다. 5G의 등장과 함께 데이터 트래픽은 빠르게 늘면서도 지연 시간에 대한 요구사항은 더 높아지고 있으며, 5G 네트워크는 더 유연하고 분산된 형태인, 클라우드에 대응할 수 있는 형태가 요구된다. 이에 인텔은 그 중요성이 높아지고 있는 ‘네트워크 변혁’을 위한 솔루션으로, 네트워크 워크로드에 최적화된 제품과 솔루션을 통해 극대화된 성능을 제공하고, 파트너 생태계 측면에서도 ‘인텔 셀렉트 솔루션’이나 NFV 가속화 프로그램 등을 선보이고 있다고 소개했다.

네트워크 기능 가상화(NFV) 워크로드에 최적화된 2세대 제온 스케일러블 프로세서 ‘N-시리즈’는 동급의 일반 제품보다 높은 동작 속도를 제공해 NFV 워크로드에서 좀 더 높은 성능을 제공한다. 또한 이 제품군에 제공되는 스피드 셀렉트 기술은 ‘SST-BF’로 불리며, 일정 TDP 등을 고려해 특정 워크로드를 위한 VM에 높은 우선순위를 두어, 더 높은 동작 속도를 가지는 코어에 할당하고, 그렇지 않은 워크로드들은 더 낮은 동작 속도를 가진 코어에 할당해 성능을 최적화한다. 예를 들어 제온 골드 6230N의 기본 동작 조건은 20코어 2.3GHz지만, 2.7GHz로 동작하는 6개 코어에는 vLB, vSW 같은 워크로드를, 2.1GHz로 동작하는 14개 코어에는 vRTR, vFW를 할당하는 식이다.

NFV를 위한 옵테인 DC 퍼시스턴트 메모리의 활용 사례로는 CDN(Content Delivery Networks) 캐싱 서버로의 활용이 꼽혔다. CDN의 핫 비디오 캐싱은 보통 높은 처리량과 반응성을 위해 DRAM을 이용하는데, 옵테인 DC 퍼시스턴트 메모리를 사용하면 같은 용량의 풀을 저렴하게 구성할 수 있고, 성능 측면에서도 손색이 없다는 것이다. 인텔은 1.5TB의 DRAM 구성과 옵테인 DC 퍼시스턴트 메모리 구성에서, 핫 VOD 캐싱 90/10이나 라이브 리니어 비디오 스트리밍의 첫 프레임 서비스(TTFF) 등의 시나리오에서, 서비스 용량과 성능에 손색이 없으면서도 비용을 34% 가량 줄일 수 있다고 소개했다.

네트워크 워크로드에서 ‘리소스 디렉터 기술’의 의미는 더욱 각별하다. 이미 이전 세대들부터 제공되던 캐시 할당 기술(CAT) 이외에도, 2세대 제온 스케일러블 프로세서에서 제공되는 ‘메모리 대역폭 할당(MBA)’은 특정 애플리케이션이 많은 메모리 자원 소비로 주위 애플리케이션의 성능에 영향을 주는 부분들을 막고, 애플리케이션간 성능 영향 없이 시스템 활용률을 더 끌어올릴 수 있다. 한편 DPDK(Data Plane Development Kit)의 활용은 2세대 제온 스케일러블 프로세서의 역량 활용을 극대화해, 듀얼 소켓 구성에서 600Gb/s의 패킷 처리 성능을 기대할 수 있다. 또한 인텔 이더넷 800 시리즈 NIC와 AF_XDP, ADQ 기능을 활용할 경우 패킷이 컨테이너 등에서 NIC로 바로 가도록 경로를 구성함으로써, 리눅스 커널에서의 오버헤드를 최소화할 수 있다고 덧붙였다.

▲ 시설 유지 부담 측면을 줄이는 측면에서 각별한 NGCO

▲ 애플리케이션 개발에서 성능과 효율을 극대화하는 ‘OpenVINO’ 툴킷

2세대 제온 스케일러블 프로세서와 플랫폼은 엣지와 IoT에서도 높은 가치를 제공할 수 있다. 최근 주목받고 있는 엣지 컴퓨팅은, 데이터센터의 클라우드를 사용자에 가까운 위치까지 확장해, 지연시간에 민감한 애플리케이션에 네트워크 이동 거리를 줄이면서 서비스를 제공할 수 있게 한다. 그리고 인텔은 엣지 환경을 위한 포트폴리오로, 다양한 하드웨어 뿐 아니라 데이터 플레인, 가상화와 오케스트레이션, 다양한 툴킷과 서비스 지원 등에 이르기까지 폭넓은 생태계 지원까지 갖추고 있다고 소개했다.

인텔은 엣지 인프라의 사례로 NGCO(Next-generation Central Office)를 랙 단위로 구축한 사례를 소개했다. 작게는 3~5개 서버에서 크게는 풀 랙 구성에 이르기까지 유연한 구성을 갖추고 있으며, JBOD 스토리지와 스위치, 네트워크 플랫폼과 서비스 플랫폼을 아우르는 싱글 플랫폼 접근법을 갖추고 있다. 이 때 네트워크 환경을 위한 ‘N-시리즈’ 제품군과 리소스 디렉터 기술, QAT 기술이나 FPGA 등의 가속기 옵션, 옵테인 DC 기술 등은 이 엣지 인프라의 역량을 더욱 최적화할 수 있게 하며, 네트워크 인프라가 네트워크 기능과 서비스 이상의 역할까지 수행할 수 있게 한다.

비디오와 비전 애플리케이션은 그 중요성이 높아지고 있으며, 데이터의 상당 부분이 엣지 인프라에서 처리될 것으로 예상된다. 그리고 이들 애플리케이션의 개발에 있어, OpenVINO 툴킷은 한 번의 개발로 다양한 환경에 배포가 가능한 툴킷으로 꼽혔다. 이 툴킷은 딥러닝과 컴퓨터 비전 영역의 주요 프레임워크에 최적화된 환경을 지원하며, 크로스 플랫폼의 유연성, 고성능 고효율 등의 특징을 제공한다.

2세대 제온 스케일러블 프로세서에서 선보인 ‘DL Boost’ 기술은 이전 세대 대비 AI 추론 성능을 두 배 이상 끌어올릴 수 있고, 1세대 제온 스케일러블 프로세서의 출시 시점과 비교하면 14배의 성능 차이를 제공하기도 한다. 그리고 이 ‘DL Boost’ 기술은 제조업에서의 엣지 인프라와 만나, 더 깊은 단계 혹은 다수의 네트워크를 동시에 운영할 수 있도록 해 현장에서의 반응성과 정확도를 더 끌어올릴 수 있다. 또한 헬스케어에서의 이미지 인식 기반 AI 활용에서도 더 크고 다양한 이미지 분석을 더 높은 정확도로 다룰 수 있다고 덧붙였다.

Copyright ⓒ Acrofan All Right Reserved.

디지털 마케팅의 새로운 장을 만들다! 신개념 퍼포먼스마케팅 플랫폼 '텐핑'

[명칭] 아크로팬   [제호] 아크로팬(ACROFAN)    [발행인] 유재용    [편집인] 유재용    [청소년보호책임자] 유재용
Copyright © ACROFAN All Right Reserved