ACROFAN

[인텔 데이터 센트릭 프레스 워크숍] 2세대 제온 스케일러블 프로세서와 플랫폼 성능 개요

기사입력 : 2019년 04월 05일 12시 15분
ACROFAN=권용만 | yongman.kwon@acrofan.com | SNS
인텔(Intel)은 3월 5, 6일 양일간 미국 오레곤(Oregon)주 힐스보로(Hillsboro)의 인텔 존스 팜 캠퍼스(Intel Jones Farm Campus)에서 ‘인텔 데이터 센트릭 프레스 워크숍(Intel Data-Centric Press Workshop)’을 열고, 데이터 주도의 시대를 위한 인텔의 솔루션 포트폴리오를 소개했다. 이 자리에서는 차세대 제온 스케일러블(Xeon Scalable) 프로세서와 옵테인 DC 퍼시스턴트 메모리(Optane DC Persistent Memory) 등, 차세대 프로세서와 플랫폼의 기술적 특징들이 소개되었다.

IoT와 클라우드, 5G와 인공지능에 이르기까지 다양한 IT 기술의 변화는 폭발적인 데이터의 증가 추세를 만들어내고 있으며, 이 데이터를 다루는 역량이 경쟁력으로 연결되고 있다. 이와 함께 IT 인프라 또한 클라우드 컴퓨팅으로의 이동과 AI, 분석의 활용 증가, 네트워크와 엣지의 클라우드화 등이 변화의 수요를 이끌고 있다. 인텔은 이 ‘데이터 주도’ 시대에 총 규모 2000억 달러의, 역대 최대 규모의 시장 기회가 있을 것으로 예상하고, 이 시장에 대비하기 위해 모든 것을 처리하고, 더 많은 것을 저장하고, 더 빠르게 옮길 수 있는, 소프트웨어와 시스템 레벨에 최적화된 솔루션을 제시한다는 계획을 소개했다.

인텔은 이 ‘데이터 주도’ 시대를 위한 새로운 포트폴리오로, 2세대 제온 스케일러블 프로세서와 새로운 제온 D 프로세서, Agilex FPGA, 옵테인 DC 퍼시스턴트 메모리와 옵테인 DC SSD, QLC 3D NAND 기반의 DC 시리즈 SSD, 800 시리즈 이더넷 어댑터 등을 소개했다. 새로운 제온 스케일러블 프로세서와 옵테인 DC 퍼시스턴트 메모리, 옵테인 DC SSD, 이더넷 기술 등은 시스템 레벨에서 긴밀히 결합되고, 소프트웨어 레벨의 최적화를 통해 다양한 워크로드에서 뛰어난 성능과 효율성을 제공할 수 있을 것으로 기대되며, 검증된 최적화된 구성의 ‘인텔 셀렉트 솔루션’을 통해 이러한 혁신을 더욱 빨리 누릴 수 있게 한다고 밝혔다.

▲ 기존 ‘스카이레이크’ 기반의 아키텍처지만 꽤 큰 폭의 변경이 이루어진 2세대 제온 스케일러블 프로세서

▲ 메인스트림 급 제품에서의 구성이 좋아져서, 체감될 성능 향상 폭은 기대 이상일 것이다

2세대 제온 스케일러블 프로세서는 ‘스카이레이크’ 아키텍처 기반이었던 기존 제온 스케일러블 프로세서의 장점을 이어받으면서, 새롭게 적용된 기술적 특징으로 더 큰 가치를 제공하는 것이 특징으로 소개되었다. 또한 새로운 ‘제온 플래티넘 9200’ 시리즈는 단일 프로세서 패키지에서 최대 56코어, 12채널 메모리 컨트롤러 등으로, 이전 세대의 최상위 모델이었던 제온 플래티넘 8100 시리즈는 물론이고, 새로운 제온 플래티넘 8200 시리즈와 비교해도 두 배의 성능 향상을 제공한다고 밝혔다. 이와 함게, 메인스트림 급 제품군에서는 이전 세대 대비 제공하는 코어 수 증가 등과 함께, 워크로드 최적화 제품군 등으로, 제품군에 따라서는 최대 1.3배의 세대간 성능 차이를 보인다고 덧붙였다.

2세대 제온 스케일러블 프로세서 제품군에서, 세대간 성능 향상이 두드러지는 부분은 워크로드 유형에서는 AI 추론 영역, 그리고 세대간 비교에서는 메인스트림 급 제품군에서의 성능 향상이 두드러진다. 코어 수 등의 차이가 없는 ‘제온 플래티넘’ 최상위 모델인 8280과 8180간의 비교에서는, 주요 성능에서는 10% 미만의 차이 정도지만, AI 이미지 인식에서는 새로운 VNNI 명령어의 적용으로 2.3배의 성능 향상이 있다. 그리고 제온 스케일러블 프로세서의 메인스트림 제품군에서는, 2세대 모델에서 이전 세대보다 제공하는 코어 수가 증가하는 등의 구성 변화에 힘입어, 적게는 15~20%에서 크게는 40% 이상에 이르기까지의 성능 향상이 있었고, AI 추론에서는 최대 2.9배의 성능 향상이 나올 정도다.

제온 스케일러블 프로세서는 단일 프로세서 시스템에서부터 4소켓 이상 구성에 이르기까지 단일 프로세서 제품군으로 지원 가능한 ‘확장성’ 측면도 큰 특징으로 꼽힌다. 그리고 필요에 따른 프로세서의 확장에서, 단일 소켓에서 듀얼 소켓으로의 확장에서 성능 향상 폭은 이론적인 기대치에 근접하는 1.98배, 4소켓으로의 확장에서는 3.88배에 이르는 높은 성능 향상 효율을 보인다고 소개했다. 이런 측면은 시스템 확장에 있어, 프로세서 뿐 아니라 메모리와 프로세서 간 연결 등이 효율적인 구조로 되어 있기 때문에 가능한 것이기도 하다.

2세대 제온 스케일러블 프로세서는 이제 교체 시기를 앞둔 5년 전의 제온 E5 v2 프로세서와 비교할 때, 같은 2소켓 구성에서는 최대 3.5배의 VM 밀도와 최신 기능들과 높은 성능을 모두 얻을 수 있다고 소개되었다. 또한 비슷한 성능과 용량 수준을 유지하면서 서버를 줄이는 다운사이징에서는 기존 서버 20대를 새로운 서버 6대로 줄임으로써 59% 정도의 비용 절감 효과를 기대할 수 있다고 소개했다. 또한 성능 측면 이외에도, 프로세서와 플랫폼에 적용된 다양한 최신 관리 기능 등을 통해 인프라 전반의 운영 효율도 더욱 향상시킬 수 있을 것이라고 덧붙였다.

한편, 새로운 플랫폼과 함께 사용할 수 있는 ‘옵테인 DC 퍼시스턴트 메모리’는 비용 효율적으로 더 큰 메모리 용량을 사용할 수 있게 하며, 옵테인 DC 퍼시스턴트 메모리와 Redis, Memtier의 조합은 4배 더 큰 메모리 용량과 함께 더 많은 VM 운영을 가능하게 한다고 소개했다. SAS Viya의 경우에도 옵테인 DC 퍼시스턴트 메모리는 인메모리 분석 플랫폼에서 더 낮은 비용으로 비슷한 성능을 구현할 수 있게 하며, VMware의 View Planner에서도 더 큰 메모리 공간을 비용 효율적으로 제공해, VDI 환경에서 1.4배 많은 VM을 메모리 부족으로 인한 성능 저하 없이 활용할 수 있다고 덧붙였다.

▲ 하나의 프로세서에서 세 가지 구성을 활용할 수 있는 ‘SST-PP’

▲ 리소스 디렉터 기술의 ‘메모리 대역폭 할당’은 애플리케이션간 성능 간섭을 줄이면서 사용률을 끌어올릴 수 있게 한다

2세대 제온 스케일러블 프로세서의 ‘N-시리즈’ 제품군은 네트워크 인프라의 VNF(Virtual Network Function) 워크로드에 최적화된 구성을 갖췄으며, 이 제품군에 속하는 제온 골드 6230N은 이전 세대의 제온 골드 6130 대비 다양한 패킷 프로세싱 워크로드에서 25~58% 향상된 성능을 제공한다. 또한 이 제품군에 적용되는 ‘스피드 시프트(SST-BF)’는 높은 동작속도가 성능에 유리한 특정 워크로드를 위해, 이를 처리하는 특정 코어에 더욱 높은 동작 속도를 주어 성능을 극대화할 수 있다. 그리고 이 SST-BF를 적용한 제온 골드 6230N의 OVS(Open Virtual Switch) 성능은 제온 골드 6130 대비 1.76배에 이른다.

2세대 제온 스케일러블 프로세서의 ‘Y-시리즈’에 적용된 데이터센터를 위한 ‘스피드 시프트 기술(SST-PP)’는 하나의 제품에 세 가지의 프로파일이 들어 있어, 이 프로파일 중 워크로드 특성에 맞춰 최적화된 프로세서 구성을 선택, 활용할 수 있다. 이 프로파일에는 활성 코어 수와 기본 동작 속도, 터보 부스트 동작 속도, TDP. 최대 온도 설정 등이 포함되어, 워크로드에 따라 더 적은 코어와 높은 동작 속도, 혹은 더 많은 코어 수와 낮은 동작 속도 등의 프로파일 중 선택할 수 있다. 예를 들면, 제온 플래티넘 8260Y는 24코어 2.4GHz, 20코어 2.5GHz, 16코어 2.7GHz 등의 프로파일 중 워크로드 특성에 맞춰 프로세서 프로파일을 선택, 배포할 수 있다.

2세대 제온 스케일러블 프로세서의 ‘리소스 디렉터 기술’에는 ‘메모리 대역폭 할당’ 기능이 추가되었으며, 이를 통해 특정 애플리케이션의 성능을 다른 작업에 따른 영향을 최소화하면서 운영할 수 있다. 이 기술은 많은 메모리 활용으로 주위 애플리케이션의 성능에 영향을 주는 ‘시끄러운 이웃’ 같은 애플리케이션에 제한을 거는 식으로 활용할 수 있으며, NGINX의 운영 사례에서는 서버에 단독 운영되는 상태의 성능을 1로 봤을 때, 주위의 앱이 성능에 영향을 주는 경우 NGINX의 성능은 0.77 정도까지 떨어지지만, 이 영향울 주는 앱에 메모리 대역폭 제한을 걸면 NGINX의 성능은 0.98 정도까지 올라온다. 이 기술을 잘 활용하면, 성능 영향을 최소화하면서 시스템 활용도의 극대화가 가능하다.

한편, 인텔 이더넷 800 시리즈는 ADQ(Application Device Queues)와 DDR(Dynamic Device Personalization) 기술을 통해 네트워크 전송 성능과 효율을 극대화한다. ADQ의 경우 특정 애플리케이션을 위한 전용 연결을 제공할 수 있어 예측 가능한 지연 시간 측면을 크게 강화할 수 있으며, DDP 또한 패킷 프로세싱 효율을 더 끌어올릴 수 있게 한다. 이 외에도 NVMe 인터페이스 기반의 최신 인텔 SSD DC 제품군은 기존 SATA SSD 대비 더 낮은 지연시간과 높은 처리량, 더 큰 용량을 제공하며, QLC 기술은 비용과 성능 측면의 장점에 기인해, 웜 스토리지 계층에서 하드 드라이브의 대체 추세를 더욱 가속화할 수 있을 것으로 기대된다고 소개되었다.

▲ 새로운 시대의 역량을 제대로 누리려면, 전반적인 환경의 현대화가 필요하다

▲ 최신 플랫폼과 소프트웨어로 모두 교체한 경우, 크게는 수십 배의 성능 향상도 나온다

▲ HPC 성능에서는, 3년 전 시스템과 비교해도 교체의 당위성이 충분할 정도다

새로운 프로세서가 주는 성능 측면의 장점을 극대화하려면, 프로세서 뿐 아니라 스토리지와 소프트웨어 등까지도 최신 기술에 적합한 구성이 필요하다. 예를 들면, Ceph를 위한 구성에서 이전 세대의 제온 골드 6152와 인텔 SSD DC P4600, P4500을 사용하던 시스템에서, 새로운 제온 골드 6252와 옵테인 SSD DC P4800X, SSD D5-P4320으로의 교체를 통해 1.7배의 성능을 얻을 수 있으며, 여기서 D5-P4320을 DC P4510으로 바꿈으로써 두 배 정도의 성능 향상을 얻을 수 있고, 이 때의 성능은 이전 세대의 조합 대비 3.4배에 이르게 된다.

2세대 제온 스케일러블 제품군에서 인텔 ISA-L(Intelligent Storage Acceleration Library)는 스토리지에서의 암호화와 압축 등에서 프로세서와 플랫폼이 가진 AVX-512, AES-NI, QAT 기술 등을 적극적으로 활용해 높은 성능을 제공한다. 이 때 최신 시스템의 성능은 5년 전의 시스템과 비교했을 때, 데이터 보호 측면에서는 3.3배, CRC 등 데이터 무결성 확인에서는 5.1배, 해싱 성능은 3.6배, 암호화에서는 6.2배, 압축에서는 6.9배에 이르는 향상된 성능을 제공한다고 소개되었다.

이 외에도, 2세대 제온 스케일러블 프로세서는 3년 전의 제온 E5 v4와 비교할 때도 NGINX에서 1.53배, 서버 사이드 자바 성능에서는 1.72배의 성능을 제공할 수 있으며, OLTP 성능은 2세대 제온 스케일러블 프로세서와 인텔 SSD DC P4610 사용시 5년 전의 제온 E5 v2 대비 2.68~3.77배에 이르는 성능 향상을 제공하고, 빅데이터 쿼리 성능도 제온 E5 v2 대비 2.34배에서 워크로드에 따라서는 최대 10배까지도 높은 성능을 제공한다고 소개되었다. 특히, 최신 하드웨어에 최적화된 최신 소프트웨어의 사용은 성능 향상 효과를 극대화할 수 있으며, 윈도우 서버 2019와 SQL 서버 2017 기반의 2세대 제온 플래티넘 8280 기반 시스템은, 4년 전의 윈도우 서버 2008 R2, SQL 서버 2008 R2를 사용하는 제온 E5-2699 v3 대비 데이터 웨어하우스 쿼리 성능에서 약 27배의 성능을 낸다고 덧붙였다.

HPC 애플리케이션에서도 2세대 제온 스케일러블 프로세서는 3년 전의 제온 E5 v4 대비 평균 1.9~3.7배의 성능을 제공한다고 소개되었다. 이는 제온 스케일러블 프로세서부터 적용된 AVX-512와 더 많은 코어. I/O 성능 최적화, 3년간 향상된 성능의 SSD나 네트워크 기술의 등장 등에 기인한다. 그리고 제온 플래티넘 8200 시리즈보다 최대 두 배 많은 코어를 제공할 수 있는 제온 플래티넘 9200 시리즈는, 더 큰 컴퓨팅 역량을 더 높은 밀도로 인프라에 집적할 수 있도록 한다고 강조했다. 이와 함께 2세대 제온 스케일러블 프로세서의 ‘DL Boost’ 기술은 이전 세대보다 두 배 이상의 AI 추론 성능을 제공할 수 있으며, 1세대 제온 스케일러블 프로세서의 초기 성능 대비로는 최대 30배에 이르는 성능 향상이 있었다고 밝혔다.

Copyright ⓒ Acrofan All Right Reserved



[명칭] 아크로팬   [제호] 아크로팬(ACROFAN)    [발행인] 유재용    [편집인] 유재용    [청소년보호책임자] 권용만
Copyright(c) ACROFAN All Right Reserved