ACROFAN

[인텔 데이터 센트릭 프레스 워크숍] FPGA와 스토리지 기술 개요

기사입력 : 2019년 04월 03일 07시 16분
ACROFAN=권용만 | yongman.kwon@acrofan.com SNS
인텔(Intel)은 3월 5, 6일 양일간 미국 오레곤(Oregon)주 힐스보로(Hillsboro)의 인텔 존스 팜 캠퍼스(Intel Jones Farm Campus)에서 ‘인텔 데이터 센트릭 프레스 워크숍(Intel Data-Centric Press Workshop)’을 열고, 데이터 주도의 시대를 위한 인텔의 솔루션 포트폴리오를 소개했다. 이 자리에서는 차세대 제온 스케일러블(Xeon Scalable) 프로세서와 옵테인 DC 퍼시스턴트 메모리(Optane DC Persistent Memory) 등, 차세대 프로세서와 플랫폼의 기술적 특징들이 소개되었다.

IoT와 클라우드, 5G와 인공지능에 이르기까지 다양한 IT 기술의 변화는 폭발적인 데이터의 증가 추세를 만들어내고 있으며, 이 데이터를 다루는 역량이 경쟁력으로 연결되고 있다. 이와 함께 IT 인프라 또한 클라우드 컴퓨팅으로의 이동과 AI, 분석의 활용 증가, 네트워크와 엣지의 클라우드화 등이 변화의 수요를 이끌고 있다. 인텔은 이 ‘데이터 주도’ 시대에 총 규모 2000억 달러의, 역대 최대 규모의 시장 기회가 있을 것으로 예상하고, 이 시장에 대비하기 위해 모든 것을 처리하고, 더 많은 것을 저장하고, 더 빠르게 옮길 수 있는, 소프트웨어와 시스템 레벨에 최적화된 솔루션을 제시한다는 계획을 소개했다.

인텔은 이 ‘데이터 주도’ 시대를 위한 새로운 포트폴리오로, 2세대 제온 스케일러블 프로세서와 새로운 제온 D 프로세서, Agilex FPGA, 옵테인 DC 퍼시스턴트 메모리와 옵테인 DC SSD, QLC 3D NAND 기반의 DC 시리즈 SSD, 800 시리즈 이더넷 어댑터 등을 소개했다. 새로운 제온 스케일러블 프로세서와 옵테인 DC 퍼시스턴트 메모리, 옵테인 DC SSD, 이더넷 기술 등은 시스템 레벨에서 긴밀히 결합되고, 소프트웨어 레벨의 최적화를 통해 다양한 워크로드에서 뛰어난 성능과 효율성을 제공할 수 있을 것으로 기대되며, 검증된 최적화된 구성의 ‘인텔 셀렉트 솔루션’을 통해 이러한 혁신을 더욱 빨리 누릴 수 있게 한다고 밝혔다.

▲ 호세 알버레즈 인텔 프로그래머블 솔루션 그룹 시니어 디렉터

▲ 제온 프로세서와의 결합을 통한 가속기로의 활용을 강조하는 ‘애질렉스’ FPGA

인텔의 새로운 FPGA에 대한 소개는 인텔 프로그래머블 솔루션 그룹 시니어 디렉터이자 CTO인 호세 알버레즈(Jose Roberto Albarez)가 진행했다. 사용자가 임의의 논리 회로를 유연하게 구현할 수 있는 FPGA는 엣지나 임베디드의 실시간 애플리케이션을 위한 고성능, 고효율 처리 장치로의 구현이나, 네트워크나 데이터센터에서의 워크로드 가속기 등으로도 많이 활용되고 있다. 특히 FPGA를 통한 하드웨어 구현은 추후 재구성도 가능해, 표준의 변경이나 시장 상황의 변동 등에도 유연하게 대응할 수 있다는 장점이 꼽혔다.

특정 워크로드를 위한 ‘전용 칩’ 구성에 있어 가장 효율이 높은 방법은 ASIC을 사용하는 방식이지만, 이 경우에는 추후 기술의 변경 등에 대응할 수 없다. 반면 FPGA의 경우 전용 회로의 구성으로 비교적 고성능의 구현이 가능하며 필요에 따라 재구성이 가능하지만, 절대 성능이나 전력 소비량 등에서 ASIC에 비해서는 불리한 입장에 있다. 이에, 인텔은 FPGA 코어와 ASIC 기반 커스텀 I/O, 컴퓨트 처리 회로 등을 조합해, 양 쪽의 장점을 모두 취하도록 하는 것이 가장 이상적인 모델이 될 수 있을 것이라고 덧붙였다.

인텔이 새롭게 선보이는 애질렉스(Agilex) FPGA는 이러한 구성의 유연함 측면을 극대화한 것이 특징이다. 이 FPGA는 PCIe 5.0 규격이나, 제온 프로세서와의 캐시와 메모리 수준에서의 일관성(Coherent)를 사용한 결합이 가능해, 넓은 대역폭과 함께 프로세서에 밀접하게 결합된 가속기로의 활용이 기대된다. 또한 메모리나 아날로그, 로직 등 다양한 외부 IP들과의 결합도 가능하며, eASIC 기반 최적화도 지원한다. 개발 도구로는 하드웨어 방향에서 접근하는 Quartus Prime이나, 소프트웨어 방향에서 접근하는 OneAPI를 지원한다. 한편 이 FPGA는 10nm 공정을 기반으로 한다.

▲ 이 FPGA의 특징에는 향후 제온 플랫폼에서 구현될 것도 일부 포함되어 있다

▲ AI 성능을 극대화할 수 있는 유연성 측면이 강조되었다

▲ 구성 요소와 특징에 따라 세 가지 시리즈가 준비되고, 첫 디바이스는 3분기에 등장할 예정이다

2세대 인텔 하이퍼플렉스 아키텍처를 기반으로 하는 이 애질렉스 FPGA는 기존의 스트라틱시 (Stratix) 10 대비 최대 40% 가량 높은 성능과 40% 더 낮은 전력 소비를 갖추고, DSP 성능은 FP16 기준 최대 40TFLOPS를 제공할 것으로 소개되었다. 또한 DDR5와 HBM, 옵테인 DC 퍼시스턴트 메모리를 지원하며, 데이터 이동에서는 PCIe Gen5와 함께 제온 프로세서와 캐시와 메모리 수준에서의 일관성을 사용한 연결도 가능할 것이고, 112G 트랜시버도 사용할 수 있다고 밝혔다. 주요 시장으로는 네트워킹, 엣지와 임베디드, 클라우드와 엔터프라이즈 시장이 꼽혔다.

패키징 측면에서는 이기종간 3D 패키징을 통해 다양한 칩렛들과의 구성이 가능하다. 이 때 FPGA 패브릭과 트랜시버, 커스텀 I/O나 컴퓨트 타일 등 주변의 칩렛들간의 연결에는 고성능의 EMIB(Embedded Multi-Die Interconnect Bridge)를 사용하며, eASIC을 통해 다양한 커스텀 I/O 등을 구현할 수도 있다고 밝혔다. 한편 이 FPGA는 제온 스케일러블 프로세서와 캐시, 메모리 일관성을 사용할 수 있는 새로운 연결 방법을 통해, 서로간의 메모리에까지 낮은 지연시간으로 접근하고, 특정 워크로드를 위한 가속기로 활용할 수 있는 것으로 알려졌다.

트랜시버에서는 PCIe Gen5나 112G 트랜시버의 지원으로, 400G 네트워크나 엣지 분석, 데이터센터 워크로드 등 높은 대역폭을 요구하는 애플리케이션의 요구에 대응한다. 또한 인공지능을 위한 유연성과 민첩성 측면에서는, 최대 40TFLOPS의 DSP 성능과 함께, FP32나 BFLOAT16, FP16, INT8 등까지 사용 가능하며, 고성능을 위한 저정밀도 INT7 지원 측면도 특징으로 꼽혔다. 제품군은 크게 세 가지가 마련되는데, F-시리즈에는 58G 트랜시버와 PCIe Gen4, DDR4 지원, 쿼드코어 Arm Cortex-A53 SoC 옵션으로 구성되고, I-시리즈에는 112G 트랜시버와 PCIe Gen5, 제온 스케일러블 프로세서와의 일관성을 사용한 연결이 제공된다. M 시리즈에서는 I-시리즈 대비 DDR5와 옵테인 DC 퍼시스턴트 메모리, HBM 지원 옵션이 추가될 것으로 알려졌다.

▲ 인텔은 옵테인과 QLC 3D NAND를 통해, 스토리지 계층에서 인텔의 영역을 더 넓혔다

인텔의 SSD 스토리지에 대한 소개는 인텔 NVM 솔루션 그룹의 펠로우 프랭크 하디(Frank Hady) 박사와 데이터센터 그룹의 마크 헨더슨(Mark W. Henderson)이 진행했다. 인텔은 이 자리에서 새로운 스토리지 계층 구조로, 옵테인 DC SSD와 QLC 3D NAND SSD를 사용해, 성능과 용량, 비용을 최적화한 스토리지 구성을 제안했다. 그리고 전통적인 스토리지의 룰인, 용량이 10배 늘어나면 성능이 1/10으로 떨어지는 90/10 룰을 소개하면서, 현재 스토리지 구성 계층에는 ‘빈 공간’이 존재하고 있다고 지적했다.

또한 현재 DRAM과 플래시 메모리 등의 기술 발전 측면에서, 플래시의 용량 증가 추세가 두드러지고, DRAM의 성장은 다소 둔화된 상황이라고 소개했다. 특히 인텔은 3D QLC NAND 기술을 통해 칩 하나에 1Tb 용량을 구현할 수 있고, 이는 2006년 4Gb 2D SLC의 등장 시절과 비교하면 256배의 용량 증가가 일어난 것이라고 밝혔다. 이와 함께 ‘옵테인’ 기술은 현재의 DRAM과 비교할 때 비휘발성 특성과 더 큰 공간의 제공, 개별 셀 접근 등의 특징을 지니고 있다고 소개했다.

인텔은 메모리에서부터 테이프에 이르는 스토리지 계층 구조를 매끄럽게 연결할 수 있는 솔루션들을 소개했다. 먼저, 메모리와 스토리지 계층의 사이에는 ‘옵테인 DC 퍼시스턴트 메모리’가 들어가 메모리 용량 측면을 보완한다. 또한 성능이 중요한 고성능 스토리지 티어에는 ‘옵테인 DC SSD’를 사용하며, 비용과 용량 측면이 중요시되는 영역에서는 3D NAND 기반 SSD를 제시하고자 한다고 소개했다. 특히 QLC의 등장에 따라, ‘웜 데이터’ 영역은 기존 TLC와 HDD의 조합 대신 옵테인 DC SSD와 QLC 3D NAND SSD를 사용해 성능과 용량, 비용 효율을 모두 만족시킬 수 있다고 덧붙였다.

▲ 1U 폼팩터 스토리지에서 1PB 스토리지의 구현을 현실로 만드는 인텔 SSD D5-P4326

▲ 옵테인 기반의 고가용성 환경을 위한 듀얼 포트 드라이브 ‘옵테인 SSD DC D4800X’

▲ ‘옵테인 DC 퍼시스턴트 메모리’는 스토리지 구성에서 완전히 새로운 옵션을 제시한다

인텔 SSD D5-P4326은 인텔의 QLC 3D NAND를 사용한 E1.L 폼팩터 기반 제품으로, NVMe 인터페이스를 사용하고 읽기 워크로드에 최적화된 제품이다. 이 제품의 최대 용량은 E1.L에서 30.72TB로, 1U 섀시에 32개 정도를 장착할 수 있으니 1U 랙 서버 한 대로 1PB의 SSD 스토리지를 얻을 수 있어, 고밀도 스토리지 구성에 큰 장점을 제공한다. 3,200MB/s의 순차 읽기와 1,600MB/s 순차 쓰기 성능 무작위 읽기, 쓰기 성능은 읽기 580K IOPS, 쓰기 11K IOPS 정도를 보이고, 내구성 측면에서는 순차 쓰기 0.9 DWPD, 무작위 쓰기 0.18 DWPD 정도를 제시한다.

인텔 옵테인 SSD DC D4800X는 옵테인 기술 기반의 첫 듀얼 포트 드라이브로, 두 개의 스토리지 컨트롤러에 연결되어 컨트롤러 장애에도 대응 가능한 고가용성 구성을 갖출 수 있다. 최대 1.5TB의 용량을 제공하며, 4KB 무작위 읽기, 쓰기는 560K IOPS, 540K IOPS 성능을 보이고, 내구성은 30DWPD를 제시했다. 한편, 인텔은 VMware vSAN 환경에서 캐시 스토리지를 기존의 NAND 기반 드라이브에서 옵테인 SSD DC 시리즈로 바꾸었을 때, 캐시 용량은 더 줄었음에도 VM 밀도는 60% 더 끌어올릴 수 있었고, 3년간 비용 절감 효과는 최대 25%에 달한다고 덧붙였다.

한편 인텔은 ‘옵테인 DC 퍼시스턴트 메모리’ 의 활용을 통해 스토리지로의 접근에서 지연 시간을 최소화할 수 있다고도 소개했다. 기존의 스토리지로 접근하는 경우 애플리케이션이 파일 시스템 등에 접근하면서 리눅스 기준 4~10us 정도의 시간이 걸리는데, 옵테인 DC 퍼시스턴트 메모리는 스토리지 서브시스템에 접근하는 시간을 완전히 제거할 수 있어 높은 성능을 기대할 수 있다는 것이다. 기존의 NAND SSD에서는 하드웨어 지연 시간의 비중이 꽤 컸지만, 옵테인 DC SSD에서는 소프트웨어와 하드웨어의 지연시간이 비슷해졌고, 옵테인 DC 퍼시스턴트 메모리는 소프트웨어 지연 시간을 제거하고, 하드웨어 지연 시간까지 줄여 지연시간의 단위를 ns 수준까지 내렸다.

Copyright ⓒ Acrofan All Right Reserved.

디지털 마케팅의 새로운 장을 만들다! 신개념 퍼포먼스마케팅 플랫폼 '텐핑'

[명칭] 아크로팬   [제호] 아크로팬(ACROFAN)    [발행인] 유재용    [편집인] 유재용    [청소년보호책임자] 유재용
Copyright © ACROFAN All Right Reserved