ACROFAN

AMD, 7nm 공정 기반 데이터센터용 GPU 공개

기사입력 : 2018년 11월 08일 19시 58분
ACROFAN=권용만 | yongman.kwon@acrofan.com | SNS
AMD는 세계 최초의 7nm 공정 기반 데이터센터용 GPU인 라데온 인스팅트™(Radeon Instinct™) MI60 및 MI50 가속 카드를 공개했다. 새로운 제품들은 모두 차세대 딥러닝, 고성능 컴퓨팅(HPC), 클라우드 컴퓨팅, 렌더링 응용 프로그램 구동을 위한 탁월한 컴퓨트 성능을 제공한다. 궁극적으로 연구자, 과학자, 개발자들이 대규모 시뮬레이션, 기상 예측, 컴퓨터 생명 공학, 질병 예방 등의 난제 해결에 도움을 줄 것이다.

AMD 라데온 인스팅트 MI60 및 MI50 가속 카드는 고성능 컴퓨트 유닛이 내장되어 유연한 혼합 정밀도(mixed-precision)를 제공한다. 이를 바탕으로 고성능 컴퓨팅, 딥러닝 응용 프로그램 등 신형 가속 카드가 지원하는 작업의 유형을 확장할 수 있다. 이와 더불어 빠른 속도의 복합 신경망 훈련, 높은 수준의 부동소수점(floating-point) 성능, 향상된 효율성, 데이터센터 전체 혹은 부분 적용을 위한 새로운 기능을 지원하는 등 다양한 작업을 효율적으로 처리하도록 고안됐다.

AMD 라데온 인스팅트 MI60 및 MI50 가속 카드는 초고속 부동수소점 성능과 최대 1TB/s의 처리 속도를 제공하는 초고속 HBM2 메모리(2세대 고대역폭 메모리)를 제공한다. 차세대 PCle® 4.0을 지원하는 최초의 GPU로, x86 기반에서 CPU와 GPU를 연결하는 데 기존 기술보다 최대 2배 빠른 속도를 제공한다. AMD 인피니트 패브릭™(AMD Infinite Fabric™) 기술이 GPU 간 연결을 지원하며, 3세대 PCle® 대비 최대 6배 향상된 속도를 제공한다.

AMD는 신형 가속 카드의 기능과 호환되는 새로운 버전의 ROCm 오픈 소스트웨어 플랫폼도 함께 발표했다. 새로운 ROCm 플랫폼은 고객이 고성능의 에너지 효율성이 높은 이종 컴퓨팅 플랫폼을 개방형 생태계에 적용할 수 있도록 돕는다.

새롭게 공개되는 AMD 라데온 인스팅트 MI60 및 MI50 가속 카드는 다음과 같은 기능과 이점을 제공한다.

- 최적화된 딥러닝 실행(Optimized Deep Learning Operations): FP16 및 FP32의 혼합 정밀도 연산 성능과 더불어 INT8 및 INT4의 다중 정밀도를 지원한다. 복합 신경망 훈련에서부터 추론에 이르기까지 다양하고 변동성이 큰 작업 수행에 필요한 성능을 제공하는 데 최적화됐다.

- 현존 최고 속도의 배정밀도(double precision) 성능을 제공하는 PCle® 가속 카드: AMD 라데온 인스팅트 MI60 가속 카드는 PCle 4.0 와 호환되며 세계에서 가장 빠른 속도의 배정밀도 성능을 제공한다. 최대 7.4 테라플롭스(TFLOPS)의 최대 FP64의 연산 성능을 기반으로 생명 과학, 에너지, 금융, 오토모티브, 항공우주, 학문, 정부 부처, 군사방어 등의 다양한 영역의 고성능 컴퓨팅 응용 프로그램을 더욱 효율적으로 운용할 수 있도록 지원한다.

AMD 라데온 인스팅트 MI50 가속 카드는 최대 6.7 테라플롭스의 최대 FP64 배정밀도 성능을 제공하며, 관리 효율성은 물론 비용 효율성까지 갖춰 딥러닝 워크로드 수행 뿐 아니라, 데스크톱 가상화(VDI), 서비스로서의 데스크톱(DaaS), 클라우드 환경에서도 유용하게 활용될 수 있다.

- 최대 6배 더 빠른 데이터 전송 속도: 각 GPU 당 2개의 AMD 인피니티 패브릭 링크(Infinity Fabric™ Links)로 최대 200GB/s의 속도로 메모리 대역을 직접 연결할 수 있으며, 이는 PCle 3.0을 단독으로 사용한 경우와 비교 시 최대 6배 이상 향상된 수준이다. 한번에 최대 4개의 GPU를 연결해 사용할 수 있으며, 이를 기반으로 총 8개의 GPU가 탑재된 서버를 구성할 수 있다.

- 초고속 HBM2 메모리: AMD 라데온 인스팅트 MI60와 MI50 가속 카드에는 각각 32GB의 ECC 메모리와16GB의 HBM2 ECC 메모리가 탑재되어 있다. 신형 가속 카드 2종 모두 풀 칩 형태의 ECC 메모리는 물론, 업그레이드된 RAS(Reliability, Accessibility, and Serviceabolity) 기능을 지원해 대규모의 고성능 컴퓨팅 시스템 적용 시 보다 더 정확한 컴퓨트 성능을 제공한다.

- 안전한 가상화 워크로드 지원: AMD MxGPU 기술은 업계 유일의 하드웨어 기반 GPU 가상화 솔루션으로, 업계 표준의 싱글 루트 I/O 가상화(SR-IOV) 기술을 기반으로 하고 있다. 하드웨어 단계에서부터 외부 해킹 시도를 방어하고, 가상 클라우드 적용 시 요구되는 높은 수준의 보안성을 제공한다.

AMD는 ROCm 오픈 소프트웨어 플랫폼도 새롭게 선보였다. 새로운 ROCm 소프트웨어 플랫폼은 고성능 및 에너지 효율성이 높은 이종 컴퓨팅 시스템에서 더욱 빠른 속도를 제공할 수 있도록 설계됐다. 신형 라데온 인스팅트 가속 카드 지원과 더불어, 새로운 딥러닝 오퍼레이션을 위한 최신 라이브러리를 제공한다.

센트OS(CentOS), 레드햇엔터프라이즈리눅스(RHEL), 우분투(Ubuntu) 등 64비트 리눅스 기반 운영 체제와 호환되며, 기존 구성요소에 대한 최적화, 텐서플로우 1.11 및 파이토치(PyTorch), 카페2(Caffe2)와 같은 최신 버전의 딥러닝 프레임 워크도 지원한다.

Copyright ⓒ Acrofan All Right Reserved



[명칭] 아크로팬   [제호] 아크로팬(ACROFAN)    [발행인] 유재용    [편집인] 유재용    [청소년보호책임자] 권용만
Copyright(c) ACROFAN All Right Reserved