ACROFAN

엔비디아, ‘GTC 21’ 통해 차세대 컴퓨팅 환경 위한 다양한 혁신 기술 선보여

기사입력 : 2021년 04월 13일 23시 40분
ACROFAN=권용만 | yongman.kwon@acrofan.com SNS
엔비디아(NVIDIA)는 태평양시 기준 4월 12일부터 16일까지 온라인으로 진행되는 GPU 테크놀로지 컨퍼런스 21(GTC 21) 행사를 통해, 차세대 컴퓨팅 환경을 위한 다양한 혁신 기술들을 선보였다. 이번 행사는 무료로 참여할 수 있으며, 데이터센터 인프라 분야의 최고경영자 및 IT 전문가를 포함한 10만 명 이상의 개발자, 기업 리더, 크리에이터 등이 행사에 등록할 것으로 예상된다.

GTC는 AI, 데이터 사이언스, 고성능컴퓨팅, 그래픽, 엣지 컴퓨팅, 네트워킹, 오토노머스 머신 분야에서 가장 진보된 연구를 지원하는 행사로, 개발자, 연구원, 기업 리더, 학생 들을 위한 다양한 실시간 온-디맨드 세션을 제공한다. GTC는 최근 몇 년간 AI가 획기적으로 발전, 개발, 배치되고 있는 클라우드 및 엔터프라이즈 컴퓨팅 분야에 중점을 두고 진행돼 왔다. 기조연설 및 기타 세션에서는 최고경영자 및 IT 분야 리더 대상으로 AI, 머신러닝, 자연어 처리 등 최신 워크로드를 지원하는 안전하고 가속화된 데이터센터를 구성하는 법에 대한 최신 정보를 제공한다.

엔비디아 인셉션(NVIDIA Inception) 액셀러레이터 프로그램에서 진행하는 AI 스타트업 트랙에서는 약 300개의 스타트업이 소개되며, 벤처기업을 위한 AI 데이(AI Day for VCs)에는 AI 스타트업 시장을 가속화하고 있는 엔비디아 인셉션 회원인 밴처기업들이 소개된다. 이 외에도, 엔비디아 딥 러닝 인스티튜트(DLI)에서는 개발자 대상의 세계적인 수준의 교육을 제공해 새로운 기술을 습득할 기회를 제공한다. 또한, 발표자 및 다른 참가자와 의견을 나눌 수 있는 시간도 마련된다.

▲ CPU와 GPU, 고속 메모리와 인터커넥트를 긴밀하게 결합한 엔비디아 ‘그레이스’ (자료제공: NVIDIA)

▲ 고속 인터커넥트를 통해, 시스템 메모리에서 GPU까지 연결 대역폭을 크게 높였다

▲ Arm 프로세서 생태계에서 엔비디아 GPU와의 결합 사례도 늘어나고 있다

엔비디아의 ‘그레이스(Grace)’ 는 데이터센터에서의 대규모 AI 및 HPC 워크로드를 위한 프로세서로, 에너지 효율적인 Arm CPU 코어와 저전력 메모리 서브시스템, GPU와의 고속 인터커넥트를 결합해, 자연어 처리, 추천 시스템, AI 슈퍼컴퓨팅과 같이 초고속 컴퓨팅 성능과 대용량 메모리를 모두 필요로 하는 방대한 데이터세트를 분석할 수 있게 설계되었다. 특히, 이 프로세서는 파라미터가 1조 개가 넘는 차세대 NLP 모델 훈련과 같은 워크로드에 고도로 특화된 프로세서로, 엔비디아의 GPU와 긴밀하게 결합되었을 때, x86 CPU에서 실행되는 엔비디아 DGX 기반 시스템보다 10배 더 빠른 성능을 제공할 수 있다.

엔비디아는 이 ‘그레이스’가 차세대 ARM 네오버스 코어를 기반으로 하며, 메모리는 500GB/s 이상의 대역폭을 제공하는 LPDDR5x를 사용하고, 엔비디아의 GPU와는 900GB/s 이상의 대역폭의 NVLink를 통해 연결되며, 단일 메모리 주소 공간으로 통일된 캐시 일관성을 제공한다고 밝혔다. 이를 통해, 기존의 x86 기반 시스템과 GPU가 PCIe로 연결되는 구조에서의 병목 현상을 극복하고, 대역폭 최적화된 아키텍처를 구현할 수 있을 것으로 소개했다. 엔비디아는 이 ‘그레이스’의 4개 구성에서 GPU와 그레이스 간의 직접 연결 구성으로, 메모리에서 GPU에 이르는 대역폭은 최대 2,000GB/s를 구현할 수 있을 것으로 기대했다.

한편, 스위스 국립 슈퍼컴퓨팅 센터(CSCS)는 HPE가 구축하게 될 그레이스 기반 슈퍼컴퓨터 알프스(Alps)를 2023년 공식 운영할 예정이다. 이 시스템은 HPE Cray EX 슈퍼컴퓨터 제품군을 기반으로 HPE Cray 소프트웨어 스택뿐 아니라, 엔비디아 GPU, 엔비디아 HPC SDK, 그리고 새로운 Arm 기반 엔비디아 그레이스(Grace) CPU를 갖춘 엔비디아 HGX 슈퍼 컴퓨팅 플랫폼을 탑재한다. 또한 이 시스템은 엔비디아의 2.8엑사플롭의 AI 성능을 갖춘 셀린(Selene) 슈퍼컴퓨터보다 7배 빠른 성능을 제공하며, GPT-3 모델을 단 이틀 만에 훈련할 수 있다고 덧붙였다.

이와 함께, 엔비디아는 자사의 GPU와 Arm 기반 CPU를 결합한 새로운 이니셔티브를 공개했다. 이번 이니셔티브는 AWS 그래비톤2(AWS Graviton2) 기반 아마존(Amazon) EC2 인스턴스와 엔비디아 GPU의 결합, 새로운 고성능컴퓨터(HPC) 개발자 키트로 과학 및 AI 애플리케이션 배포 지원, 엣지 단에서 비디오 애널리틱스 및 보안 기능 강화, 엔비디아 RTX GPU를 탑재한 새로운 Arm 기반 PC 개발을 목표로 한다. 이 이니셔티브의 일환으로, AWS는 ‘그래비톤2’ 프로세서와 엔비디아의 GPU를 결합해, 클라우드 상에서 안드로이드 게이밍 스트리밍 서비스 등을 제공하는 데 활용할 계획이고, 2021년 하반기에 이를 선보일 수 있을 것이라 소개했다.

과학 컴퓨팅을 지원하기 위한 엔비디아 Arm HPC 개발자 키트는 최대 3.3GHz의 속도를 지원하는 80개의 Arm 네오버스 코어로 구성된 암페어(Ampere)의 알트라(Altra) CPU, 각각 312테라플롭(TF)의 FP16 딥러닝 성능을 제공하는 듀얼 엔비디아 A100 GPU, 네트워킹, 스토리지, 보안을 가속화하는 두 개의 엔비디아 블루필드-2(BlueField-2) DPU로 구성된다. 엣지에서는 마벨(Marvell)과의 협력으로 OCTEON DPU와 GPU를 결합해 클라우드, 엔터프라이즈, 캐리어, 엣지 애플리케이션을 가속화하며, PC 부분에서는 미디어텍(Mediatek)의 CPU와 엔비디아의 RTX GPU를 결합해, 크로미엄(Chromium), 리눅스(Linux), 엔비디아 SDK를 지원하는 레퍼런스 플랫폼을 만들고 있다.

▲ 엔터프라이즈 환경에서 AI를 위해 바로 활용할 수 있는 인프라를 제공하는 DGX (자료제공: NVIDIA)

▲ 자비스 대화형 AI 플랫폼은 모든 산업과 영역에 적용할 수 있도록 준비되었다

▲ 양자컴퓨터의 개발 또한 cuQuantum을 통해, GPU로 가속화할 수 있을 것이라 제시했다

엔터프라이즈 컴퓨팅에서 엔비디아의 DGX는 AI를 위해 바로 활용할 수 있는 인프라를 제공하며, 워크스테이션 형태의 DGX Station A100, 데이터센터의 모듈러 빌딩블록 형태인 DGX A100, 데이터센터 인프라 형태의 턴키 솔루션인 DGX SuperPOD 등 세 가지 형태로 제공되고 있다. 이 중 ‘DGX SuperPOD’는 20개 이상의 DGX A100 시스템과 인피니밴드 HDR 네트워킹으로 구성된 AI 슈퍼컴퓨터로, 사용자의 데이터를 오프로드, 가속화 및 격리하는 엔비디아 블루필드(BlueField)-2 DPU 기술을 지원해 AI 인프라에 대한 안전한 연결을 제공하고, 여러 사용자들과 IT 관리자들이 DGX SuperPOD에 안전하게 접근, 공유, 운영할 수 있게 하는 엔비디아 베이스 커맨드(NVIDIA Base Command)를 제공한다.

또한, 엔비디아는 DGX 스테이션 A100을 위한 서브스크립션 프로그램을 공개했다. 새로운 서브스크립션 프로그램은 사무실이나 연구시설은 물론 집에서 원격근무를 하는 직원들을 위해 데이터센터 외부에서도 모든 단계에서 AI 개발을 보다 쉽게 가속화하도록 돕는다. 엔비디아는 A100 80GB GPU 4개가 장착된 DGX 스테이션 A100이 자연어 처리와 같은 복잡한 AI 워크로드를 위해 이전 제품대비 3배 빠른 속도를 제공하며, 최대 28명의 데이터 사이언티스트가 DGX 스테이션 A100를 통해 동시에 작업할 수 있으므로, 기업은 AI 개발 시간을 단축시키는 동시에 데이터센터 서버 대비 최대 70만 달러를 절감할 수 있다고 제시했다.

엔비디아의 메가트론(Megatron)은 자연어 처리 등의 거대한 모델 구현에 있어 훈련과 추론 성능을 높일 수 있는 새로운 소프트웨어 프레임워크로 소개되었다. 이를 통해 대규모의 모델을 처리하기 위한 DGX 등의 인프라에서 GPU 등 컴퓨팅 리소스로의 병렬처리 수준을 최적화해 성능을 극대화할 수 있다. 엔비디아는 이 프레임워크를 기반으로 했을 때, GPT-3 모델 기반 챗봇에서 듀얼 소켓의 CPU 기반 서버가 1개 쿼리를 처리하는 데 1분 이상 소요될 때, DGX A100은 초당 16쿼리를 처리할 수 있는 성능을 제공할 수 있다고 소개했다.

엔비디아의 자비스(Jarvis) 대화형 AI 프레임워크는 개발자들이 모든 산업과 영역에 쉽게 적용할 수 있는 대화형 AI 서비스를 구축할 수 있도록 사전 훈련된 최첨단 딥러닝 모델과 소프트웨어 툴을 제공한다. 자비스 프레임워크에는 정확한 자동 음성인식과 여러 언어에 대한 실시간 번역, 표현력 있는 대화형 AI 에이전트를 생성하는 새로운 텍스트 음성 변환 기능이 포함되어 있으며, 클라우드, 데이터센터 또는 엣지에 구축되어 수백만 명의 사용자로의 즉시 확장이 가능하다. 한편, 자비스는 10억 페이지 이상의 텍스트, 6만 시간의 음성 데이터, 다양한 언어, 억양, 환경 및 용어로 수백만 시간 동안 훈련된 모델을 사용해 제작되었으며, 개발자는 엔비디아 타오(NVIDIA TAO)를 통해 모든 작업, 산업 및 시스템에서 이러한 모델을 쉽게 훈련, 조정 및 최적화할 수 있다.

엔비디아의 ‘cuQuantum’은 차세대 컴퓨팅 기술로 주목받는 퀀텀 컴퓨팅으로의 여정을 가속화할 수 있도록 지원한다. 퀀텀 컴퓨팅을 구현하는 과정에서 필요한 대규모 시뮬레이션의 수행에 있어, 엔비디아의 cuQuantum은 이 양자 시뮬레이션을 GPU로 가속화해 시뮬레이션에 필요한 시간을 크게 줄이고, 더 큰 규모의 시스템을 시뮬레이션할 수 있게 한다. 또한 향후의 양자 컴퓨터에서 사용할 소프트웨어를 미리 개발, 연구하는 것도 cuQuantum 기반의 퀀텀컴퓨팅 시뮬레이터를 통해 가능할 것으로 소개되었다.

▲ EGX 엔터프라이즈 플랫폼을 위한 생태계도 더욱 확장되었다

▲ ‘블루필드-3’ DPU는 400Gbps 네트워크 연결과 실시간 암호화 성능 등을 갖췄다

엔비디아는 이번 GTC 21을 통해, 엔터프라이즈 데이터센터 인프라에서 애플리케이션을 구동하는 조직들이 AI 구현을 가속화하도록 돕는 새로운 엔비디아 인증 시스템들을 소개했다. 엔비디아의 EGX 엔터프라이즈 플랫폼은 엔비디아 인증 서버와 A100/A30 GPU, A40/A10 GPU, 블루필드(BlueField) DPU 등을 기반으로 구성되며, VMware vSphere 7에서 독점적으로 실행되는 엔비디아 AI 엔터프라이즈(NVIDIA AI Enterprise) 소프트웨어 스위트를 구동하도록 인증됐다. 한편, 이번 발표에서는 메인스트림 AI 및 데이터 분석을 위한 엔비디아 A30 GPU와 AI 지원 그래픽, 가상 워크스테이션, 혼합 컴퓨팅 및 그래픽 워크로드를 위한 엔비디아 A10 GPU를 탑재한 새로운 시스템들이 추가되면서 생태계가 한층 확대됐다.

엔비디아 암페어(Ampere) 아키텍처를 기반으로 하는 A30은 업계 표준 서버를 위한 다양한 성능을 합리적인 가격에 제공한다. 24GB의 HBM2 GPU 메모리와 PCIe 4.0 인터페이스를 제공하며, 엔비디아 멀티-인스턴스 GPU 기술을 통해 4개의 6GB GPU 인스턴스를 지원한다. 엔비디아의 3세대 엔비디아 텐서(Tensor) 코어는 단일 정밀도 부동 소수점 연산(FP32)을 지원하여, 이전세대의 엔비디아 T4 GPU보다 20배 향상된 성능을 제공한다. 또한 A10 텐서 코어 GPU는 메인스트림 엔비디아 인증 시스템에서 그래픽, 렌더링, AI 및 컴퓨팅 워크로드를 가속화하며, 24GB의 메모리를 제공하여 디자이너, 엔지니어, 아티스트 및 사이언티스트의 작업을 효율화한다.

엔비디아의 블루필드(BlueField) DPU는 소프트웨어 정의 인프라의 서버에서 프로세서가 수행하던 소프트웨어 정의 네트워크, 보안, 스토리지, 인프라 관리 등 몇 가지 기능들을 하드웨어 가속 처리할 수 있게 하며, CPU가 비즈니스 크리티컬한 애플리케이션의 실행에 집중할 수 있게 한다. 그리고 엔비디아가 이번 GTC 21에서 발표한 차세대 ‘블루필드-3’ DPU는 16개의 ARM 코어를 갖추고, 400Gbps 네트워크 인터페이스와 라인레이트 암호화 성능을 제공한다. 또한 블루필드-3는 블루필드 DPU에서 실행되는 애플리케이션 구축을 위한 DOCA(data-center-infrastructure-on-a-chip architecture) 플랫폼을 활용한다. 이 ‘블루필드-3’ DPU는 2022년 1분기에 샘플이 제공될 예정이다.

한편, 이 ‘블루필드-3’는 사이버 위협에 대한 실시간 네트워크 가시성, 탐지 및 응답 기능을 제공하며, AI 기반 클라우드 네이티브 사이버 보안 플랫폼인 엔비디아 모르페우스(NVIDIA Morpheus)의 모니터링 또는 원격 측정 에이전트 역할을 수행할 수 있다. 엔비디아 모르페우스는 머신러닝을 사용해 암호화되지 않은 민감한 데이터, 피싱 공격 및 악성코드 유출을 포함해 이전에는 식별할 수 없었던 위협 및 이상 징후를 파악, 포착 및 조치할 수 있다. 모르페우스를 보안 애플리케이션과 함께 배포하면 엔비디아 AI 컴퓨팅과 엔비디아 블루필드-3 DPU를 활용해 모든 컴퓨팅 노드가 엣지에서 사이버 방어 센서 역할을 할 수 있어, 데이터 복제 없이 회선 속도로 모든 패킷을 분석하고, 데이터센터를 코어에서 엣지까지 보호할 수 있다.

▲ 엔비디아 옴니버스 엔터프라이즈는 기업의 3D 제작 팀이 원활히 협력할 수 있는 새로운 차원의 환경을 제공한다

이제 3D 워크플로우는 게임과 미디어, 엔터테인먼트 뿐 아니라, 제조업과 건축, 로보틱스, 자동차에 이르기까지 모든 산업군에서 중요한 기술이 되었다. 그리고 엔비디아의 ‘옴니버스(Omniverse)’ 플랫폼은 이러한 3D 그래픽 기술을 모든 워크로드로 확장하는 플랫폼으로, PC와 노트북에서부터 데이터센터에까지 활용되고 있는 엔비디아의 GPU 기술을 기반으로, 그래픽은 물론 GPU 컴퓨팅과 AI에 이르기까지 모든 워크로드로 GPU 활용을 확장하고, 다양한 소프트웨어 제품군에 걸쳐 개방형 파일 프레임워크, 소프트웨어 애플리케이션 간의 상호운용성을 기반으로 단일 플랫폼에서 워크플로우 협업이 가능한 환경을 제공한다.

엔비디아 옴니버스 엔터프라이즈(NVIDIA Omniverse Enterprise)는 여러 소프트웨어 제품군에서 작업하는 전 세계 3D 디자인 팀이 공유된 가상 공간에서 실시간으로 협업할 수 있도록 지원하는 기술 플랫폼이다. 대규모 조직에서 다양한 기술을 사용하고 지리적으로 분산되어 있는 3D 제작 팀이 복잡한 프로젝트를 위해 원활히 협력할 수 있으며, 디자이너, 아티스트 및 검수자들은 대면 회의나 대용량 파일의 교환 등을 반복하는 대신, 언제 어디서나 모든 디바이스에서 가상 세계에 접속해 동시에 작업할 수 있다.

옴니버스 엔터프라이즈는 클라이언트 간에 공유되는 데이터베이스를 관리하는 엔비디아 옴니버스 뉴클레스(NVIDIA Omniverse Nucleus) 서버와, 업계 선도적인 디자인 애플리케이션을 연결하는 플러그인인 엔비디아 옴니버스 커넥터가 포함된 새로운 플랫폼이다. 또한 장면 구성을 가속화하고 사용자가 실시간으로 장면을 조합, 조명, 시뮬레이션 및 렌더링 할 수 있게 해주는 엔비디아 옴니버스 크리에이트(NVIDIA Omniverse Create)와 사실적인 렌더링을 통해 건축 및 엔지니어링 프로젝트의 원활한 협업 설계와 시각화를 지원하는 엔비디아 옴니버스 뷰(NVIDIA Omniverse View)를 포함한다.

옴니버스 엔터프라이즈는 엔비디아 인증 EGX 플랫폼에서 실행할 수 있도록 최적화되었으며, 로컬 데스크톱 및 랩톱을 사용하는 소규모 그룹부터 다양한 장치를 활용해 데이터센터에 액세스하는 대규모 팀에 이르는 모든 조직이 구축할 수 있다. 또한 옴니버스 엔터프라이즈 플랫폼을 VMware vSphere 환경 위에서 구현할 때, 엔비디아 RTX 가상 워크스테이션(vWS) 소프트웨어는 협업자들이 그래픽 집약적인 3D 애플리케이션을 어디서나 자유롭게 실행할 수 있도록 돕는다. 이 옴니버스 엔터프라이즈 플랫폼은 엔비디아의 엔터프라이즈 지원 서비스가 포함된 서브스크립션 형태로 이용 가능하며, 2021년 여름 정도에 고객에 제공될 것으로 발표되었다.

▲ 엔비디아 드라이브 아틀란은 기존보다 크게 향상된 성능으로, 2025년 모델에 탑재되는 것을 목표로 한다

자율주행차의 구현을 위한 플랫폼에서는, 자율주행차용 차세대 AI 지원 프로세서인 ‘엔비디아 드라이브 아틀란(NVIDIA Drive Atlan)’이 공개되었다. 차세대 GPU 아키텍처, Arm 코어, 딥 러닝 및 컴퓨터 비전 가속기, 블루필드 DPU 등으로 구성될 이 프로세서는 1,000 TOPS의 성능을 제공할 것으로 기대되며, 주요 자동차 제조업체의 2025년 모델에 탑재되는 것을 목표로 한다. 또한, 데이터센터 수준의 성능으로 자동차 제조업체들이 안전한 무선 업데이트(OTA)를 통해 프로그래밍이 가능하며 영구적 업그레이드가 가능한 소프트웨어 정의형 차량을 구축할 수 있는 다양한 컴퓨팅 기능을 제공한다.

또한 엔비디아는 소프트웨어 정의 차량과 자율주행차를 구현하는 기반이 될 Hyperion 8 자율주행차용 플랫폼을 발표했다. 이 플랫폼의 핵심에는 두 개의 엔비디아 드라이브 오린(NVIDIA Drive Orin) SoC 구성이 있으며, 레벨 4의 자율주행 구현과 인텔리전트 콕핏을 구현하기 위한 컴퓨팅 성능을 제공한다. 또한 IX 컴퓨터에는 싱글 오린 SoC, 3D 실측 정보 수집은 듀얼 오린 SoC와 듀얼 CX6 구성을 제공한다. 센서 구성에서는 8MP급 카메라 8개, 3MP급 어안 카메라 4개, 실내용 카메라 3개, 9개의 레이더, 2개의 라이다를 갖추고 있다. 자동차 제조업체들은 이 플랫폼을 기반으로 센서 구성 등을 변경해, 자율주행차를 위한 시스템을 빠르게 구성할 수 있다.

한편, 자율주행차 구현을 위한 AI 및 컴퓨팅 플랫폼을 제공하는 엔비디아 드라이브는 풍부한 글로벌 소프트웨어와 생태계를 갖추고 있으며, 여러 세대의 아키텍처에 걸쳐 호환된다. 이전 세대의 ‘자비에(Xavier)’나 현재 세대의 오린(Orin)은 물론, 이 자리에서 소개되어 2025년 이후 생산되는 차량에 탑재되는 것을 목표로 하는 ‘아틀란(Atral)까지, 모두 개방형 쿠다(CUDA) 및 텐서RT(Tensor RT) API, 라이브러리를 통해 프로그래밍이 가능하므로, 개발자들은 향후 자율주행차 로드맵 수립 시 여러 제품세대에 걸쳐 투자를 활용할 수 있다.

또한 자율주행차의 훈련과 검증을 위한 시뮬레이터인 ‘드라이브심 (Drive SIM) 2.0’은 엔비디아 옴니버스 플랫폼을 기반으로 더욱 유연하고 강력해졌다. 자율주행차의 시뮬레이션 테스트를 위한 환경을 제공하는 ‘드라이브심 2.0’은, 단일 통합 월드 모델의 구현과 확장, 반복 가능한 멀티 센서 아키텍처, RTX 기술을 활용한 고정밀도의 실시간 센서 시뮬레이션 등을 지원할 수 있다. 또한 옴니버스 플랫폼 생태계의 지원으로, 가상의 자율주행차가 달려야 할 가상 세계의 구축에서도 더욱 유연한 면모를 갖추었다고 덧붙였다.


Copyright ⓒ Acrofan All Right Reserved.

디지털 마케팅의 새로운 장을 만들다! 신개념 퍼포먼스마케팅 플랫폼 '텐핑'

[명칭] 아크로팬   [제호] 아크로팬(ACROFAN)    [발행인] 유재용    [편집인] 유재용    [청소년보호책임자] 권용만
Copyright © ACROFAN All Right Reserved