ACROFAN

Arm, 향상된 보안, AI, 특화된 프로세싱을 제공하는 차세대 아키텍처 ‘Armv9’ 발표

기사입력 : 2021년 04월 01일 16시 28분
ACROFAN=권용만 | yongman.kwon@acrofan.com SNS
Arm은 3월 31일 ‘Arm 비전 데이(Arm Vision Day)’ 온라인 미디어 브리핑을 통해, 향상된 보안, 인공지능(AI), 유비쿼터스 전용 프로세싱에 대한 전세계적인 요구에 대응하기 위해 설계된 차세대 아키텍처 ‘Armv9’의 주요 특징들을 소개했다. Armv8 이후 10년만에 선보이는 새로운 Arm 아키텍처인 Armv9은, 이전 세대와의 호환성을 기반으로, 더욱 높은 성능, 강화된 보안, 디지털 신호 처리(DSP)와 머신러닝 역량을 제공하며, 애플리케이션들이 특화된 컴퓨팅으로 전환하는 추세를 가속화할 것으로 기대된다.

Arm은 지난 5년간 업계 평균을 뛰어넘는 속도로 프로세서 성능을 향상시켜 왔으며, Armv9 세대에서도 이러한 모멘텀을 유지해, 다음 두 세대의 모바일 및 인프라 전용 프로세서에서도 30% 이상의 성능 향상을 선보일 계획을 밝혔다. 또한 워크로드 최적화된 프로세싱으로의 전환에 있어서도, Arm은 특화된 프로세싱을 강화하는 것과 더불어, ‘토털 컴퓨트(Total Compute)’ 설계 방식을 적용해, 시스템 수준의 하드웨어 및 소프트웨어 최적화를 통해 전반적인 컴퓨팅 성능을 가속화하고, 사용사례 기반의 성능을 높일 것이라 소개했다.

이제 모든 분야에서 다양한 형태로 활용이 모색되고 있는 AI 성능에 대한 요구를 지원하기 위해, Arm은 ‘스케일러블 벡터 익스텐션 2(SVE2: Scalable Vector Extension 2)’를 통해 보다 향상된 머신러닝 및 디지털 신호 처리 기능을 더욱 광범위한 애플리케이션 전반에 구현할 수 있도록 지원한다고 밝혔다. 또한 Mali GPU와 Ethos NPU에 대해 진행중인 AI 혁신과 더불어 프로세서 내에서의 행렬 곱셈 기능을 대폭 강화할 것이라 소개했다. 보안 측면에서는, Arm 컨피덴셜 컴퓨팅 아키텍처(CCA: Arm Confidential Compute Architecture)를 제시하며, 하드웨어 기반의 보안 환경에서 컴퓨팅을 수행함으로써 처리 중인 상태의 일부 코드 및 데이터가 상위 권한의 소프트웨어에서도 접근 및 수정될 수 없도록 보호한다.

▲ 향후 10년을 이끌어갈 Armv9은 보안과 AI, 전문 컴퓨팅 구현의 유연성을 특징으로 제시했다 (자료제공: Arm)

Arm 코리아 황선욱 지사장은 이 자리에서, Arm은 지난 분기 파트너들의 Arm 기반 칩에 대한 분기 출하량이 67억개에 달하며, Arm 설립 이후 지금까지 파트너들이 출하한 칩은 1800억 개 이상이고, 특히 Cortex-M 기반 칩의 분기 출하량은 44억개를 돌파하면서, IoT 및 임베디드 영역에서 확고한 입지를 확보했다고 밝혔다. Arm의 에코시스템도 지속적으로 성장하고 있으며, 2020년 한 해동안 Arm은 175개의 신규 라이선스 계약을 체결했고, 그 중 다수가 Arm과 처음 계약한 파트너이며, 이는 Arm의 로드맵과 ‘토털 컴퓨팅’의 강점을 보여 주는 성과라고 강조했다.

국내에서는, 팹리스 스타트업 지원을 위한 정부와의 협업도 진행하고 있으며, 중소벤처기업부 및 서울대와 협업해, 스타트업들이 시스템 반도체 설계를 하는 데 필요한 Arm의 IP들을 초기에 무상으로 사용할 수 있도록 지원하는 ‘플렉서블 액세스’ 프로그램을 운영하고 있다고 소개했다. 현재 이 프로그램은 13개 스타트업들이 사용하고 있으며, Arm은 올해도 이 프로그램을 지속적으로 확대, 지원할 것이라 덧붙였다. 한편, Arm은 지난 10년간 큰 성장을 이루었으며, 이 자리에서 소개하는 차세대 아키텍처인 Armv9는 Armv8 이후 앞으로의 10년을 주도할 기술이며, 10년 주기의 기술 전환이 시작되는 특별한 시점에 있다고 의미를 부여했다.

Arm의 CEO인 사이먼 시거스(Simon Segars)는 Arm의 IP와 이를 기반으로 한 프로세서, 디바이스들이 다루어야 할 과제들과, 이를 위한 Armv9의 기술들을 언급했다. 먼저, 업무 환경의 변화에 대한 기술의 역할에 있어서는 건물 내 자동화 및 통제에서 AI 및 보안 기술이 활용될 것이고, Arm 기반 프로세서와 GPU, 특화된 프로세싱을 위한 MPU들이 결합되어, AI로 구동되는 디지털 트윈을 활용해 실시간으로 주요 장비를 모니터링하고, 클라우드에 데이터를 모을 수 있을 것으로 소개했다. 또한 이러한 AI의 활용은 현재에도 냉각 시스템에 적용되어 에너지 소비를 50% 이상 절감하고 있으며, 향후 건물 관리에도 컨피덴셜 컴퓨팅, 분산 지능, 소프트웨어 정의 등이 중요하게 다루어질 것이라 덧붙였다.

개인의 의료 정보 등 민감한 정보를 저장하고 휴대하면서 사용하는 데 있어, 신뢰할 수 있는 디지털 증명서가 있는 스마트폰의 활용은 가장 현실적인 방향으로 꼽힌다. 그리고 이러한 민감한 정보들을 안전하게 저장하고 활용하기 위해서는 강력한 보안 체계가 필요하다. Arm은 Armv9 아키텍처에 포함된 메모리 태깅 익스텐션(Memory Tagging Extension) 등의 기술로 이러한 요구에 대응할 수 있으며, 영역 관리 기능(RME: Realm Management Extensions) 기능을 통해 안전한 데이터 조작이 가능한 영역을 마련하고 있다고 강조했다.

또한 Arm은 새로운 Armv9이 업그레이드된 스케일러블 벡터 익스텐션인 ‘SVE2’를 통해 특수 AI, 디지털 신호 처리(DSP), XR 워크로드를 아우르는 확장된 지원을 제공한다고 밝혔다. 또한 AI를 한층 더 발전시킬 행렬 곱셈 기능에 대한 그래픽 업그레이드를 준비하고 있다고 덧붙였다. 한편, AI는 더 효율적인 컴퓨팅을 필요로 하며, Arm은 파트너들이 목표로 하는 AI의 미래를 실현하는 것을 지원하고 있고, 엔비디아(NVIDIA)와의 협력은 Arm의 컴퓨팅 플랫폼과 에코시스템이 엔비디아의 AI 전문성과 결합되어, AI 시대에 맞는 선도적인 컴퓨팅 기업을 탄생시킬 것으로 기대했다. 또한 이러한 결합은 Arm의 R&D 역량을 강화하고, 새롭고 흥미로운 제품들이 개발될 수 있도록 함으로써 Arm의 비전을 실현시킬 것이라고 밝혔다.

▲ Armv9은 지금까지의 Arm IP들이 달성한 성과를 새로운 차원으로 결합한다 (자료제공: Arm)

르네 하스(Rene NaaS) Arm IP 그룹 대표는 Armv9에 대해, Arm이 지금까지 토탈 컴퓨티, CPU, GPU, NPU 등에서 해왔던 모든 작업을 아우르는 것으로 소개했다. 또한 여러 사례들을 통해 이미 시장에서 상당한 성능 향상이 실현되고 있다는 점을 확인했으며, 대표적인 예로 Cortex-M55 CPU와 Ehhos-U55 NPU의 조합은 머신 러닝을 사용하는 표준 프레임워크에서 성능을 500배 가까이 향상시켰다고 밝혔다. 이와 함께, 보안 측면에서 Arm은 Armv9에 대해 많은 노력을 기울임으로써 신뢰를 높이고, 영역(Realm)을 사용한 컨피덴셜 컴퓨팅을 향상시킬 뿐만 아니라 개발자와 사용자 모두에게 이점을 제공할 것이라 덧붙였다.

개발자들에게 있어, Armv9의 이점은 빠르게 쓰고 빠르게 실행되는 것을 넘어 ‘그냥 작동되는’ 것을 실현할 수 있을 것이라고 밝혔다. 그리고 파트너들과의 폭넓은 협업 측면에서, 마이크로소프트와는 IoT 개발자들을 위한 공통 툴체인을 공동 개발하고 있으며, 유니티(Unity)와는 퍼포먼스 바이 디폴트(Performance by default)를 실현하기 위해 협력하여 3D와 VR을 위한 성능을 향상시키고 있다고 소개했다.

컴퓨팅의 측면에서, Arm 아키텍처는 클라우드의 데이터 처리 능력을 확장하는 새로운 방법을 제시한다. 특히 데이터센터용 칩의 전력 효율 측면에 있어, Aws의 Arm 기반 SoC 그래비톤(Graviton)은 좋은 사례가 된다고 소개했다. 그리고 Arm은 그래비톤을 프로세서 IP와 검증을 위한 설계 클라우드로 사용하고 있으며, 이는 Arm의 데이터센터 크기를 절반으로 줄이고, 온프레미스 인프라를 80% 감소하는 데 도움을 주고 있고, EDA 워크플로우의 성능 시간은 6배 높아졌으며, 더욱 향상될 것으로 기대한다고 밝혔다. 이 외에도 생태계에서의 새로운 접근법 측면의 예로는 남아프리카 국립 수혈 서비스가 시범 운영 중인 드론이나, 인도네시아의 열대우림 보호를 위한 오디오 모니터링 시스템 구현 등을 꼽았다.

한편, Arm의 목표는 다양한 개발자들이 Arm을 통해 빠르게 쓰고 실행할 수 있도록 하는 것이며, 방대한 에코시스템에서 이루어질 수 있는 협업의 범위 또한 넓다고 소개했다. 먼저 ‘프로젝트 카시니’ 는 클라우드 네이티브 소프트웨어 스택에 최적화된 보안 서버, 5G 기지국, 기타 디바이스를 설계하는 데 필요한 프레임워크를 구축한다. 목표는 ‘모두 즉시 구동 가능하도록’ 하는 것으로, 칩 설계자와 OEM들은 자사 제품들이 모든 스펙트럼의 소프트웨어 애플리케이션 및 서비스와 조화롭게 구동된다고 보장할 수 있다. 또한 Arm이 오픈소스 소프트웨어에 대한 지원을 확대하는 가운데, 리나로(Linaro)는 Arm 기반 리눅스를 이끌고 있다고 덧붙였다.

▲ ‘시스템레디’는 생태계의 유연성과 표준화 기반의 장점을 절충할 수 있는 프로그램이다 (자료제공: Arm)

지난 30년 동안 출하된 1,800억 개가 넘는 Arm 기반 디바이스들은 Arm 아키텍처를 기반으로, Arm 에코시스템에 있는 소프트웨어를 실행할 수 있다. 하지만 아키텍처는 지속적으로 변화하고 있으며, Arm은 혁신과 진화를 거듭하는 아키텍처를 제공함으로써 변화하는 컴퓨팅 세계의 요구사항들을 충족시키고 있다. 그리고 Arm은 Armv8을 통해 64비트 프로세싱을 선보인 이후, 10년 동안 가상화 지원 향상, 머신러닝 성능 강화를 위한 float-15, bfloat 추가, ROP(Return-oriented programming)에 대한 회복력을 높이고 안전한 하이퍼바이저에 대한 지원을 추가하는 등 다양한 확장 기능들을 추가했다고 소개했다.

Armv9은 기존의 Armv8을 이어 향후 10년을 이끌어 갈 아키텍처이며, 초소형 마이크로컨트롤러부터 대규모 서버 중심 설계에 이르는 모든 Arm 프로세서의 근간이 될 것으로 기대된다. 또한 이제 사실상 모든 공유 데이터가 생애주기 중 적어도 한 번은 Arm 프로세서를 통해 처리될 것이며, 특히 네트워크 엣지 등에서 더욱 강력한 컴퓨팅 파워와 시스템 표준화가 필요해지고 있다고 지적했다. Arm은 이러한 컴퓨팅 작업을 수행하기 위해서는 새로운 구성 요소가 필요하다고 생각했으며, 워크로드의 특성에 맞추어 프로세서, GPU 및 NPU 등 컴퓨팅 IP 구성 요소들을 제공하는 Arm의 접근 방식은 파트너들이 ‘목적 기반 시스템’을 개발하는 데 큰 장점이 있다고 강조했다.

이 ‘목적 기반’ 시스템 설계는 모든 형태의 컴퓨팅에서 혁신을 일으키는 핵심 요소가 될 것으로 기대된다. 다양한 컴퓨팅 문제에는 다양한 컴퓨팅 구성 요소들의 조합이 요구되는데, 이런 양상은 IoT나 모바일, 자동차, 서버, 네트워킹, 그리고 컴퓨팅 스펙트럼 전반에서 나타나고 있다. 하지만 이 때, 적절한 수준의 표준화를 위한 균형점을 찾아야 하며, 지나친 표준화는 유연성을 해치고, 지나친 유연성은 가치가 낮은 유사 솔루션들이 생길 위험을 만들고, 소프트웨어 생태계에 비용 부담만 증가시키게 된다.

서버 분야에서는 이러한 균형의 중요성이 확인되었으며, 불필요한 변형을 방지하면서 가치 있는 차별화를 허용하는 방안의 일환으로 ‘서버 베이스 시스템 아키텍처(SBSA)’와 이를 검증하는 프로그램인 ‘서버레디(ServerReady)’를 발표한 바 있다. 그리고 Arm은 이제 네트워크 엣지에서 점점 더 많은 컴퓨팅이 활용되고 있다는 점을 감안해 시스템 표준화의 범위를 확장하고 있으며, ‘시스템레디(SystemReady)’는 서버레디 프로그램의 컨셉을 클라우드부터 IoT 엣지를 아우르는 더 방대한 범위의 디바이스로 확장함으로써 일반적이며 규격화된 운영체제 및 하이퍼바이저와의 상호운용을 가능하게 한다고 설명했다.

▲ SVE2는 머신러닝이나 xR 워크로드 등 다양한 사용 사례에서 높은 처리 성능을 제공할 것으로 기대된다 (자료제공: Arm)

Armv9은 단계적인 장기 프로그램으로, Arm은 앞으로 수년간 아키텍처에 디지털 신호 처리(DSP)나 머신러닝과 같이 널리 활용되는 분야의 컴퓨팅 능력을 향상시키고, 시스템의 보안과 견고함을 향상시키는 등 다양한 개선점을 구현해 나갈 계획이며, 이러한 기술들은 Arm 아키텍처의 세 가지 프로파일 모두에 사용될 것이라고 밝혔다. 그리고 이제는 컴퓨팅 분야의 새로운 주요 트렌드로 떠오른 머신러닝과 인공지능에 대해서는, 이제 머신러닝 워크로드의 편재성과 광범위함은 한 종류의 솔루션으로 감당할 수 없으며, 우리가 사용하는 모든 컴퓨팅 디바이스들은 머신러닝에 대한 프로세서, GPU, 특화된 NPU 등의 하드웨어 지원이 향상되면서 혜택을 보게 될 것이라 전망했다.

Arm은 Armv9 아키텍처 기반의 프로세서는 새로운 벡터 처리 기능을 갖춰 보다 향상된 머신러닝 및 디지털 신호처리 역량을 제공한다고 소개했다. 또한 이는 Arm이 후지쯔를 비롯한 다른 파트너사들과 공동 개발한 벡터 익스텐션을 기반으로 구축되었으며, 확장 가능한 방식으로 설계되어 슈퍼컴퓨터에 사용되는 컨셉을 훨씬 더 광범위한 제품군으로 확장 적용할 수 있게 한다고 설명했다. 그리고 Arm은 SVE2에 부가적인 기능을 추가해, 5G 시스템을 비룻해 가상현실, 증강현실, 프로세서 내 머신러닝 등 다양한 사용 사례에서 원활히 구동될 수 있게 하며, Arm은 앞으로 이를 더욱 확장해 나가기 위해 프로세서 내부에서 진행되는 매트릭스 기반 연산 성능을 강화할 계획이라고 밝혔다.

IoT 분야의 가장 큰 당면과제 중 하나로는 수많은 엔드포인트 디바이스들의 보안성 확보가 지목되고 있다. Arm은 수많은 엔드포인트 디바이스들에서, 설계자들이 시험을 통해 검증된 보안 절차를 적용하지 않았고, 디바이스가 어떠한 위협에 노출될지 이해하지 못했기 때문에 위협에 노출되고 있다고 지적했다. 그리고 이를 개선하기 위해, Arm은 플랫폼 시큐리티 아키텍처(PSA)를 통해, 엔드포인트 설계자들이 사용할 수 있는 표준 위협 모델, 접근법 및 절차들의 모음을 제시했다고 소개했다. 또한 이를 계층형 인증 체계와 결합해 구매자들이 보안 속성을 더욱 신뢰할 수 있게 했으며, 이와 같은 원칙은 엣지 컴퓨팅 디바이스로 확장 적용될 수 있고, ‘시스템레디’ 프로그램에는 이런 시스템들이 보안 아키텍처가 모범 사례를 따르도록 보장하는 부분이 포함된다.

미래에 컴퓨팅이 분산 유틸리티가 되어, 세션을 가장 적절한 플랫폼에서 실행할 수 있는 환경에서, 컴퓨팅 인프라의 신뢰성은 보안과 프라이버시의 안정감에 핵심적인 역할을 할 것으로 기대된다. 이를 위한 ‘컨피덴셜 컴퓨팅(Confidential Computing)’은 사용 중인 데이터를 보호하는 것을 의미하며, 그 중 하나는 하드웨어 기반의 보안 환경에서 수행하는 컴퓨팅으로, 처리 중인 상태의 일부 코드 및 데이터에 상위권한의 소프트웨어(privileged software)도 접근 및 수정할 수 없도록 보호한다. 이는 기존 컴퓨팅 모델에서, 애플리케이션이 실행되는 운영체제와 하이퍼바이저에 부여하는 큰 신뢰로 인해 발생할 수 있는 위협을 제거할 수 있다.

▲ 컨피덴셜 컴퓨팅 아키텍처는 신뢰할 수 있는 ‘영역’의 동적 생성이 특징이다 (자료제공: Arm)

컨피덴셜 컴퓨팅 아키텍처(Arm Confidential Compute Architecture, CCA)는 상당 부분이 트러스트존(TrustZone)의 보안 기반을 바탕으로 구축된다. 또한 CCA는 트러스트존에 구현된 보안 세계 또는 비보안 세계에서 분리된 부분에서 동적으로 생성된 영역(Realm)이라는 개념을 선보일 예정이며, 이는 기존 애플리케이션에서도 사용이 가능하다. 이 ‘영역’은 신뢰할 수 있고 증명 가능한 관리 소프트웨어의 작은 부분을 사용하는데, 이는 운영체제나 하이퍼바이저와는 본질적으로 분리되어 있는 것이다. 이를 통해, ‘영역’은 상업적으로 민감한 데이터 및 코드를 사용 중이거나 저장 상태이거나 전송 중인 상태에서도 모든 시스템으로부터 보호할 수 있으며, 미션 크리티컬한 관리 시스템이 파괴되지 않도록 보장할 수 있다.

소프트웨어 관련 보안 문제에서 많은 문제의 근본적인 원인으로는 ‘버퍼 오버플로우’와 ‘UAF(Use-after-Free)’ 등의 메모리 안전 문제가 꼽히고 있다. 또한 이러한 문제는 발견되고 악용되기 전부터 이미 수 년 동안 소프트웨어에 빈번히 존재해 왔으며, 이러한 메모리 보안의 취약점들을 악용되기 전에 발견하는 것은 소프트웨어 보안 향상에 중요한 단계라고 강조했다. 이에 Arm은 구글과의 협력을 통해 메모리 태깅 익스텐션(MTE: Memory Tagging Extension) 기술을 개발했으며, 소프트웨어에서 시간 및 공간적 메모리 안전 문제를 모두 발견하는 데 사용될 수 있다고 소개했다. 1세대 Armv9 프로세서의 일부로 통합될 이 기능은 소프트웨어가 포인터를 태그가 있는 메모리와 서로 연결지을 수 있도록 함으로써 포인터를 사용할 때 해당 태그가 맞는 것인지 확인할 수 있게 한다.

보안 측면에서 좀 더 이상적인 접근은, 보다 근본적인 수준에서 하드웨어가 데이터에 대한 접근성 정보를 캡슐화 할 수 있도록 하는 것이다. 그리고 Arm과 케임브리지 대학교가 수년간 공동 개발하고 있는 CHERI 아키텍처는 이러한 종류의 캡슐화를 정교하게 제공할 수 있는 하드웨어 기능을 정의한다. 이를 통해 좀 더 근본적으로 안전한 플랫폼이 구현될 수 있겠지만, 일부 시스템이 프로그래밍 되는 방식에 상당한 변화가 요구된다. 그리고 이 프로젝트의 시범 시스템인 모렐로(Morello)는 ‘기능’을 컴퓨팅 보안과 견고함의 새로운 패러다임으로 활용해 주요 아키텍처를 강화할 수 있는 방안을 강구하고 있으며, 시범 시스템은 내부적으로 마무리 단계에 있다고 덧붙였다.

▲ PSA의 API와 서비스는 트러스티드 펌웨어 오픈 커뮤니티를 통해 지원되고 있다 (자료제공: Arm)

Arm은 지난 Armv8의 초기 시절부터 ‘서버 베이스 시스템 아키텍처’와 서버 기반 부팅 요건(SBBR) 등과 같은 표준을 개발해 왔으며, 추후 ‘서버레디’ 프로그램으로 이를 한층 보강했다. 이는 서버 시스템과 관련 펌웨어의 핵심 속성들을 본질적으로 정의해, 표준 운영체제가 보다 익숙한 이미지에서 부팅될 수 있도록 했다. 그리고 모든 운영체제가 모든 Arm 기반 하드웨어에서 실행가능한 목표의 달성에 있어, 종종 표준들이 Arm 에코시스템들의 다양성을 따라잡지 못하는 것으로 나타나는데, 이러한 문제를 해결하기 위해 시스템레디는 처음부터 Arm 에코시스템 내 다양한 크기의 디바이스들의 모든 요구사항을 지원하도록 설계했다고 밝혔다.

표준 OS를 운영체제에서 요구하는 펌웨어 표준을 준수하는 모든 하드웨어에서 실행 가능하게 한다는 목표는, 길게는 20년에 이르는 디바이스의 생애 주기 동안 보안 업데이트 등의 지원을 운영체제를 통해 얻을 수 있다는 장점도 기대할 수 있다. 펌웨어 단계에서는, 최근 펌웨어를 대상으로 한 공격이 늘어나는 모습이며, Arm은 Armv8을 통해 표준 보안 펌웨어를 제공하는 데 앞장서기로 했고, ‘트러스티드 펌웨어 오픈 커뮤니티’를 통해 오픈소스로 개발함으로써 생태계 전체가 이를 Arm 기반 SoC를 위한 보안의 토대로 활용할 수 있게 했다고 소개했다. 이 표준 보안 펌웨어는 초기에는 A 시리즈에만 제공되었지만, 추후 M 시리즈 지원이 추가되었고, 현재는 R 시리즈를 위한 버전이 개발되고 있다.

한편, Arm이 Armv8-M에서 했던 작업은 플랫폼 시큐리티 아키텍처(PSA)의 기반이 되었으며, 이는 A 시리즈로 확장되고 있다. 그리고 PSA가 A 시리즈로 확장됨으로써, Arm은 엔드포인트부터 클라우드까지 연결되는 범용 보안 서비스 API 세트를 Arm의 기술을 기반으로 제공할 수 있게 되었다고 밝혔다. 또한 PSA의 API와 서비스는 트러스티드 펌웨어 오픈 커뮤니티를 통해 지원되고 있으며, OPTEE(오픈소스 트러스티드 실행 환경), Hafnium(시큐어 파티션 관리자), mbedTLS 등의 기능들과 제휴해 제공되고 있다고 설명했다. 이 외에도 PSA 인증 프로그램으로 디바이스가 달성한 인증 레벨을 평가함으로써, 해당 디바이스가 특정 애플리케이션의 요구사항을 충족하는지의 여부를 명확히 파악할 수 있도록 지원한다고 덧붙였다.

▲ ‘컨피덴셜 컴퓨팅 아키텍처’는 가상화 환경 등에서 더욱 완전한 ‘격리’ 구현을 가능하게 한다

Armv9 시대로의 전환에 있어, 새롭게 선보이는 ‘컨피덴셜 컴퓨팅 아키텍처’는 분리된 영역을 구현하는 데 필요한 하드웨어 및 소프트웨어 요소들을 정립하기 위한 지난 5년간의 노력의 결과로 소개되었다. 그리고 컨피덴셜 컴퓨팅은 데이터를 호스팅하는 시스템에 대한 신뢰 강화에 있어 필수적인 요소가 될 것이며, 컨피덴셜 컴퓨팅의 일반 원칙을 적용함으로써 Arm은 점차 Armv9 아키텍처를 ‘영역’으로 개선할 것이라 밝혔다. 이는 애플리케이션을 실행할 때 사용자의 데이터를 호스트 및 해당 호스트에서 실행 중인 다른 소프트웨어에 의한 검사나 공격으로부터 보호한다.

이 ‘컨피덴셜 컴퓨팅 아키텍처’는 블록 다이어그램으로 볼 때 간단해 보이는데, Arm은 여기에 네 번째 주소 공간을 추가하고 있다. 아키텍처 수준에서 보면 하드웨어는 여러 세그먼트에서 모두 유사해 보이는데, 소프트웨어 측면에서는 각 세그먼트마다 고유한 문제들이 있고, 이는 새로운 보안 강화 기능을 사용하려면 각 소프트웨어 스택에 수정이 필요하기 때문에 발생하는 것이라 지적했다. Arm의 컨피덴셜 컴퓨팅 아키텍처에서 가장 단순한 변화 중 하나는 클라우드의 VM 호스팅 등에서, 공용 공간 주소의 일부를 제공받는 VM 대신, 같은 시스템을 공유하고 있는 다른 VM으로부터 주소 공간이 안전하게 보호되는 영역에서 호스팅 될 수 있게 된다.

한편, 이 ‘컨피덴셜 컴퓨팅 아키텍처’는 다양한 형태로의 활용이 기대된다. 예를 들면, 오늘날의 일반적인 안드로이드 시스템은 코어 스택을 실행하는 비 보안 소프트웨어, 트러스트존에서 실행되는 부분적 보안 서비스, 안드로이드와 함께 가상머신으로 실행되는 DRM 서비스가 혼합되어 있는데, 일부 보안 서비스를 트러스트존 내에서 자체 영역으로 이동시킴으로써 해당 서비스에 보다 동적인 환경을 제공할 수 있게 되는 것도 가능하다. 또한 DRM 서비스도 자체 영역으로 이동할 수 있으며, 이 때 데이터가 코어 안드로이드 스택으로부터 보호되므로 기밀성이 향상된다. 이러한 형태로, 복잡한 스택의 더 많은 부분이 각 영역으로 나누어짐으로써, 침입으로부터 다 강력한 격리 기능을 제공할 수 있게 된다.

Arm은 이러한 기술들이 전 세계의 데이터를 보호하는 데 중요한 역할을 할 것인 만큼, 개발자들이 초기 개발에 필요한 툴과 소프트웨어를 확보할 수 있도록 투자를 진행하고 있고, 이를 통해 Arm은 커뮤니티들이 이를 생산 단계까지 실현시킬 수 있도록 지원할 것이라 소개했다. 또한 Arm과 파트너사들은 모든 소프트웨어가 모든 Arm 하드웨어에서 바로 실행될 수 있도록 보장하고자 하며, 방대한 생태계가 규모에 맞게 투자할 수 있도록 하기 위해, 지난 10년간의 Armv8 시대에 Arm에서만 천만 시간 이상을 소프트웨어 개발에 투자했고, 향후 Armv9과 함께 할 새로운 10년간 Arm은 3천 만 시간 이상을 소프트웨어 개발에 투자할 것이라 밝혔다. 그리고 생태계 전반에 걸쳐서는 10만 명 이상의 엔지니어들이 15억 시간 이상을 개발에 투자할 것으로 전망했다.

▲ Arm은 AI 구동을 위한 하드웨어 구성에서 광범위한 유연성을 제공한다 (자료제공: Arm)

Arm 기반의 지능형 엔드포인트는 놀라울 정도로 광범위하게 성장하고 있다. 그리고 임베디드 세계에서의 파트너십 사례에서, Arm이 지원하는 실용적인 솔루션은 백색 가전들의 에너지 사용량까지도 절감할 수 있었으며, 가전 제품에 내장된 Arm 프로세서에서 실행되는 신경망을 통해 냉장고 등의 가전이 스스로 학습함으로써 작동 환경에 맞게 전력 소비를 최적의 상태로 조절, 10% 이상의 에너지를 절약할 수 있는 것으로 나타났다고 소개했다. 또한 헬스케어에 있어서도, 보청기에서 머신러닝 알고리즘은 소리의 균형을 맞춰 깨끗한 소리를 출력하고, 개인의 난청 종류에 따라 적합한 방식으로 소리가 조절될 수 있도록 해 뇌가 가장 자연스러운 방식으로 기능할 수 있게 할 수 있다.

하지만 머신 러닝 워크로드는 다양한 유형을 가지고 있으며, 작업 유형에 따라 다양하고 특화된 솔루션이 요구된다. 또한 AI를 위한 하드웨어를 선택할 때 하나의 하드웨어가 모든 워크로드에 통용될 수 없으며, 효과적인 구현을 위해 컴퓨팅 요소의 적절한 조합과, 컴퓨팅 요소들의 적절한 균형이 필요하다고 설명했다. 그리고 Arm은 지금까지의 투자를 통해 모든 Arm 프로세서와 IP에서 머신러닝을 구현할 수 있게 되었으며, 파트너들이 다양한 IP를 선택하고 활용해 머신러닝을 비롯한 전문적이고 최적화된 워크로드를 실행할 수 있게 지원한다고 밝혔다. 또한 CPU, GPU, NPU 등 모든 Arm 프로세서를 아우르는 Arm 플랫폼에 유연성, 효율성, 보안을 구축하고 있다고 강조했다.

Arm은 AI의 보편화를 실현하고 있으며, 애플리케이션들이 요구하는 것이 작은 워크로드에 활용되지만 최대의 유연성을 갖췄으며, 미래에도 사용할 수 있어야 하는 머신러닝인 경우, Arm의 CPU 익스텐션을 활용할 수 있다고 소개했다. 또한 애플리케이션들이 요구하는 것이 광범위한 데이터 종류 전반에 대한 더 나은 성능과 우수한 프로그래밍 가능성 간의 균형인 경우에는 머신러닝 역량이 강화된 GPU를 제공하며, 워크로드가 요구하는 머신러닝 양이 비교적 적은 경우에는 확장 가능한 마이크로 NPU를 제시하며, 초소형 디바이스에 대한 뛰어난 유연성, 전력 효율성 및 최적화가 장점이라고 밝혔다. 또한 강도 높은 워크로드를 위한 전용 NPU도 제공하고 있다고 덧붙였다.

파트너들의 소프트웨어 투자 보호를 위한 표준화 측면에서는, Arm의 NPU 제품이 성숙 단계에 접어들고, 범용 Arm 플랫폼을 중심으로 생태계가 형성됨에 따라 Arm의 NPU가 새로운 산업 표준으로 자리잡고 있다고 소개했다. 그리고 Arm의 NPU는 광범위한 성능 기준과 다양한 머신러닝 워크로드를 충족할 수 있도록 확장성과 설정성을 중심으로 설계되었으며, 미래의 머신러닝을 지원하기 위해 Arm 포트폴리오에 추가되고 있는 기술에 대해 파트너사들과 협력하고 있다고 밝혔다. 한편, AI는 이제 생활에 더욱 밀접하게 활용되고 있으며, 이를 위한 디바이스 수준에서 저렴한 비용으로 AI 기술을 구현하는 것이 중요해지고 있고, 지연시간, 신뢰성, 보안 등에도 이점을 제공한다고 설명했다.

▲ 새로운 아키텍처의 시대에도 성능 향상의 가치는 지켜 나갈 것이라 강조했다 (자료제공: Arm)

컴퓨팅 워크로드는 점점 복잡해지고 있고, 무어의 법칙은 느려지고 있지만, 공정이 발전하면서 전력, 면적 및 주파수는 계속해서 개선되고 있다. 하지만 공정 비용은 매우 높아졌고, 5nm 마스크 세트는 2천만 달러가 넘었으며, 칩이 팹을 거치는 데에도 5개월이나 걸린다는 현실적 문제가 있다. 이러한 상황에서, 새로운 칩은 기존 컴퓨팅 워크로드 뿐 아니라 미래의 워크로드에 대해서도 뛰어난 투자수익률(ROI)를 제시할 수 있어야 한다. 이와 함께, 테이프 아웃에 실패하면 비용 뿐 아니라 시장 기회 측면에서도 높은 손실이 발생한다는 점을 고려하면, 검증된 고품질 IP을 사용하는 것이 중요해진다고 강조했다.

Arm은 Armv9을 통해 시장에서 필요로 하는 성능과 품질을 모두 충족하는 기술을 제공할 계획이라고 밝혔다. 그리고 최근 Arm은 토탈 컴퓨트 전략을 통해 기존 컴퓨팅과 미래의 컴퓨팅을 모두 개선해 왔으며, 개별 IP를 발전시키면서 시스템 전반의 일관적 보안, 게이밍 성능을 개선하는 CPU 및 GPU 전반의 성능 최적화 등, Arm이 제공하는 IP 솔루션들을 아우르는 기술을 개발함으로써 이를 달성했다고 소개했다. 또한 이러한 최적화 중 일부는 올해 Cortex-X1 출시를 통해 이루어졌으며, 향후 Arm은 토탈 컴퓨트 기반의 기술 파이프라인을 계속해 늘려 갈 계획이라 덧붙였다.

지난 5~6년간 Arm CPU 로드맵에서는, CPU 성능이 크게 향상되어 업게 평균을 앞섰다. 예를 들면 모바일 시장에서 2016년의 Cortex-A73 대비, 현재의 Cortex-X1의 성능은 2.5배 향상되었다. 또한 지난 5년간 CPU 기술은 보안, 효율성, 확장성 또한 높여 왔지만, 여전히 성능은 중요한 지표이고, Armv9 세대 전환에도 성능 개선은 느려지지 않을 것이라 강조했다. 그리고 Arm은 다음 두 세대의 모바일과 인프라 전용 CPU에서 30% 이상의 성능 향상을 기대하고 있으며, 파트너사가 중요하게 생각하는 워크로드에 대해서는 그 이상의 성능 향상을 제공할 것이라 제시했다. 이와 함께, 시스템 디자인에서의 동작 속도, 대역폭, 캐시, 지연 시간 등을 지속적으로 개선해 성능을 극대화할 것이라 덧붙였다.

컴퓨팅에서의 ‘가속기’ 활용은 이제 충분한 입지를 확보하고 있으며, 비디오 프로세서나 머신러닝 프로세서는 가속기 활용의 좋은 사례로 꼽힌다. 하지만 상용 컴퓨팅에서는 프로그래밍 가능성, 클라우드 환경에서 디버깅 및 성능 분석에 쉽게 사용될 수 있어야 하는 점, 보안, 다양한 디바이스에서의 실행 가능 여부, 품질 등이 요구된다. 그리고 소수의 특정 워크로드에 적용되는 전문 가속기에 이러한 기능을 추가하면, 액셀레이터의 크기가 커지면서 CPU와 비슷한 형태가 될 것이라 지적했다. 이에, Arm은 CPU 아키텍처의 지속적 확장으로 CPU가 훨씬 더 많은 워크로드를 가속화할 수 있도록, 그리고 프로그래밍 가능하며, 안전하고, 널리 사용되며, 검증된 방식으로 실행할 수 있도록 해야 할 것이라 강조했다.


Copyright ⓒ Acrofan All Right Reserved.



[명칭] 아크로팬   [제호] 아크로팬(ACROFAN)    [발행인] 유재용    [편집인] 유재용    [청소년보호책임자] 권용만
Copyright © ACROFAN All Right Reserved